RCO Address Parser 3.0 (RCO AP3) предназначен для разбора и нормализации российских и иностранных почтовых адресов.
Для адресов РФ реализованы сопоставление с классификатором ФИАС, представление строки адреса в унифицированном виде, выдача списка подсказок-вариантов для продолжения адреса. Поддерживаются также адреса мест рождения, включая адреса СССР.
Входными данными является текстовая строка с адресом или набор полей с адресными элементами, передаваемые по SOAP протоколу. Входные данные разбираются, и структурированный результат разбора адреса возвращается в виде json, внутри SOAP ответа.
На входные данные для разбора накладываются следующие ограничения:
- адреса РФ и СССР следует задавать на русском языке;
- иностранные адреса могут задаваться кириллическими и латинскими символами.
Для достижения максимального качества разбора адресной строки желательно руководствоваться следующими правилами:
- разделять адресные элементы запятой «,»;
- соблюдать прямой порядок следования элементов.
Архитектура обеспечивает работу RCO AP3 без использования СУБД. Если пользовательское приложение работает с СУБД Oracle, то оно может использовать пакеты, входящий в состав поставки, облегчающие обмен данными c RCO AP3.
RCO AP3 позволяет обрабатывать как структурированные, так и неструктурированные адреса. Существует возможность настройки коррекции строки адреса перед началом обработки. Словари для распознавания адресов включают в себя места рождения СССР, правила разбора строки помещения.
Для определения принадлежности адреса иностранным государствам модуль разбора адресов загружает краткий справочник стран и городов мира.
Корректный запрос к модулю разбора должен содержать хотя бы один из следующих элементов:
- GUID ФИАС адресного элемента (города/улицы) или дома;
- Код ФИАС адресного элемента;
- Не пустая адресная строка;
- Набор типизированных полей адреса.
Скорость обработки адресов в секунду — от 50 (при поиске по строке) до 200 адресов при поиске по типизированным полям.
Устраняемые виды ошибок/опечаток во входных данных:
- опечатки («ул Перера» исправит на «ул Перерва»);
- пропуск ключевых слов (ул., г. и т.п.) в элементах адреса;
- неполнота задания адреса (при условии уникальности заданных элементов, например, адрес «ул Xоламская , 31» преобразует в «индекс 361823, респ Кабардино-Балкарская, р-н Черекский, с Герпегеж, ул Холамская, дом 31»);
- преобразование римских цифр в арабские;
- использование старых названий городов и улиц, например, «Арзамас-16, Репина, д.1, кв. 34» преобразует в «индекс 607188, обл Нижегородская, г Саров, ул Репина, дом 1, кв. 34»;
- автозамена часто встречающихся устойчивых сокращений («проф.» вместо «профессора», «ак.» вместо «академика» и т.д.).
Подробная информация о возможностях RCO AP3 находится в Руководстве разработчика.
Аппаратные требования:
- 64-разрядный процессор (одно ядро);
- 4 Гб оперативной памяти (для обновления баз ФИАС 12 Гб);
- 1,7 Гб HDD (для обновления баз ФИАС 50Гб);
- сетевая карта;
Программные требования:
- 64-битная операционная система Windows 7,8,10; Windows Server 2008 или выше;
- для Web-приложения — IIS 6.0 или выше;
- для использования совместно с Oracle — Oracle Database не ниже 12 версии.
|