Компания Cognitive Technologies представила новое решение класса IDR (intelligent document recognition — интеллектуальное распознавание документа) на основе технологии распознавания многокомпонентных частично структурированных документов CogniDocs. Это решение, по мнению генерального директора Cognitive Technologies, члена-корреспондента РАН В.Л. Арлазарова, стало естественным шагом на пути развития технологий распознавания образов.
Первый этап такого развития был связан с оптическим распознаванием печатных и раздельно написанных символов (OCR- и ICR-системы), второй — с созданием программ обработки форм (forms processing systems), обеспечивающих ввод данных из документов, заполненных печатными или рукописными символами, на основе геометрических шаблонов, а также решений из смежных областей, связанных с анализом структурированной информации. Третий соотносится с системами обработки форм, в которых реквизиты не имели четко определенного геометрического положения или табличного упорядочения. В этом случае для идентификации реквизитов, «плавающих» по документу, необходимо было использовать в системах распознавания более широкий набор методов, т.е. определять границы искомого фрагмента графического образа не только на основе его геометрического положения на странице, но и с учетом распознанного текста, его соответствия предопределенному синтаксису реквизита, формату и стилю заполнения в зависимости от правил бизнес-логики и контекста, например наличия поблизости ключевых слов и т.п. Теперь наступил четвертый этап развития систем интеллектуального распознавания документов — IDR.
Основная особенность таких систем заключается в том, что они позволяют распознавать более широкий спектр документов, чем при обработке форм, поскольку к ним можно уже отнести частично структурированные и даже неструктурированные документы. Таким образом, как утверждает В.Л. Арлазаров, эволюция систем ввода и обработки документов совершила заметное движение «от распознавания символов к пониманию документов».
На прошедшей пресс-конференции было представлено новое ядро распознавания Cognitive Forms 2007 для разработанной в компании технологии CogniDocs. Ее принципиальным новшеством стала возможность обработки документов, состоящих из частей (секций), которые стыкуются по определенным правилам, заданным в описании документа. Формальное представление (модель) документов такого класса для использования в условиях компании включает язык описания документа и алгоритмы анализа, которые обеспечивают идентификацию секций (декомпозицию документа) и контролируют выполнение связей между ними.
Важная особенность данной технологии — возможность работать с документами, содержимое которых переходит со страницы на страницу, а также с документами с переменным количеством реквизитов, например строк таблицы.
Технология CogniDocs в составе системы ввода счетов-фактур была запущена в промышленную эксплуатацию на Магнитогорском металлургическом предприятии еще в 2005 г. Ограниченный по функциональности вариант технологии включен в состав встраиваемого ядра распознавания Scanify API: Bank and Office, поддерживающего ввод счетов-фактур, платежных поручений и других деловых документов.