Cognitive создала CuneiForm 2000
Ольга Ускова, исполнительный директор Cognitive: «Новая система OCR разрабатывалась в течение полутора лет командой специалистов из 7-12 человек» |
Представители компании Cognitive Technologies сообщили 17 июня о создании CuneiForm 2000, системы распознавания текстов нового поколения.
Еще три года назад генеральный директор Cognitive Владимир Арлазаров заявил, что OCR-технологии (Optical Character Recognition, оптическое распознавание символов) достигли такого уровня, при котором точность распознавания «гладких» текстов позволяет наладить промышленное использование OCR-систем.
Основные же усилия разработчиков могут быть направлены на совершенствование пользовательских качеств OCR-программ и их интеграцию с различными приложениями обработки информации. В настоящее время специалисты Cognitive считают, что среди основных направлений развития самих систем OCR особое внимание следует уделять улучшению обработки текстов низкого качества, в частности, архивных документов, распознаванию математических символов и рукописных документов. Начало реализации некоторых из этих концепций положено в CuneiForm 2000.
В данном программном продукте с модульным ядром применяется ряд технологических инноваций. Среди них — использование нескольких алгоритмов распознавания, в том числе на базе нейронных сетей, результаты работы которых оцениваются встроенной экспертной системой, а также адаптивное распознавание, позволяющее совмещать преимущества шрифтовых и шрифтонезависимых методов обработки результатов сканирования. Все нововведения улучшают, по оценкам специалистов Cognitive, качество распознавания почти на 60%. CuneiForm 2000 может обрабатывать таблицы различной структуры, в том числе без линий разграфки, и обеспечивает высокую точность воссоздания формы исходных документов со сложной топологией, содержащих многоколончатые тексты, иллюстрации, графические фрагменты, таблицы и т. п. Работу с CuneiForm 2000 упрощают встроенные мастера, сопровождающие все этапы сканирования и распознавания, а также многофункциональный текстовый редактор. По словам Андрея Чередова, менеджера Cognitive Technologies, высокая производительность современных персональных компьютеров обеспечивает реализацию всех функций CuneiForm 2000 без ухудшения временных характеристик. Наряду с ОЕМ-версией системы распознавания CuneiForm 2000 SE, которая предназначена для комплектации сканеров различных производителей, выпускаются также CuneiForm 2000 Professional и CuneiForm 2000 Master. В последнем продукте поддерживаются пакетные режимы сканирования и распознавания, а также имеется встроенный электронный архив «Евфрат».