Компания Cognitive Technologies представила технологию сканирования с потоковым вводом текстов, именуемую Cognitive ScanPack. Обеспечивающая производительность обработки от 10 до 100 тыс. документов в день, она позволяет получать их приемлемого качества, а также очищает от различных помех и искажений, обычно имеющихся в печатных материалах. К тому же Cognitive ScanPack помогает комплексно решать вопросы, связанные со всеми процессами оцифровки бумажных носителей, -- от ввода и сканирования до сжатия и упаковки в файлы.
Основное отличие данной технологии от существующего потокового ввода заключается в том, что она дает возможность эффективно сжать изображение документа путем реализации алгоритма его «понимания» и автоматического выбора подходящего режима обработки текста. Так, после удаления помех и искажений он автоматически разделяется на слои, каждый из которых обрабатывается по своему алгоритму. Кроме того, предусмотрено распознавание текстовых слоев с помощью встроенного ядра OCR-системы CuneiForm.
После обработки и сжатия все слои, включая и тот, что с распознанным текстом, собираются в одно- или многостраничный файл в формате PDF/A, стандартном для долговременного хранения документов ISO 19005-1:2005.
По мнению разработчиков, Cognitive ScanPack позволяет получить объем оцифрованного материала в 4--10 раз меньший, чем лучшая из применяемых сейчас технологий.
Г.И. Рузайкин, Мир ПК