В последнее время концентрация внимания разработчиков переносится с создания средств высокого качества сканирования информации на другие виды ее обработки. Так, к сканированию информации относят возможности ее сжатия с регулированием качества сканирования и дальнейшей отправки в виде сообщений по электронной почте.
Компания Cognitive Technologies представила на прошедшей пресс-конференции новый программный продукт Compressimo, поддерживающий выполнение сканирования, сжатия и отправку документа по электронной почте.
Программа Compressimo предназначена для обработки широкого класса бизнес-документов (накладных, таблиц, факсов, договоров, деловой переписки и т.п.). Среди ее функций можно найти способность распознавания в документе основного контента, что исключает потери полезных данных при сканировании некоторых важных элементов изображения (печати, рецензии, подписи и др.).
Compressimo рассчитана на массового потребителя. Ее использование позволяет поддерживать автоматизацию процессов сканирования и другую обработку материалов, получая при этом компактные и одновременно качественные оцифрованные документы, пригодные как для полнотекстового поиска по их содержимому, так и для долговременного хранения. Пользователь программы может получать более качественный образ содержательных разделов документа, чем у его исходного бумажного собрата.
Вот основные этапы обработки документа с помощью программы Compressimo: сканирование в виде образов документов основных форматов JPG, TIFF, PNG, BMP; удаление шума в электронном образе документа; распознавание частей документа; сжатие документа и сохранение в формате PDF с уменьшением до 30 раз потребного объема дискового пространства; формирование сообщения и отправка его по электронной почте.
Создание нового продукта стало возможным благодаря разработке новых алгоритмов анализа и обработки образов на основе выделения на изображении исходного документа структурных элементов, обычно называемых слоями, -- текста, иллюстраций, графики, декоративных частей. Для каждого из слоев можно применять свои алгоритмы сжатия информации и даже проводить ее обработку, сохраняя компактные объемы файлов, содержащих качественные образы слоев. Таким образом, Compressimo реализует аналог экспертной системы, дифференцирующей тип и структуру документа, при этом автоматически подбирая подходящий режим обработки. После удаления искажений и помех в образе, он автоматически разделяется на слои (текст, иллюстрации, печати, подписи и др.). Затем автоматически принимается решение по выбору для каждого слоя наилучшего алгоритма сжатия образа.
В Compressimo предусмотрена возможность распознавания текста на 23 языках при помощи встроенного и доработанного ядра OCR-системы CuneiForm (OpenOCR).
После обработки и сжатия все слои (включая распознанный текст) собираются в одностраничный или многостраничный файл в формате PDF/A (стандарт для долговременного хранения документов ISO 19005-1:2005).
Стоимость программы на российском рынке составляет 799 руб. за одно рабочее место. Программа доступна для скачивания на www.compressimo.ru