Харви Спенсер, глава аналитического агентства Harvey Spencer Associates, посвятил свой доклад на Docflow 2008 теме ввода данных, сканирования и обработки документов. Свой доклад «Будущее ввода неструктурированных документов» он начал с обзора того, как сегодня решаются проблемы ввода информации в США, где эти процессы недешевы. Там, например, подготовка документов к сканированию стоит 20 долл. за 1000 страниц, ввод одного документа с клавиатуры — от 20 до 40 центов, а всего в стране на ввод данных в ИТ-системы тратится ежегодно порядка 20 млрд долл. В основном предпринимаются попытки сократить эти издержки за счет обработки структурированных документов с помощью OCR (optical character recognizing — «оптическое распознавание символов»). Кроме того, можно отправить бумажные документы для ввода в страны с низкой стоимостью человеческого труда, но это, к сожалению, не панацея, так как стоимость труда, например, в Индии ежегодно увеличивается на 30%.
Также в последнее время все большее распространение получают системы распознавания речи, используемые, например, при расшифровке медицинских записей диагнозов, соображений о ходе болезни пациента и рекомендаций по лечению, которые врач наговаривает на диктофон. В настоящее время в США затрачивается примерно 50 млн долл. в год на расшифровку подобных записей и последующий ввод информации в компьютер посредством клавиатуры. А так как точность распознавания речи в настоящее время составляет 50-60%, используя системы распознавания речи, можно достичь значительной экономии.
Несмотря на то что, по словам Спенсера, начиная с 2002 года темпы роста объемов производства офисной бумаги стали значительно замедляться, нам никогда не удастся полностью избавиться от бумажных документов. Потоковый ввод документов осуществляется практически в большинстве подразделений любого предприятия, поэтому необходимо сделать этот процесс эффективным и результативным.
Человек, по мнению Спенсера, не проводит различия между структурированной и неструктурированной информацией. Для принятия решения о том, что делать с входящей информацией, мы полагаемся на свои знания и опыт. Но большая часть информации, требующей ввода в ИТ-системы, не структурирована, ее понимают люди, но не компьютеры. Предварительная сортировка и выяснение того, что с ней делать, дорого обходятся и отнимают много времени. Решить эту задачу по силам системам IDR (intellectual document recognizing — «интеллектуальное распознавание документов»), которые позволяют извлечь нужную информацию из неструктурированных документов. При этом надо понимать, что для эффективной работы подобных систем необходимо иметь представление о бизнес-процессах, в результате которых создан документ, и системах, в которых документ используется.
В настоящее время системы IDR способны классифицировать документы на основе анализа содержащихся в них простых графических объектов, что позволяет сократить затраты и организовать маршрутизацию документов. Если к изображению добавляется текст (распознаваемый с помощью OCR), появляется возможность дополнительной классификации информации, ее интеллектуального извлечения и ограничения доступа к документам с закрытой для части пользователей информацией. Кроме того, системы IDR позволяют преобразовывать отсканированную входящую почту в изображения с возможностью ее поиска и дальнейшей маршрутизации. Эти системы незаменимы при извлечении данных из счетов, накладных, заказов и авторизации платежей, а также при преобразовании голосовых заметок в текст.
По мнению Спенсера, повышение интеллектуальности IDR вкупе с возможностью работы в режиме реального времени приведет к тому, что в будущем технологии ввода неструктурированных документов позволят за считанные секунды обрабатывать бумажные документы, распознавать не только речь, но и язык, не только изображение, но и его содержание.