Учеными Европейского научно-исследовательского центра корпорации Xerox разработано программное обеспечение для категоризации электронных документов, которое в автоматическом режиме осуществляет тематическую классификацию материалов с последующей их маршрутизацией (переадресацией) на нужные адреса электронной почты или в онлайновые документарные системы.
Новая разработка Xerox для оптимизации хранения и обработки электронных архивов строится на иерархической модели классификации, позволяющей устанавливать логическую связь между двумя тематическими категориями. Системе достаточно лишь несколько примеров для "усвоения" алгоритма классификации документов по предложенным категориям, она способна к самообучению и усвоению новых категорий без вмешательства оператора. Механизм категоризации самостоятельно идентифицирует новые или прогнозируемые тематические разделы и в рабочем порядке предлагает выявленные новые категории на усмотрение пользователя. Система способна обрабатывать документы на 20 иностранных языках и осуществлять интеллектуальную переадресацию документов нужному абоненту с помощью заданной конфигурации. Программа создана на платформе Java и совместима с различными ОС, включая Unix, Linux и Windows. Xerox планирует лицензирование данной технологии для поставщиков программного обеспечения или корпораций, желающих интегрировать ее в существующие системы документооборота для оптимизации клиентского сервиса, архивирования информации и управления данными.