Компания IBM провела в Москве презентацию продукта Content Analytics. Эта система для поиска и анализа неструктурированной информации выпущена на мировой рынок в ноябре прошлого года, на российский – весной текущего. Внедрений системы в России пока нет, но интерес значительный, тем более после громкого успеха «интеллектуального» суперкомпьютера Watson, в основе работы которого лежит ПО Content Analytics. В IBM отмечают важность создания эффективных механизмов анализа неструктурированных данных, объемы которых во всей совокупности накапливаемой цифровой информации значительно превышают объемы структурированных. Сущность решения этой задачи – построение моста между естественным языком и языком компьютера, трансформация сложных высказываний в четкие понятия и сущности, которые способна понять и проанализировать машина.
Решение Content Analytics предлагает возможность поиска и анализа неструктурированной текстовой информации простыми способами, доступными широкому кругу пользователей. В основе системы лежит механизм текстовой аналитики, вычленяющий в текстах заданные понятия и определенные типы информации для последующего анализа. Content Analytics может применяться для выявления тенденций, типовых моделей поведения, статистических взаимосвязей, обеспечивая быструю обработку очень больших объемов документов, записей в блогах и форумах, преобразованных в текст аудиозаписей и т. д. В российской лаборатории систем и технологий IBM с помощью Content Analytics разрабатывается решение для анализа информации по университетам США с целью оптимизации распределения научных грантов.