Важнейший аспект информатизации научной деятельности — увеличение количества ресурсов, аккумулирующих и распространяющих научные знания, генерируемые научными сообществами на своих мероприятиях. Сегодня распространение такой информации носит фрагментарный характер и часто выполняется вручную, что влияет на оперативность и качество. Необходимо сформировать комплексное информационное пространство, которое решает задачу оперативного распространения результатов научных исследований через открытые информационные ресурсы.
Идентификация авторов публикаций важна для определения их научного рейтинга, однако при обработке имен русскоязычных авторов в англоязычных публикациях нередки ошибки, приводящие к некорректным вычислениям, например, индекса Хирша. Система на основе комбинированного сравнения атрибутов и текстовых данных позволяет точно идентифицировать русскоязычных авторов.
Российские специалисты, за очень редким исключением, практически не публикуются в более-менее известных западных научно-технических журналах, редко выступают на международных конференциях, а если же все-таки встретишь "русскоязычную" фамилию, то с очень большой вероятностью окажется, что автор давно работает за рубежом. Возможно, компьютерная наука в России умерла, либо у потенциальных авторов нет желания и/или возможности писать и публиковаться, либо отсутствует четкое понимание технологии написания и процесса публикации научно-технической работы.