Потому-то сообщения о развитии технологий и программных продуктов для поиска информации так важны на ИТ-рынке.

Компания DVYGUN (www.dvygun.com) объявила о выпуске новой версии бесплатной персональной поисковой системы DVYGUN Smart Search 2.5.2.5 Beta, позволяющей проводить полнотекстовый поиск в массивах документов, сообщений электронной почты, мультимедийных файлов, на веб-страницах посещения и среди контактных данных, хранимых в ПК пользователя.

При этом программа DVYGUN Smart Search выполняет поиск информации (файлов) следующих типов:

  • сообщения электронной почты и вложения Outlook/Outlook Express;
  • файлы форматов PDF, MS Word, MS Excel, RTF, HTML и текстовые;
  • данные архивов ZIP, RAR, GZIP, CAB и др.;
  • изображения, музыкальные и видеофайлы;
  • посещенные веб-страницы, избранные интернет-адреса браузера Internet Explorer;
  • контакты адресной книги в Windows и Outlook.

Поиск данных можно вести как по всем типам, так и по избранным. Дальнейшее сужение области поиска выполняется при указании поисковых параметров. Например, для файлов ими могут быть «Имя файла», «Папка», «Размер» и «Дата изменения». Ранжирование найденных документов осуществляется по уровню соответствия поисковому запросу. Для многословных запросов учитывается контекстная близость слов, поэтому каждый найденный документ отображается в результатах поиска вместе с контекстной цитатой, что в большинстве случаев ускоряет понимание его содержания.

Для организации мгновенного поиска DVYGUN Smart Search производит первичную обработку данных с целью построения специальной базы (индекса), по которой и производится этот поиск. Вот несколько особенностей реализации этой функции в данной программе:

  • поиск и индексация могут идти одновременно, для начала поиска не нужно дожидаться завершения индексации;
  • обновление индекса происходит в "фоновом режиме", программа постоянно отслеживает действия пользователя, так что измененные и новые данные сразу же включаются в индекс, т.е. осуществляется актуализация результатов поиска;
  • в случае недостаточности системных ресурсов процесс индексирования останавливается во избежание замедления работы компьютера пользователя.

Как отмечают разработчики DVYGUN Smart Search, проверка их программы на наличие и качество признаков поиска (обновление индекса на лету, подсчет релевантности результатов, настройка, скорость индексирования и поддержка морфологии русского языка) ставит ее впереди таких известных поисковиков, как Google, Yahoo, Microsoft, Copernic и Blinkx. Ни один конкурент не удовлетворяет в полном объеме требования, предъявляемые к наличию и качеству этих признаков. Программа же DVYGUN Smart Search проводит индексирование со скоростью 5 Гбайт/ч и морфологическую обработку слов русского и украинского языков. К сожалению, ни один из известных отечественных и украинских поисковиков не способен индексировать так быстро. Вместе с тем к недостаткам данной версии DVYGUN Smart Search разработчики относят малое количество обрабатываемых ею форматов файлов: поправить дело можно либо с помощью покупки соответствующих фильтров, либо путем собственной их разработки.

Программу можно бесплатно загрузить с сервера http://ru.dvigun.com/download/ dvygun_smart_search_ru.exe.

О развитии имеющихся поисковиков свидетельствует сообщение компании «Яндекс» (http://company.yandex.ru/news/2005/0628) о том, что новая версия программы «Яндекс.Сервер», работающая под управлением всех популярных версий ОС Windows и Unix, стала функционировать быстрее. Это расширило группу продуктов для полнотекстового поиска информации и повысило скорость обработки документов в полтора раза. Увеличено число типов обрабатываемых документов: теперь в дополнение к форматам .txt, .doc, .rtf, .html, .xml и .pdf поддерживаются .xls, .ppt и .swf. Также выросла скорость индексирования файлов с 25 до 40 Мбайт/с.

Для пользователей, которым важно управлять дизайном результатов поиска, предлагается пакет поставки новой версии данной программы по цене почти в 2 раза более низкой, чем была ранее, — всего за 170 долл. Кроме того, появились редакции этой программы для владельцев сайтов Standard+ и Professional+ с расширенными возможностями.

Подробнее о продуктах и лицензионной политике относительно программ можно узнать на сервере http://company.yandex.ru/technology.

Как сообщили в российском представительстве компании CONVERA (www.convera.su), в будущем году ее усилия в России будут направлены на продвижение новой поисковой системы Excalibur и на разработку локализованной версии программы RetriewalWare 8.2. В ней будут реализованы такие стандартные функции, как извлечение сущностей из текста (в первом релизе к ним отнесены географические названия, имена собственные, времена, валюты, даты, номера — телефонные, кредитных карт и автомобильные, а также связи между ними), адаптеры к программным комплексам Websphere, Sharepoint portal, Documentum, новый Lotus, Windchill и Teamlink.

Осенью текущего года Excalibur появится и в России. Наиболее существенным отличием этого продукта от других подобных глобальных поисковых систем является уточнение объема релевантной информации, предлагаемой в результате поиска. Такая эффективность возможна благодаря встроенным в программу 12 млн. таксономий, с помощью которых ведется обработка информации по запросу. В процессе обработки запроса определяется его таксономическое понятие (предметная область), в результате чего вся информация делится на две группы — релевантная и нерелевантная запросу. При этом результаты запроса могут быть представлены в виде таблиц, графических изображений, текстов и информационных связей, т.е. ответ становится отображением сущности запроса и его связей в совокупности предлагаемых в результате поиска документов.