сетей intranet, но их перенос из Internet заставит производителей пересмотреть свои продукты.
"Одно дело индексирование World Wide Web и совсем другое - формирование индексов для сетей intranet", - говорит Джим Бэйр из Gartner Group.
По его мнению, главным различием между ними является критерий качества поисковой системы. "Задумайтесь над тем, как вы оцениваете механизм поиска Web", - предлагает Бэйр. По последним оценкам, в Web размещено более 50 миллионов документов. При таких масштабах критерием для оптимизации поисковых систем становится их размер и скорость.
"Эти поисковые механизмы должны перелопатить огромное количество документов, обслужить массу пользователей и обеспечить высокую скорость, - сказал Бэйр. - Именно в этом и заключается их ценность".
Бэйр утверждает, что для сетей intranet действует иной критерий: лучшей является та поисковая система, которая находит наиболее точный ("релевантный") ответ на запрос. Это, в свою очередь, зависит от того, каким образом поисковая система организует нужную ей информацию.
Типичные машины поиска запускают на просторы World Wide Web своих "ползунов" (crawlers), которые прочесывают Сеть и формируют индекс имеющихся в наличии документов. При этом специально отмечаются обнаруженные изменения в ранее найденных документах, индекс, который хранится на дисках машины поиска, постоянно обновляется. Тщательность, с которой "ползуны" исследуют документ, равно как и информация, заносимая в каталог машины поиска, в случае с intranet должны быть иными. Чем дотошнее ползуны и чем лучше и полнее перекрестные ссылки в индексе, тем более релевантными будут результаты поиска.
Для того чтобы повысить релевантность поиска, компания Quarterdeck планирует внести в свою поисковую систему WebCompass ряд усовершенствований, в частности интегрировать в нее механизм фильтрации, а также разработать такого интеллектуального агента, который изготавливал бы четкий снимок каждого обнаруженного документа.
Универсальный механизм полнотекстового поиска Topic Search компании Verity включен в комплекты поставки Catalog Server и Exchange компаниями Netscape Communications и Microsoft, соответственно.
По словам Джона Аделиса, менеджера из компании Verity, контекстность и релевантность поиска обеспечивается "уровнями абстракции", которые, в свою очередь, достигаются при помощи соответствующей модели индексации. "На качестве поиска также сказывается поддержка понятия близости, - считает Аделис. - Ведь вам необходимо определить смысл слова в определенном контексте".
К сентябрю Verity планирует интегрировать свою поисковую машину с некоторыми компонентами Microsoft BackOffice, в частности с SQL Server. В дальнейшем компания хотела бы представить технологию полнотекстового поиска в виде автономного продукта для потребительского рынка.
"Производители машин поиска узрели, что их рынок не ограничивается Internet, и вплотную занялись внутрикорпоративными сетями, - заверяет Кевин Браун, менеджер компании Inktomi, которая известна своей информационно-поисковой системой HotBot. - Машина поиска - подходящее средство для управления информацией в сетях intranet".