Пятая часть всех страниц никак не связана с «сильно связанным ядром» Сети

Исследование, проведенное компаниями AltaVista, Compaq и IBM, показало, что в World Wide Web немало страниц, на которые не так-то просто попасть.

Web сегодня справедливо сравнить, скажем, со звездой, сайты на лучах которой тем менее доступны, чем дальше от центра звезды они расположены. Такой точки зрения придерживаются исследователи, ставящие своей целью построить на основе анализа методов индексирования улучшенные поисковые механизмы.

Чтобы проанализировать топологию Сети, исследователи воспользовались поисковым механизмом AltaVista и сервером Compaq AlphaServer, с помощью которых им удалось обработать более 200 млн. страниц и 1,5 млрд. гиперссылок на них. «В общем случае поисковые механизмы последовательно просматривают все сайты и формируют индексы, ускоряющие процедуру поиска», — пояснил представитель компании AltaVista Джим Шисслер.

В IBM проанализировали результаты и обнаружили, что почти треть Web-сайтов образуют «сильно связанное ядро» — своеобразный центр гипотетической звезды. Имеющиеся гиперссылки позволяют легко перемещаться между страницами этих сайтов. Так сказать, лицевая поверхность звезды, где находится почти четверть всех Web-страниц, состоит из сайтов, от которых можно добраться до ядра, однако переход в обратном направлении невозможен. Зато от ядра можно добраться до другой группы страниц, расположенных на «тыльной» стороне звезды, но вернуться по ссылкам также нельзя. Наконец, пятая часть всех страниц вообще никак не связана с ядром.

«Исследование показало: чтобы получить наиболее полные индексы, при обходе нужно иметь как можно больше стартовых точек», — отметил Шисслер.

Представители компании IProspect.com заметили, что проведенное исследование еще раз показало важность роли выпускаемого ими продукта — специального средства настройки на механизмы поиска, помогающего сайтам оказаться в числе первых 10 или, скажем, 30 ссылок, которые выдаются по запросам поисковым механизмом.

«Все уже привыкли к тому, что достаточно разбросать по сети целую гроздь баннеров, и число посетителей заметно возрастет, — отметила научный директор IProspect.com Аманда Уотлингтон. — ?Теория звезды? показывает, что владельцам Web-сайтов и серверов электронной коммерции необходимо убедиться в наличии внутри ядра, расположенного в наиболее оживленной области Web, множества исходящих и входящих ссылок на их собственный сайт».

Конечно, ни Шисслер, ни Уотлингтон не рассчитывают на то, что средний пользователь займется изучением результатов проведенных исследований и сделает из них надлежащие выводы или же попытается предпринять какие-то иные меры. По мнению Шисслера, большие индексы, которые разработчики поисковых механизмов могли бы создавать на основании предложенной теории, не окажут практически никакого влияния на качество результатов. В гораздо большей степени это будет зависеть от фильтрации и использования других механизмов выборки.

В то же время Уотлингтон советует уделять больше внимания закладкам, поскольку страницы могут находиться за пределами ядра и в дальнейшем без закладок их очень трудно будет найти.