Кто ищет, тот всегда найдет

Все посчитано и учтено. Результат работы SelfSeek!
Одной из главных привлекательных черт Internet, как, впрочем, и любого средства получения информации в электронном виде, является возможность контекстного поиска. Не случайно созданные на голом энтузиазме службы поиска в Internet превратились в весьма прибыльные предприятия. Сегодня мы автоматически предполагаем, что любой более-менее крупный узел Web оснащен средствами поиска, так что, даже абсолютно ничего не зная заранее о его структуре, мы можем без особых проблем найти нужную нам информацию. Однако далеко не всегда наши предположения оправдываются, особенно при посещении серверов, владельцы которых не посчитали целесообразным потратиться на соответствующий программный продукт. При этом обойтись без поиска по ключевому слову может оказаться невозможно. В результате как-то делать это придется самому. В принципе, вы можете, конечно, воспользоваться глобальной поисковой службой (функция поиска на конкретном сервере), но, во-первых, именно этот сервер может быть не проиндексирован, а во-вторых, может статься, что индексирование проводилось слишком давно, и искомая информация в него не попала. Самым надежным будет поиск «в лоб» по всем ссылкам сервера.

МАШИНА НЕ УСТАЕТ

Задача собственно поиска в гипертекстовом документе (без ведения базы данных индексов, учета вариаций грамматических форм и прочих функций развитых поисковых механизмов) не ставит серьезных технических проблем с точки зрения программирования, поэтому соответствующие средства можно без труда найти среди условно-бесплатного ПО. Например, помещенная на сервере http://www.illumix.com программа SelfSeek! позволяет осуществлять поиск по ключевым словам на серверах Web. Программа распространяется в двух вариантах — бесплатном и платном. Единственная разница между ними заключается в том, что если программа бесплатная, то внизу ее окна будет периодически отображаться сменяемая баннерная реклама. Если же вы оплатите SelfSeek!, то рекламы не будет.

Для получения результатов в окне SelfSeek! достаточно ввести исходный адрес (URL, начиная с которого программа будет «копать вглубь») и ключевые слова. Никакого языка запросов не поддерживается — пользователь имеет только возможность выбора критериев поиска (наличие в документе любого из заданных слов или же всех слов без исключения, поиск слова целиком или же его вхождений в качестве составной части в другие слова) и задания чувствительности к регистру. Для поискового сервера таких возможностей было бы явно недостаточно, но если вы точно знаете, что ресурс, к которому обращаетесь, посвящен соответствующей тематике, то дополнительные фильтры необязательны.

Среди настраиваемых технических параметров SelfSeek! основными являются определяющие «глубину и ширину» поиска. Это, во-первых, максимальный уровень вложенности ссылок, во-вторых — предельные размеры обрабатываемых файлов и их максимальное число. Ограничения эти вводятся для того, чтобы поиск не «растекался мыслью по древу». Задать пределы зоны поиска можно также, выбрав следующие параметры: поиск только в пределах сервера, в пределах того же домена, только в корневом URL или ниже (по полному пути), а также без каких-либо ограничений.

SelfSeek! кэширует данные, причем обработка загруженных страниц ведется параллельно. Если вы считаете, что используемые программой ресурсы (процессор, дисковое пространство и пропускная способность соединения с Internet) надо ограничить, то размеры кэша и степень параллелизации можно уменьшить.

Результат выводится в виде таблицы ссылок, выбрав любую из которых, соответствующий текст можно просмотреть в отдельном окне. Текст может демонстрироваться в нескольких режимах (режим браузера с графикой или без оной и просто текст) с выделением ключевых слов. Параметры отображения можно варьировать. При желании из окна SelfSeek! можно перейти к просмотру ссылки в стандартном браузере.

Интересной дополнительной функцией SelfSeek! является составление дерева ссылок (карты узла) по результатам «блуждания» программы по нему. Карту (как и результаты поиска) можно сохранить в виде файла, что очень удобно.

ЗАКЛЮЧЕНИЕ

SelfSeek!, конечно, продукт под задачу, так как уровень распространения средств поиска среди ресурсов Web достаточно высок. Однако утилита эта несомненно полезна в определенных ситуациях, например, когда точно известно, что на сервере есть нужная информация, но ее очень сложно найти (или не удается вспомнить, где именно она находится). К тому же срок работы и функциональность бесплатного варианта программы никак не ограничены, что дает возможность держать SelfSeek! про запас.

Александр Авдуевский — редактор журнала LAN. С ним можно связаться по адресу: shura@lanmag.ru.