Кто ищет, тот всегда найдет
Все посчитано и учтено. Результат работы SelfSeek! |
МАШИНА НЕ УСТАЕТ
Задача собственно поиска в гипертекстовом документе (без ведения базы данных индексов, учета вариаций грамматических форм и прочих функций развитых поисковых механизмов) не ставит серьезных технических проблем с точки зрения программирования, поэтому соответствующие средства можно без труда найти среди условно-бесплатного ПО. Например, помещенная на сервере http://www.illumix.com программа SelfSeek! позволяет осуществлять поиск по ключевым словам на серверах Web. Программа распространяется в двух вариантах — бесплатном и платном. Единственная разница между ними заключается в том, что если программа бесплатная, то внизу ее окна будет периодически отображаться сменяемая баннерная реклама. Если же вы оплатите SelfSeek!, то рекламы не будет.
Для получения результатов в окне SelfSeek! достаточно ввести исходный адрес (URL, начиная с которого программа будет «копать вглубь») и ключевые слова. Никакого языка запросов не поддерживается — пользователь имеет только возможность выбора критериев поиска (наличие в документе любого из заданных слов или же всех слов без исключения, поиск слова целиком или же его вхождений в качестве составной части в другие слова) и задания чувствительности к регистру. Для поискового сервера таких возможностей было бы явно недостаточно, но если вы точно знаете, что ресурс, к которому обращаетесь, посвящен соответствующей тематике, то дополнительные фильтры необязательны.
Среди настраиваемых технических параметров SelfSeek! основными являются определяющие «глубину и ширину» поиска. Это, во-первых, максимальный уровень вложенности ссылок, во-вторых — предельные размеры обрабатываемых файлов и их максимальное число. Ограничения эти вводятся для того, чтобы поиск не «растекался мыслью по древу». Задать пределы зоны поиска можно также, выбрав следующие параметры: поиск только в пределах сервера, в пределах того же домена, только в корневом URL или ниже (по полному пути), а также без каких-либо ограничений.
SelfSeek! кэширует данные, причем обработка загруженных страниц ведется параллельно. Если вы считаете, что используемые программой ресурсы (процессор, дисковое пространство и пропускная способность соединения с Internet) надо ограничить, то размеры кэша и степень параллелизации можно уменьшить.
Результат выводится в виде таблицы ссылок, выбрав любую из которых, соответствующий текст можно просмотреть в отдельном окне. Текст может демонстрироваться в нескольких режимах (режим браузера с графикой или без оной и просто текст) с выделением ключевых слов. Параметры отображения можно варьировать. При желании из окна SelfSeek! можно перейти к просмотру ссылки в стандартном браузере.
Интересной дополнительной функцией SelfSeek! является составление дерева ссылок (карты узла) по результатам «блуждания» программы по нему. Карту (как и результаты поиска) можно сохранить в виде файла, что очень удобно.
ЗАКЛЮЧЕНИЕ
SelfSeek!, конечно, продукт под задачу, так как уровень распространения средств поиска среди ресурсов Web достаточно высок. Однако утилита эта несомненно полезна в определенных ситуациях, например, когда точно известно, что на сервере есть нужная информация, но ее очень сложно найти (или не удается вспомнить, где именно она находится). К тому же срок работы и функциональность бесплатного варианта программы никак не ограничены, что дает возможность держать SelfSeek! про запас.
Александр Авдуевский — редактор журнала LAN. С ним можно связаться по адресу: shura@lanmag.ru.