Путеводитель по Web для сыщика
Для поиска в Web одних лишь программ-браузеров недостаточно. Тут нужна еще голова, а также правильно подобранные инструменты и умение идти по следу - куда бы он ни вел.
Дилан ТвиниPC World Online: внутренние источники
Глава 1. Большой поиск
Это случилось холодным ноябрьским утром. Туман, как тяжкое похмелье, висел над городом. Когда он появился на пороге, я курил и ни о чем особенно не помышлял. Все в нем было какое-то всклокоченное - от дешевого делового костюма до 386-го блокнота. По-моему, дела его обстояли неважно.
- Я не знаю, что делать... Я просмотрел абсолютно все и ничего не нашел! - выпалил он с порога.
- Спокойно, малыш, - умиротворяюще произнес я. - Расскажи мне все по порядку.
- Это началось на прошлой неделе. Меня вызвал босс и попросил разыскать кое-что про "Мегасофт", нашего основного конкурента. Ну, я подключился к линии, загрузил свой даузер...
- Браузер, - поправил я. Но в том, что парень говорил, был свой резон, даже если он об этом и не знал. Пытаться найти что-то про "Мегасофт" с помощью браузера - это примерно то же, что искать воду в пустыне Мохаве посредством лозоходства.
- Ну, пусть браузер. В общем, я всю ночь щелкал кнопкой мыши, лазая по связям, а отыскал лишь горстку дурацких базовых страниц и кучу всякой рекламы.
Бедняга запутался в "Паутине", и запутался основательно. Надо было объяснить ему, как выбраться, причем объяснить быстро. На свое счастье, он попал туда, куда надо. Я поисковик. Я умею находить. Это моя работа.
Глава 2. Не просмотром единым
Неприятную новость я постарался обрушить на него по возможности деликатно.
- Послушай, малыш, - сказал я. - Просмотр Web-страниц, которым ты занимался, - это пустая трата времени. Если хочешь что-нибудь найти, тебе надо не просматривать, а искать.
Глядя на него, я понял, что несчастный простофиля не видит разницы между каталогом и поисковым сервером, а уж о таких материях, как метапоисковые инструменты, автономные браузеры или ассистенты, лучше и не заикаться. Узнать ему предстояло очень многое. И ему повезло, что он пришел учиться ко мне.
- Придвинь кресло, малыш, и я расскажу тебе, как вести поиск в Web по-умному.
Я зажег сигарету, откинулся на спинку кресла и начал...
Каталоги Web и поисковые серверы
Каталоги Web, подобные имеющимся на серверах Yahoo или Magellan, устроены, как систематические каталоги в библиотеках: в них все расклассифицировано по рубрикам: "Спорт", "Развлечения", "Компьютеры"... - в общем, понятно. Найдя в каталоге свою тему, вы получаете перечень ключевых Web-узлов, с которых имеет смысл начать поиск. Может статься, это все, что вам нужно. На большинстве серверов название каждого узла в перечне сопровождается кратким описанием, а ссылка всегда указывает на базовую страницу узла, но не на конкретные страницы внутри него.
Короче, каталог Web - обычно инструмент небессмысленный; он свое дело делает, и притом быстро. Когда вы ищете информацию по какой-то достаточно общей теме, лучше всего начать именно с каталога, особенно если вы уже умеете в нем ориентироваться.
Однако каталоги Web охватывают лишь малую долю страниц, в принципе доступных во "Всемирной паутине". И здесь вступают в игру поисковые серверы наподобие AltaVista, HotBot или Lycos. Вы сообщаете такому серверу, что вас интересует, и он находит все известные ему Web-страницы, соответствующие вашему запросу. Для того чтобы индекс поисковой системы не устаревал, используются специальные программы, именуемые "пауками" (spiders) или "личинками" (bots), которые двигаются по связям от страницы к странице, фиксируя на каждой все ее содержимое или какой-то его фрагмент. В конечном счете таким путем удается пройти значительную часть "Паутины".
Поскольку никакого вмешательства человека при этом не требуется, поисковые серверы способны охватить гораздо больше, чем каталоги. Но вы должны знать, как с этими серверами работать, - если, конечно, не хотите просеивать в поисках нужной информации тысячи страниц, перечисленных сервером в ответ на ваш запрос.
Глава 3. Поисковик всегда щелкает дважды1
- Спасибо за помощь, - сказал парень. - Ну, я потопал. Сколько я вам должен?
"Знать кое-что - штука опасная",- подумал я и прорычал:
- Сиди, малыш. Мы всего лишь слегка приоткрыли дверь. Поисковые серверы и каталоги Web - инструменты мощные, но слепые. Без хорошей стратегии поиска и аккуратно составленных запросов ты можешь потерять кучу времени. Вот как следует поступать.
Выходите на объект
Если вы разыскиваете какую-то информацию общего характера, начинайте с каталога Web. Я пользуюсь каталогом сервера Yahoo потому, что в нем много чего есть и потому, что я знаю, как там устроена классификация, но вы, возможно, предпочтете Magellan или, может быть, каталог A2Z на сервере Lycos.
С другой стороны, если вы разыскиваете какое-то конкретное понятие или словосочетание, например, "Мальтийский сокол"2, или сведения о чем-то таком, для чего непросто найти рубрику в классификации, вроде пуленепробиваемых жилетов, то каталоги мало чем смогут вам помочь. Тут придется обратиться к поисковому серверу, причем, скорее всего, не к одному, а к нескольким, потому что разные серверы дают разные результаты для одного и того же запроса.
Я люблю начинать с сервера AltaVista, поскольку его индекс покрывает очень большую часть Web, а потом пытаюсь использовать InfoSeek Ultra (http://ultra.infoseek.com) - новую версию InfoSeek, поскольку этот сервер выдает результаты немедленно.
Пристреливайтесь
Имея дело с поисковыми серверами, не жалейте времени и относитесь к своей работе всерьез. Чем разумнее вы составите свои запросы, тем лучшие будут результаты. Попытайтесь ввести несколько слов или словосочетание, относящееся к теме вашего поиска, - например, san francisco hotel, если вы ищете, где бы вам переночевать, находясь в городе у залива.
Чем конкретнее вы будете, тем лучше. Не беспокойтесь об избыточности - синонимы помогут сузить поле вашего поиска. Отбросьте незнаменательные слова типа предлогов и артиклей (of, to, and, the и т. п.) - большинство систем поиска их все равно игнорируют.
Скажем, разыскивая сведения о подоплеке "уайтуотерского скандала", не следует запрашивать поиск по строке whitewater - вы увязнете в многочисленных рекламах спортивного сплава по бурным рекам (whitewater rafting). Перечень нужных вам страниц будет выдан по запросу whitewater clinton bill hillary real estate ("уайтуотер клинтон билл хиллари недвижимость").
Прорабатывайте комбинации
Если поисковый сервер не выдал вам ничего или выдал очень мало, то, возможно, ваш запрос был сформулирован слишком узко или не в тех терминах. Запросите еще раз, используя меньше слов, или воспользуйтесь другими, не столь конкретными словами. Скрытое наблюдение ничего не дало? Попробуйте надзор или шпионаж.
Если число найденных страниц измеряется сотнями или тысячами, ваш запрос, вероятно, слишком широк. Не найдя того, что вам нужно на первых двух-трех страницах результатов поиска, остановитесь. Повторите поиск снова, используя слова с более конкретными значениями или ограничив варианты поиска. Вместо простого детектив запросите сэм спейд хамфри богарт3.
Не бойтесь пробовать свой запрос на разных поисковых серверах. Зачастую тот же запрос на другом сервере дает совершенно иные результаты.
Глава 4. Прощай, мой браузер!
- То есть вы хотите сказать, что я снова и снова должен посылать запросы? - парень поморщился. - А какого-нибудь способа получше нет?
Он явно усекал.
- А как же, - сказал я. - Ты вовсе не обязан крутиться сам. Как раз для этого компьютеры и придуманы.
Я налил себе и ввел его в курс дела.
После того как вы выпотрошили каталоги и поисковые серверы, в вашем распоряжении оказывается целый ряд Web-страниц и программных средств, которые помогут вам разнюхать все, что нужно. Они распадаются на три группы: метапоисковые инструменты (metasearch tools), которые одновременно посылают один и тот же запрос на несколько поисковых серверов; ассистенты (search assistants), помогающие эффективнее управлять поиском, и автономные браузеры (offline browsers), которые проверяют Web-страницы и загружают их в случае появления там чего-либо нового.
Метапоисковые инструменты
Надоело мотаться туда-сюда? Вместо того чтобы раз за разом посылать запросы в различные узлы, используйте метапоисковый инструмент - Web-узел или программу, которая посылает ваш запрос сразу на несколько поисковых серверов, а затем собирает наиболее вероятные источники необходимой вам информации на одной странице.
Один из лучших таких консолидаторов поиска в Web - это SavvySearch. В SavvySearch вы вводите свой запрос и задаете опции поиска: например, сколько найденных страниц должен выдавать вам каждый из серверов и в каком виде представлять результаты.
После того как вы ввели запрос, SavvySearch отправляет его на три сервера, имеющих информацию того типа, который вы задали программе в качестве предмета своих разысканий, а потом собирает все результаты на одной странице. Внизу страницы находится панель инструментов, позволяющая отправлять тот же запрос разным наборам поисковых серверов, - быстро и удобно. И что самое приятное, все это бесплатно.
В числе недостатков SavvySearch то, что он выдает для каждого из серверов лишь первые пятьдесят найденных страниц; кроме того, его работа часто замедляется условиями сетевого трафика. Для полного поиска вам может пригодиться программа-ассистент для PC, такая как FastFind (см. ниже).
Альтернативой SavvySearch и подобным узлам является предлагаемая фирмой Bitsafe Computer Services метапоисковая программа Arf (ее можно найти по адресу http://www.execpc.com/~bitsafe/arf). Arf - это недорогая (20 долл.), без излишеств, утилита для автоматического поиска и сведения воедино его результатов. Ее незамысловатый интерфейс позволяет вам ввести запрос, а также установить максимальное число найденных страниц (до 10 тысяч) и те поисковые серверы, на которые будет посылаться запрос (возможные варианты - AltaVista, DejaNews, InfoSeek, Lycos и WebCrawler). После этого вы нажимаете кнопку Start, и Arf выдает вам простой, никак не рассортированный список адресов, а также загружает те страницы, на которые эти адреса указывают. Можно запустить сразу несколько экземпляров Arf и в каждом задать свой запрос.
За чуть большую цену - 70 долл. - поставляемая ассоциацией ForeFront Group программа WebSeeker (http://www.ffg.com) предложит вам много дополнительных возможностей, например алфавитную сортировку результатов поиска. WebSeeker одновременно запрашивает целых двадцать поисковых серверов в Web и Usenet и составляет список найденных страниц, в котором можно производить сортировку и поиск. Работает WebSeeker не так быстро, как хотелось бы, но обладает значительной поисковой мощью и поэтому полезен Internet-сыщику.
Ассистенты
Метапоисковые инструменты могут избавить вас от хлопот, связанных с необходимостью самому наведываться на каждый поисковый сервер, но вы по-прежнему сталкиваетесь с проблемой сортировки слишком большого (или пусть даже недостаточного) количества найденных страниц. Решение этой проблемы предлагают поисковые ассистенты - программы, которые дополняют ваши возможности и помогают вам контролировать ход поиска. Некоторые из этих инструментов ведут для вас слежку за Internet, снова и снова посылая запросы и извещая вас лишь при обнаружении чего-то нового. Строго между нами: таких ассистентов в мире полно, и большинство из них не стоят и ломаного гроша. Но поскольку на изучение каждого из них нужно известное время, то выбирать их следует с должной осмотрительностью. По секрету дам вам наводку на один из самых простых и два из числа самых мощных.
Великолепным поисковым ассистентом является 35-долларовая программа More Like This, поставляемая компанией Knowledge Discovery (http://www.morelikethis.com). Взаимодействие с ней осуществляется с помощью несложной панели инструментов, плавающей поверх окна программы-браузера. С помощью этой панели можно быстро и легко посылать на серверы изощренные запросы: просто нажмите кнопку More Like Query, введите интересующее вас слово и нажмите OK. Программа отправит ваш запрос на выбранный поисковый сервер и откроет страницу с результатами в окне вашего браузера.
Более того, вам не нужно изучать никакого специального синтаксиса запросов - More Like This сама переведет запрос в форму, доступную поисковым серверам. Вы можете также щелкнуть по кнопке More Like Title, чтобы отправить запрос, основанный на названии той страницы Web, которую вы сейчас просматриваете (эта кнопка действует примерно как опция под названием More Like This на не имеющем отношения к рассматриваемой программе-ассистенту поисковом сервере Excite).
Если, например, вы находитесь на странице, которая называется "Разведывательная техника", More Like This способна перенести вас на другие узлы с информацией о товарах, облегчающих сование носа в чужие дела. Вы также можете скопировать текст из любого приложения в буфер обмена и нажатием клавиши More Like Clipboard отправить его как запрос.
Кроме того, в More Like This есть специальный концептуальный поиск, который автоматически пополняет составленные запросы словами, связанными с использованными, чтобы помочь вам "пристреляться" к нужным вам узлам. Например, если вы вводите слово богарт и заказываете концептуальный поиск, More Like This может добавить к вашему запросу такие слова, как хамфри, мальтийский, спейд и т. п.
Программа More Like This - скромный ненавязчивый инструмент, который спокойно лежит в сторонке, пока он вам не понадобится. Если вы нуждаетесь в оружии более крупного калибра, попробуйте Internet FastFind (http://www.symantec/com) компании Symantec (49,95 долл.). Это набор полезных средств для поиска информации в Internet и управления ею. Как метапоисковая система, FastFind собирает все результаты на одной странице, которую вы можете просмотреть на экране Web-браузера, сортируя их при этом по степени релевантности или по узлам Web. Другие утилиты, вызываемые из главного меню FastFind, способны находить и загружать файлы с FTP-узлов, извещать вас, когда в узлах Web происходят изменения, и вести в Web поиск новых версий, установленных в вашей системе драйверов и иных программ.
Предлагаемый компанией Quarterdeck новый поисковый инструмент типа сервера All-in-One под названием WebCompass 2.0 (http://quarterdeck/com) стоит те же 49,95 долл. и относится к тому же классу. Всяческих возможностей в WebCompass больше, чем пронырливых полицейских на улицах нашего города. Бета-версия, которую я испытывал, смотрится очень неплохо. WebCompass 2.0 предоставляет вам папки для организации поиска по темам и работы с интересующими вас Web-страницами. Программа следит за изменениями этих страниц, а подпрограммы-агенты прогоняют в назначенное время ваши запросы и извещают вас, если появляется что-то новенькое.
Автономные браузеры
Найдя интересующие вас страницы, вы, вероятно, захотите следить за их состоянием. Однако только полный лопух будет ежедневно раскрывать каждую из заложенных страниц, выискивая изменения в каждом узле. Вот здесь и вступают в игру автономные браузеры.
Автономные браузеры загружают и сортируют целые Web-узлы (включая ссылки) или отдельные страницы. Вы можете пользоваться ими и как ассистентами, вновь и вновь запуская с их помощью ваши запросы. Просто установите постоянный запрос (ну, скажем, "погода на Мальте") - и все.
Некоторые из таких систем позволят вам знакомиться с новостями и объявлениями; другие функционируют как поисковые инструменты. Как и в случае с ассистентами, некоторые автономные браузеры иногда приносят больше хлопот, чем пользы.
Если в кармане у вас негусто, вам понравится FreeLoader 2.0 (http://www.freeloader.com). Это бесплатная программа, которая взаимодействует с Netscape Navigator и Internet Explorer при загрузке узлов и тем. Она позволяет составить расписание загрузки таким образом, чтобы избежать пиковых часов Internet. Взамен вам придется мириться с рекламными шапками над панелью инструментов, но это не такая уж высокая плата.
В том же ключе, но с меньшей гибкостью действует программа PointCast (http://www.pointcast.com), которая поставляет новости по вашим излюбленным темам, используя специальный хранитель экрана в Windows для показа новостных заголовков. Хотя вы можете выбирать тип новостей, с которыми вам хотелось бы знакомиться (бизнес, политика, финансы, спорт), и периодичность, с которой они будут обновляться, в выборе вас ограничивает меню, предлагаемое PointCast. Таким образом, эта программа скорее удобный способ просмотра заголовков, чем инструмент для быстрого поиска конкретной информации. PointCast - бесплатная программа.
Программа Smart Bookmarks 2.02 (http://www.firstfloor.com) производства компании FirstFloor (24,95 долл.) характеризуется как развитие механизма закладок браузера; на самом деле, однако, это самостоятельная программа, которая не только работает с закладками, но и загружает Web-страницы в автономном режиме. На овладение этой программой требуется известное время, но усилия окупаются. После того как вы создали закладку для какого-то узла или сформулировали интересующий вас запрос, Smart Bookmarks следит за изменениями в этом узле (или узлах). Когда изменения происходят, программа сообщает об этом, и вы можете потребовать загрузки соответствующей страницы и связанных с ней страниц.
Если вы нуждаетесь в более мощном автономном браузере, попробуйте OM-Express (http://www.openmarket.com), предлагаемый фирмой Open Market (29,95 долл.). Среди подобного рода средств это самая простая в обращении программа. У нее простой и понятный интерфейс, имеется руководство, позволяющее быстро научиться работать с программой. OM-Express показывает в браузере исходные URL даже для тех Web-страниц, которые скопированы на ваш компьютер.
Хотите бесплатно приобщиться к новейшей технологии программ-агентов? Web-агент WiseWire производства компании Empirical Media по ходу работы изучает ваши предпочтения и с каждым разом осуществляет все более тщательный отбор результатов. Программа эта, однако, медлительна и весьма неудобна. Она интересна как возможность заглянуть в будущее сетевого поиска, но пока еще не является эффективным поисковым инструментом.
Если вы всерьез интересуетесь разысканиями в сети, обратите внимание на Folio Retriever 2.1 (http://www.folio.com), программу автономного доступа, основанную на формате информационной базы Folio Views и переписывающую содержимое загруженных узлов в удобную для поиска базу, которую можно аннотировать и использовать в режиме коллективного доступа. В составе Retriever есть вполне работоспособная версия Folio Views 3.1 с одним ограничением: она импортирует только HTML-страницы. Достоинство Folio Retriever заключается в том, что эта программа позволяет вам в дальнейшем манипулировать однажды загруженными данными.
Глава 5. База данных предлагает услуги
Парень вскочил с кресла.
-Ну, теперь-то мне уж точно пора идти, - сказал он. - Спасибо, вы мне очень помогли.
- Не так шустро, - проворчал я. - На все это нужно взглянуть еще с одной стороны.
- Но вы же рассказали все, что мне нужно, - сказал он. - Уж теперь-то я смогу найти все, что хотел босс.
Настала пора его отрезвить.
- Слыхал когда-нибудь о законе Стерджона?
Он помотал головой.
- Закон гласит: девяносто процентов всего - хлам. Если это верно про все, это верно и про Web. Девяносто процентов того, что там есть, не стоит даже времени, которое уходит на его загрузку.
Конечно, где-то там погребены подлинные жемчужины информации, и все, что я сегодня рассказал, поможет тебе как-то к ним подступиться. Но подлинно важный материал, тот, что делает твой бизнес конкурентоспособным, - высококачественная информация о рынках или финансовые данные - стоит денег, - я сделал паузу, - и все зависит от того, готов ли ты заплатить.
За хорошую информацию придется платить
Служба InfoSage на узле IBM (http://www/infosage.ibm.com) - это мое секретное оружие, позволяющее моей фирме быть на высоте. Дважды в день InfoSage присылает мне составленную в соответствии с моими нуждами подборку новостей бизнеса, биржевых котировок и другой информации (сообщения могут пересылаться в электронный почтовый ящик или на личную Web-страницу). Чтобы задать или изменить профиль InfoSage, определяющий интересующие вас темы и сообщения, необходимо воспользоваться весьма экзотическим и неудобным программным обеспечением IBM для Windows, зато для чтения информации не нужно ничего, кроме браузера и электронной почты.
Подписка стоит 24,95 долл. в месяц; в течение первого месяца информация поставляется бесплатно. За каждое обращение к некоторым специфическим видам информации, таким, например, как рейтинги Standard & Poor, взимается дополнительная плата.
Если вы нуждаетесь в финансовых данных, то вряд ли найдете что-либо лучше, чем Quote.com (по адресу, естественно, http://www.quote.com). В Quote.com содержится масса предоставляемых бесплатно данных о биржевых котировках и прочей финансовой информации для тех, кто способен разумно ими распорядиться; вам нужно лишь зарегистрироваться в соответствующем узле, чтобы получить доступ к этому информационному изобилию. Для доступа же к еще большему изобилию информации вы можете внести ту или иную подписную плату (начиная с 9,95 долл. в месяц), и Quote.com добавит много нового: последние известия и таблицы биржевых котировок по вашему заказу, данные о портфелях ценных бумаг и биржевую информацию в исторической перспективе.
Тому, кто хочет получить по-настоящему глубокие сведения о какой-либо компании, отрасли промышленности или юридической проблеме, почти любую информацию предоставит пользующаяся заслуженной известностью система Lexis-Nexis (http://www.lexis-nexis.com) компании Knight-Ridder. Lexis - огромный архив законов, судебных решений и протоколов - ведется с 1973 г. Система-компаньон Nexis обеспечивает доступ к архивам, содержащим полные тексты тысяч газет и журналов, предлагает услуги по подборке фрагментов статей по определенным темам и т. п.
Выгодное приобретение? Воспользоваться услугами Lexis-Nexis обойдется подороже, чем как следует погулять вечерком в центре города. Цена подписки - 100 долл. в месяц, а то и больше плюс дополнительная плата за пользование целым рядом баз данных. Но если ваш бизнес требует доступа к такого рода информации, то затраты вполне того стоят.
Что касается информации общего характера почти по всем мыслимым темам, то предоставляемая компанией Encyclopedia Britannica служба оперативного доступа Britannica Online (http://www.eb.com) снабдит вас научно состоятельными и хорошо написанными статьями, включая полные библиографии, что весьма удобно, если вы намерены потом отправиться в местную публичную библиотеку. Индивидуальная подписка обходится недешево: 14,95 долл. в месяц или же 150 долл. в год плюс разовый регистрационный взнос в 25 долл., но это все же лучше, чем держать под рукой многопудовое собрание книг.
Глава 6. Простите, я попал не к тому детективу
- Вы мне очень помогли, - сказал парень. - Как же мне вас отблагодарить?
- Не стоит благодарности, - ответил я. - Просто оставь деньги на столе.
"Хороший бизнес", - подумал я, перебирая сотенные купюры. Но долго это не продлится. Я знал, что однажды - возможно, не сегодня и не завтра - я останусь без работы, вытесненный электронными агентами и искусственным интеллектом.
Однако пока этого не случилось, я собирался жить в свое удовольствие - и мне нужно было с кем-то отметить удачу. Я врубил мой браузер и стал искать адрес электронной почты своей давней пассии.
Увы, в каталоге Four11 (http://www.four11.com) оказалось несколько Джессик Флетчер, так что я выбрал наугад одну и отправил ей послание. Не прошло и часа, как я получил ответ. Похоже, много о себе понимает и родственная душа к тому же: она сыщик-любитель. В общем, неплохое начало...
Файлы, упомянутые в этой статье, можно найти на узле PC World Online (http://www.pcworld.com./dec96/bigseek).
Дилан Твини (dft@pobox. com) - редактор обзоров в InfoWorld. Йел Ли-Рон - редактор в PC World Online.
1 Намек на название криминальной драмы "Почтальон всегда звонит дважды". - Прим перев.
2 Название детективного романа Дэшила Хэмметта. - Прим перев.
3 Имя героя "Мальтийского сокола" и актера, сыгравшего его в знаменитой экранизации 1941 г.
Полезные советы
Пользуйтесь закладками. Сделайте закладку на первую страницу результатов поиска, чтобы иметь возможность к ней вернуться. Вместо того чтобы набирать "Дэшил Хэмметт" всякий раз, когда вам хочется выяснить какие-то пустяки про его детективы, просто вернитесь к сохраненному результату, и поисковый сервер сработает по новой - возможно, выдав обновленный результат.
Не тратьте время на перелистывание. Скажем, вы вроде бы нашли нужную Web-страницу - но объемом экранов этак в пятьдесят. Не пугайтесь - в Internet Explorer или Netscape Navigator просто нажмите комбинацию клавиш
Необычные символы. Если вас утомил ввод булевых операторов, вы можете использовать вместо них символы: амперсанд (&) вместо AND, вертикальную черту (|) вместо OR, восклицательный знак (!) вместо NOT и тильду (~) вместо NEAR. Например, вводите богарт ~ хэмметт вместо богарт NEAR хэмметт.
Ищете картинки? AltaVista может искать текст в элементах
Пользуйтесь обычным английским языком. Поисковая система на сервере Excite неплохо работает с повседневными разговорными формами, так что такие запросы, как Where is a good Italian restaurant in New York City? ("Где в Нью-Йорке есть хороший итальянский ресторан?") или learn how to speak Chinese ("узнать, как научиться говорить по-китайски"), могут оказаться на удивление эффективными.
Поиск источников цитат. Чтобы определить источник коротких цитат, например, "То, что не разрушает меня, делает меня крепче", просто введите нужную цитату в Excite. Не беда, если вы не помните, как оно выглядит в точности: с высокой вероятностью выданные страницы не только подскажут вам, откуда взялось высказывание, но и дадут его точную форму.
Поиск специфической информации. Помимо поиска в Web и Usenet, сервер InfoSeek позволяет искать информацию о компаниях, электронные адреса, а также заглядывать в файлы FAQ (часто задаваемых вопросов). Для этого просто выберите каталог, по которому вы собираетесь вести поиск в разворачивающемся списке на главной поисковой странице.
Не забывайте про заглавные буквы. Разыскивая имена собственные, пишите их в запросе с заглавной буквы - например, Hammer, а не hammer.
Убирайте не относящиеся к делу слова. Хотя Lycos не поддерживает поиска с использованием булевых операторов, для усовершенствования поисковой процедуры можно воспользоваться знаком минуса (-). При этом снижается вероятность появления в результатах поиска слов, помеченных в запросе этим знаком. Например, введите запрос business -monkey ("бизнес -обезьяна"), если вы хотите найти все о бизнесе, но не интересуетесь валянием дурака и темными делишками (тем, что по-английски называется monkey business).
Отличайте слова от фрагментов слов. Независимо от того, является введенная последовательность словом или цепочкой знаков в составе какого-либо другого слова, Lycos трактует ее одинаково. Поэтому, если вы просто введете последовательность graph граф, график, то Lycos будет искать еще и graphs графы, графики, и graphics проектирование, графика, и graphite графит. Если вы хотите ограничить поиск в Lycos в точности введенным вами словом, поставьте после него точку (.).
PC World Online: внутренние источники
Хотите зачерпнуть сразу много сведений по какой-то конкретной теме? Попробуйте обратиться к перечисленным ниже специализированным узлам. Отсылки к ним и к другим поисковым серверам вы можете найти на настраиваемой Личной странице PC World Online (http://www.pcworld.com/personal).
Автомобили AutoWeb Interactive (http://www.autoweb.com). Сервер AutoWeb предлагает обширную коллекцию объявлений о продаже новых и подержанных автомобилей, и все это даром. Вы даже можете бесплатно поместить туда свое объявление о продаже машины.
Адреса BigBook (http://www.bigbook.com). Упорядоченные по территориям полные списки жителей, компаний и т. д., покрывающие все Соединенные Штаты; узел также предоставляет карты, которые вы можете рассматривать в удобном для вас масштабе.
Здравоохранение The Virtual Hospital (http://vh.radiology/uiowa.edu/Misc/Search.html). В виртуальной больнице вы найдете описание всех известных недугов, возможные способы лечения и даже рентгеновские снимки.
Кинематограф Internet Movie Database (http://us.inmd.com/search.html). "Просто сложи губы ... и подуй" - кто это сказал и в каком фильме? Кинематографическая база данных содержит всякую всячину про кино и позволяет осуществлять поиск по названию фильма, по именам исполнителей, режиссера и даже других членов съемочной группы. Можно также принять участие в опросе и подать голос за ваш любимый фильм. (Ну что, сдаетесь? Это сказала Лорен Бэколл. Обратитесь к Movie Database, чтобы узнать, из какого это фильма).
Компьютеры Computer Desktop Encyclopedia (http://www.currents.net/resources/cyclo/cyclo.html). От языка Алгол до разъемов ZIF - все, что вы когда-либо хотели узнать о компьютерах, включая жаргон и всякие исторические факты.
Образование CollegeNet (http://www/collegenet.com). Ищете колледж, который вам по карману, в местности с климатом, который вы в состоянии вынести? CollegeNet подыщет вам учебные заведения в США, предлагающие интересующую вас специализацию.
Правительство The Zipper (http://www.voxpop.org/zipper). Вы в полном бешенстве и не знаете, на кого обрушить свой гнев? Разыщите того, кто представляет вас в органах власти, с помощью поисковой системы The Zipper (поиск на основе почтового Zip-кода) - со всеми атрибутами, включая номер телефона, факса и даже адрес электронной почты.
Право Legal Information Institute (http://www.law.cornell.edu/topics/index?). Вправе ли Microsoft сделать торговой маркой слово bill? И является ли "Билль о правах" (Bill of Rights) просто описью товаров (bill of goods)? Сведения об этом и многом другом, снабженные исчерпывающими перекрестными ссылками и связями, можно найти на сервере Института юридической информации, поддерживаемом Корнелльским университетом.
Путешествия Fodor"s Know Before You Go (http://www.fodors.com/know.html). Вся информация, необходимая для вашего очередного путешествия, включая погодные условия, консультативные публикации Госдепартамента и многие другие информационные ресурсы.
Поиск по-русски
В "Паутине" немало интересных русских текстов, так что необходимость поискать информацию на русскоязычных страницах возникает довольно часто. Однако эффективно делать это мешают особенности, во-первых, русского алфавита, а во-вторых, русского словоизменения.
Главная проблема русского алфавита - неединственность: на одних русскоязычных узлах господствует КОИ-8, на других - кодировка Windows (1251). Не так уж мало, особенно за рубежом, и транслитерированных страниц (этот способ представления русских текстов иногда называют Ruglish), часто не продублированных ни одной из собственно русских кодировок. Добавьте к этому еще и отсутствие единого общепринятого способа транслитерации.
Поэтому, собирая в Сети информацию, скажем, о Митьках, вы получите один список узлов, задав поисковому серверу слово Митьки в кодировке 1251; другой - если сумеете ввести его в КОИ-8 (как это сделать, можно узнать, например, в "Совинформбюро" - http://www.siber.com/sib/russify/); третий - если наберете латиницей Mit"ki; четвертый - если Mitki. Кое-какие страницы из разных списков будут, разумеется, дублировать друг друга, но совпадений обычно меньше, чем мы склонны предполагать заранее.
Не следует также забывать, что, в отличие от латиницы, где запросы можно вводить одними строчными буквами, а сервер будет искать также слова с соответствующими заглавными, для русских букв этого, естественно, не происходит. Так что в запросе о текстовом редакторе "Лексикон" лучше написать "ЛЕКСИКОН OR Лексикон".
Другая проблема, как уже говорилось, связана с русской морфологией. Понятно, что, если слово Митьки интересует нас не только в именительном падеже (мы хотели бы получить все страницы, где есть что-нибудь "о Митьках", "про Митьков", "Митьковское" и т. д.), надо усечь образец для поиска до Митьк. Если же нам требуются также страницы, на которых упомянут какой-либо отдельный представитель этой группы ("Митек"), придется либо усекать этот образец вообще до Мит (и налетать на "Митрополита", "Митчелл" и Бог знает кого еще), либо давать запрос Митьк OR Митек. Не очень удобно, особенно учитывая необходимость повторить это в разных кодировках; к тому же не всегда легко сообразить, какие варианты основы есть у данного слова.
Чтобы избежать хотя бы некоторых неприятностей, я, при необходимости найти что-либо по-русски, отправляюсь на сервер фирмы CompTek. Эта фирма разработала систему поиска (она называется Яndex - "языковой индекс"), учитывающую особенности русского языка, и в рекламных целях открыла у себя страничку для отправки через эту систему запросов к AltaVista. Слова в запросе, который вы вводите на сервере CompTek, автоматически "размножаются" и передаются на AltaVista уже во всех формах - все, что нужно, и ничего лишнего.
Еще одно очень полезное свойство сервера - переключение кодировок: чтобы отправить один и тот же запрос в разных кодировках, не нужно вводить его дважды. Раз введенный запрос будет автоматически перекодирован при выборе новой кодировки (вам останется только поменять шрифт для просмотра результата). Кодировок на сервере две - КОИ-8 и 1251. Этого хватает: хотя некоторые узлы имеют страницы в других кодировках, все такие страницы продублированы в кодировке КОИ-8 или 1251 (а часто и в обеих).
С транслитерацией Яndex, увы, не работает - слишком много существует разных ее форм, иногда непоследовательных (одно и то же слово на одной и той же странице может быть написано по-разному). Поиск на подобных страницах очень труден в любом случае, поэтому будем надеяться, что их авторы рано или поздно (лучше, конечно, раньше, чем позже) перейдут с латиницы на кириллицу. А в кириллице работать с поисковой страницей CompTek - одно удовольствие. Так что наслаждайтесь: http://www.cti.ru/alta.html.