.
Scirus
Объем индексной базы Scirus — примерно 370 млн. документов по компьютерным технологиям, естественным наукам, лингвистике, экологии, экономике и менеджменту. В их число входят монографии, статьи из научной периодики, материалы конференций, препринты и патенты. Кроме того, индексируются и официальные сайты научных организаций. База Scirus содержит только полные тексты, имеющиеся в свободном доступе. Показ дополнительных результатов из платных баз включается в настройках поиска.
Система Scirus предлагает режимы простого и расширенного поиска. В запросах допускается применение логических операторов. Возможен поиск как определенных видов документов, так и по электронным версиям текстов из печатных изданий. Весьма полезен фильтр Subject Areas, помогающий либо запустить поиск только по материалам, относящимся к определенной научной дисциплине, либо включить в результаты данные исследований, находящихся на стыке нескольких дисциплин. Если учесть количество современных междисциплинарных работ, такой фильтр становится хорошим подспорьем в работе со Scirus.
Несколько полезных инструментов вынесены на страницу выдачи результатов поиска. Во-первых, там находится боковая панель фильтров, позволяющая быстро перейти к просмотру результатов по источникам (публикации периодических изданий или же веб-страницы), а также по типам файлов. Раздел Refine your Search демонстрирует список дополнительных ключевых слов, автоматически найденных в результатах поиска, с помощью которых можно быстро уточнить свой запрос. Доступны два варианта сортировки списка выдачи: по релевантности и дате.
Форма расширенного поиска предлагает осуществить поиск введенных ключевых слов в определенных полях описания документов (автор, заглавие, ISSN и другие) и указать хронологические рамки поиска. Кроме того, есть возможность выбрать базы данных из предлагаемого списка информационных партнеров Scirus и полученные результаты включить в выдачу поисковика. В расширенном поиске также используются логические операторы и маски.
Чтобы ускорить работу со Scirus, имеет смысл употребить предлагаемые разработчиками дополнения для браузеров: поисковый плагин и панель инструментов. Заинтересованным веб-мастерам предлагается установить на своих сайтах форму поиска Scirus.
ScienceResearch
Проект ScienceResearch — бесплатный и общедоступный поисковик по научным ресурсам, обладающий рядом интересных особенностей. Он работает примерно с тремя сотнями баз данных, электронных библиотек и других источников научных публикаций, называемых здесь «коллекциями». Основные свойства ScienceResearch — применение технологии Federated Search, а также кластеризации при выводе результатов поиска.
Компания Deep Web Technologies разработала технологию «объединенного поиска» (Federated Search), реализованную в поисковом алгоритме Explorit Research Accelerator, предлагаемом заинтересованным разработчикам. Построенные на ее основе ресурсы не собирают какую-либо собственную индексную базу, а работают в режиме реального времени с большим количеством внешних подключаемых БД.
После поступления запроса от пользователя ScienceResearch отправляет его во все поддерживаемые коллекции. Затем отбрасываются дублирующиеся записи и определяются наиболее релевантные результаты. Заметим, что степень релевантности, определяющаяся с помощью алгоритмов самого ScienceResearch, не зависит от качества ранжирующих алгоритмов отдельных источников информации. В результате формируется страница выдачи, доступная просмотру для пользователя. При составлении запросов допустимы употребление логических операторов и поиск точной фразы.
То, что все эти операции выполняются в режиме реального времени, позволило реализовать несколько уникальных возможностей. Например, если во время просмотра пользователем страницы результатов поиска в какой-либо из внешних баз появляются новые записи, подходящие под условия введенного запроса, система выведет соответствующее сообщение и предложит дополнить выдачу новыми результатами.
Режим расширенного поиска позволяет вести его по конкретным признакам (например, заглавию, автору публикации), а также ограничить выдачу определенным хронологическим промежутком или конкретной научной дисциплиной. Список основных дисциплин выводится на боковой панели поисковика. Кроме того, можно выбрать одну или несколько коллекций, куда и будет отправлен ваш запрос. К сожалению, в бесплатной версии ScienceResearch предлагается выбор не из всех доступных коллекций, а только из нескольких основных.
Для уточнения запросов система ScienceResearch использует кластерные технологии. Результаты работы алгоритма демонстрируются на боковой панели страницы выдачи. Кроме тематических кластеров предлагаются разделы, группирующие статьи по авторам, источникам публикаций и по другим подобным признакам. Благодаря соответствующим меню легко сортировать выдачу по различным признакам, а также переключаться в режим просмотра результатов, полученных из какой-либо одной коллекции.
BASE
Научный интернет-поисковик Bielefeld Academic Search Engine (BASE) имеет европейские корни. Сам сервис BASE принадлежит немецкому университету, а в основе его поисковых алгоритмов лежат разработки норвежской компании Fast Search & Transfer. Ценность данного ресурса состоит в том, что BASE, представляющий собой поисковую машину международного проекта Open Archives Initiative, сотрудничает с европейским научно-информационным проектом DRIVER.
Первый из названных проектов, позволяющий владельцам электронных библиотек обмениваться данными о своих собраниях, является частью движения Open Access, ставящего своей целью повысить доступность научной информации. В рамках «Открытого доступа», ставшего популярным в начале 2000-х авторы получили платформу для распространения своих идей в международной академической среде, которая помогла им ограничиться минимальными затратами и избавила от длительного ожидания публикаций в традиционных научных журналах.
роект DRIVER обеспечил создание сводного ресурса, объединяющего европейские электронные библиотеки, специализирующиеся на научной и учебной информации. Таким образом, проект BASE стал удобной точкой доступа к свободно распространяемой научной информации. Кроме названных источников BASE обращается и к собственной индексной базе тематических веб-сайтов и БД, и потому в результатах поиска могут попадаться ссылки на лицензируемый контент.
BASE предлагает режимы простого и расширенного поиска. В простом режиме проводится полнотекстовый поиск, а для уточнения запроса доступна лишь опция переключения сферы поиска между ресурсами BASE и поиском по базе Google Scholar через интерфейс BASE. В режиме расширенного поиска находятся источники по конкретным полям описания ресурсов (автор, заглавие, тема), а также определяются географический регион и год издания публикаций. Здесь же стоит определить и тип искомого контента. Поддерживается поиск статей, книг, текстов лекций, тезисов докладов, а также карт, видео- и аудиофайлов. В систему BASE интегрирован тезаурус Eurovoc, так что при обработке запроса вполне реально получить релевантные результаты сразу на двух десятках европейских языков, а также списки синонимов и близких терминов, что позволяет качественно уточнить запрос.
Sсholar.ru
Рассмотренные выше проекты, ориентированные на зарубежные источники, содержат информацию на иностранных языках. Однако сейчас существует несколько интересных проектов научного интернет-поиска на русском языке. Один из них — система Scholar.ru. Стоит отметить, что данный ресурс поддерживает команда всего из трех человек. Индексируются статьи, монографии, а также авторефераты диссертаций, представленные в форматах HTML, PDF, DjVu. Индекс пополняется в полуавтоматическим режиме. Материал может добавить в поиск и сам автор (соответствующая форма предлагается на страницах проекта), однако основным источником данных служат несколько общедоступных проектов, собирающих электронные версии научных публикаций. Следствием такого подхода стало, с одной стороны, практически полное отсутствие информационного шума в результатах, а с другой — сравнительно небольшой объем базы проекта. Сейчас в ней чуть более 48 тыс. публикаций.
Данный сервис представляет собой гибрид поисковика и веб-каталога. Закладка «Каталог научных публикаций» состоит из 25 основных разделов, отражающих широкий спектр наук как естественного, так и гуманитарного профиля. К сожалению, количество пустых разделов здесь достаточно велико, что не способствует эффективной работе. Раздел «Научные области» предлагает облако тегов, помогающее найти нужный материал. Раздел «Аспирантура», носящий справочный характер, содержит паспорта научных специальностей.
Ссылки в поисковой выдаче системы сопровождаются краткой текстовой выдержкой, прямой ссылкой на исходный файл, а также списком тематических тегов. В боковой панели поисковика выводится сводный список дополнительных тегов, присвоенных документам, попавшим на страницу выдачи.
Flexum «Поиск по научным сайтам»
Тема научного поиска не прошла мимо разработчиков персональных поисковиков. Пример такого ресурса — «Поиск по научным сайтам», созданный с помощью системы Flexum. В индексе проекта в настоящее время около 4 тыс. сайтов. Данный проект по этому показателю, кстати, является крупнейшей системой на основе Flexum. Кроме того, по своему рейтингу он входит в тройку лучших персональных поисковиков Flexum. Там представлены тематические ресурсы, сайты учебных заведений и научных организаций, научных журналов.
Интерфейс «Поиска по научным сайтам» стандартен для поисковиков на базе Flexum. Стартовая страница предлагает просмотреть каталог включенных в систему сайтов, построенный на основе присвоенных им тегов. Всего на данном поисковике выделено несколько десятков категорий. Среди них как тематические разделы, посвященные отдельным научным дисциплинам, так и разделы, выделенные по типам интернет-ресурсов, в частности «Форумы и блоги», «Электронные библиотеки».
В системе Flexum «Поиск по научным сайтам» доступен только режим простого поиска. Страница выдачи результатов поиска содержит собственно список найденных ссылок, панель тематических закладок и вспомогательную боковую панель. Она показывает выдержки из текстов с найденных веб-страниц, а также позволяет поставить быструю закладку на найденную страницу, оценить качество поиска и добавить свой комментарий к его результатам. С помощью панели закладок, расположенной над списком выдачи, легко переходить к поиску лишь по сайтам, помеченным соответствующими тегами, что повышает точность поиска. Найденные веб-страницы могут выводиться как единым списком с сортировкой по релевантности, так и сгруппированными по тем сайтам, на которых они были найдены.
Главное достоинство данной системы — хороший охват научных интернет-ресурсов на русском языке. К недостаткам стоит отнести отсутствие дополнительных возможностей составления сложных запросов, а также наличие информационного шума в результатах поиска. Справедливости ради нужно отметить, что такие минусы свойственны большинству персональных поисковиков.
«Академия Google»
Наряду со специализированными проектами в области научного интернет-поиска имеет смысл пользоваться и вертикальными сервисами универсальных поисковиков. Наиболее известный ресурс такого плана — проект «Академия Google». Его бета-версия под оригинальным названием Google Scholar стартовала в октябре 2004 г.
«Академия Google» индексирует ресурсы открытого доступа, интернет-сайты, а также издательские сервисы, предоставляющие доступ к публикациям на коммерческих условиях. Кроме того, научный поисковик Google предлагает проект интеграции с классическими научными библиотеками. Данная функция работает с электронными каталогами библиотек, функционирующими в онлайновом режиме и поддерживающими формат OpenURL. Подключение библиотек к этому проекту Google свободное и бесплатное. В зависимости от настроек сервера библиотеки просмотр каталога может быть доступен как всем желающим, так и только зарегистрированным пользователям библиотеки. Русская версия «Академии Google» по умолчанию включает поиск по электронному каталогу Государственной публичной научно-технический библиотеки (ГПНТБ). В настройках поиска пользователю разрешается добавить до трех собственных ссылок на онлайновые каталоги библиотек, поддерживающих названные технологии.
Интерфейс поисковика, выдержанный в строгом стиле, предлагает минимум дополнительных инструментов. К средствам быстрой фильтрации результатов отнесем, разве что хронологическое меню, позволяющее переходить к просмотру публикаций определенного года. Если материалы были найдены на нескольких ресурсах, то в результатах поиска будет предложена ссылка просмотра полного списка копий такого издания.
Режим расширенного поиска «Академии Google», обеспечивающийся стандартным набором инструментов формирования запроса (поиск по фразе, на включение и исключение указанных слов), предлагает поиск как по именам авторов, так и в статьях определенных журналов, а еще позволяет указать диапазон дат публикаций нужных материалов.
При оценке релевантности той или иной ссылки, влияющей на ее позицию в выдаче поисковика, учитываются индекс цитирования публикации и ее автора, а также известность интернет-источника или того издания, где появилась статья. Каждая из ссылок снабжается кратким библиографическим описанием источника, счетчиком индекса цитирования данной публикации и ссылкой для поиска похожих материалов. В системе действует и «Библиографический менеджер», выводящий рядом с найденными ссылками корректное библиографическое описание источника, которое допустимо включить в список литературы к своей работе. К сожалению, там предусмотрены лишь зарубежные стандарты описания ресурсов, а вот форматов наших библиографических ГОСТов не дано, что определенно смазывает впечатление от этой, безусловно, полезной функции. Включить библиографический менеджер можно в настройках поисковика.
К достоинствам «Академии Google» следует отнести простоту освоения, высокую скорость работы, а также наличие функции поиска в каталогах классических научных библиотек. Недостатками проекта являются ограниченный выбор дополнительных инструментов управления поиском и повышенный информационный шум в результатах, получаемых для пользователей, ориентирующихся на источники свободного доступа. Данный поисковик выдает много ссылок на коммерческие ресурсы, что означает прямой доступ только к аннотациям или кратким выдержкам из текста публикаций.
Оценка: 4 / 5
Язык интерфейса: английский
Разработчик: Scirus
Сайт: www.scirus.com
ScienceResearch
Оценка: 4 / 5
Язык интерфейса: английский
Разработчик: Deep Web Technologies
Сайт: www.scienceresearch.com
BASE
Оценка: 4 / 5
Языки интерфейса: английский, немецкий, испанский, польский
Разработчик: Bielefeld University
Сайт: www.base-search.net
Sсholar.ru
Оценка: 3 / 5
Язык интерфейса: русский
Разработчик: команда Scholar.ru
Сайт: www.scholar.ru
Flexum «Поиск по научным сайтам»
Оценка: 3 / 5
Язык интерфейса: русский
Разработчик: Михаил Волович
Сайт: science.flexum.ru
«Академия Google»
Оценка: 4 / 5
Язык интерфейса: русский
Разработчик: Google
Сайт: scholar.google.com
Система ScienceResearch применяет уникальные технологии объединенного поиска в режиме реального времени, а также кластеризацию результатов
Проект Scholar.ru — это гибрид поисковика и веб-каталога
Система «Академия Google» индексирует ресурсы открытого доступа, интернет-сайты, издательские сервисы и каталоги библиотек