Компания Mail.ru подвела итоги своей деятельности на рынке поисковых систем и рассказала о дальнейших разработках в этом направлении. Собственный поисковый механизм был запущен компанией в 2010 году, а до этого компания использовала различные поисковики, включая Google и «Яндекс». За прошедший год система «Поиск@Mail.ru» стала самой быстрорастущей на рынке поиска. Сейчас ее доля оценивается в 9,4% российского рынка поисковых запросов, по данным портала li.ru. В своей работе «Поиск@Mail.ru» использует две базы: собственную и Google — «отечественные» запросы она обрабатывает сама, а иностранные — посредством Google.
НА СЕГОДНЯ В ПОИСКОВОМ ИНДЕКСЕ Mail.ru находится 6-7 млрд уникальных адресов. Индекс машины построен на базе системы Hadoop, и разработчики Mail.ru активно участвуют в развитии этого продукта |
На сегодня в поисковом индексе Mail.ru находится 6-7 млрд уникальных адресов. Индекс машины построен на базе системы Hadoop, и разработчики Mail.ru активно участвуют в развитии этого продукта. Особенностью «Поиск@Mail.ru» является обработка сложных запросов. В машине нет собственного языка для их составления, и поэтому она пытается подобрать документы, где слова из запроса стоят как можно ближе друг к другу. Однако есть специальные слова, появление которых в запросе подсказывает машине особый сценарий поиска. Например, слово «цена» она интерпретирует так, что пользователь ищет сведения о товаре, и формирует выдачу исходя из этих предположений. В «Поиск@Mail.ru» предусмотрено порядка 30 подобных сценариев. Среди ее уникальных возможностей Владимир Габриэлян, вице-президент и технический директор Mail.ru, назвал поиск по лекарствам.
Основным направлением развития поиска является создание самообучающегося механизма, который будет самостоятельно подбирать коэффициенты для формулы релевантности. Для разработки интеллектуального ядра компания пригласила более 60 экспертов по поиску, которые определяют качество выдачи поисковой машины и обучают механизмы искусственного интеллекта. Разработанный Mail.ru механизм был запущен в тестовую эксплуатацию 3 марта, но для пользователей он еще недоступен. Габриэлян рассчитывает к лету отладить его и перевести на него основной поиск.
Впрочем, для закрепления на рынке поисковых машин уже недостаточно просто разработать хороший поисковый механизм. Основная битва за рынок происходит на уровне приложений, которые устанавливаются на устройства пользователей: сейчас, по оценкам Габриэляна, половина запросов в поисковую машину приходит не через веб-интерфейс поисковой машины, а от таких приложений.
Первым шагом к пользователю был модуль поиска, который интегрировался в браузер, но очень быстро разработчики браузеров догадались совместить адресную строку и поисковый запрос, предоставив пользователям возможность выбирать поисковую машину. Пользователи в большинстве случаев оставляли настройки по умолчанию, поэтому следующим шагом стали собственные сборки браузеров, где умолчания были в пользу соответствующих поисковых машин. В конце прошлого года Mail.ru выпустила свой браузер под названием «Интернет» на основе Chromium (браузер с открытым кодом, разработанный Google). В результате посещаемость ее поисковой машины значительно выросла.
Впрочем, одна из наиболее драматических битв между поисковыми системами происходит на мобильных платформах, и в ней пока выигрывает Google, имеющая собственную операционную систему. Всем остальным приходится довольствоваться только отдельными приложениями, предустановленными, например, разработчиками мобильных устройств, или оболочками для операционной системы.