Представители Microsoft и Powerset подтвердили сведения о том, что корпорация приобретет начинающего разработчика поисковых механизмов. Новости об этом были опубликованы в блогах обеих сторон через несколько дней после того, как информация появилась в Internet. Стоимость сделки не разглашается, и, как сообщил информационный партнер Microsoft, называть ее корпорация не собирается. По слухам, цена покупки может составлять порядка 100 млн долл.
В блоге старшего вице-президента Microsoft Сатьи Наделлы говорится, что коллектив Powerset присоединится к команде Microsoft Search Relevance, территориально оставшись при этом в Сан-Франциско, где располагается штаб-квартира Powerset. В настоящее время в штате компании насчитывается 63 человека, которые продолжат работу в своем нынешнем офисе.
Немалая ценность
Компания Powerset является пионером семантического поиска — технологии, которая, по словам Наделлы, представляет собой немалую ценность для поискового механизма Microsoft. По мнению аналитиков, в данном случае Microsoft заинтересована не столько в приобретении технологии, сколько в привлечении к своим проектам высококвалифицированных инженеров Powerset. «Microsoft покупает компанию, которая действительно предложила новаторское решение, но пока находится на начальной стадии разработки, — отметил аналитик The 451 Group Ник Пейшенс. — И купили ее ради людей».
Как бы то ни было, можно утверждать, что технология семантического поиска, предложенная Powerset, обладает хорошим потенциалом.
Анализировать смысл
Механизмы семантического поиска должны анализировать смысл поисковых запросов и Web-страниц, а не просто сравнивать текст запроса с ключевыми словами ссылок или результатов предыдущих и связанных запросов. Корпорация Google, являющаяся лидером рынка поисковых механизмов, пока выдает результаты поисковых запросов исходя по большей части из сравнения ключевых слов. «Нам известно, что сегодня едва ли не треть поисковых запросов при первой итерации не дает желаемого результата, — заметил Наделла. — Инициаторы запросов ищут информацию, которую хотят в конечном итоге получить, но зачастую это требует выполнения сразу нескольких запросов или просмотра множества полученных ссылок».
Наделла выделил две специфические причины задержек при организации поиска с использованием традиционных методов — различия в формулировках или контексте между поисковым запросом и способом представления информации на Web-страницах, а также недостаточная ясность описания каждой из Web-страниц, представленных в результатах запроса.
Выйти за пределы Википедии
В настоящее время инженеры Powerset тестируют поисковый механизм, который пытается понять смысл Web-страниц. В механизме используется технология, лицензированная у подразделения Xerox PARC. Данная технология формирует семантическое представление Web-страниц путем разбора каждого предложения и распознавания его смысла.
«Хотя демонстрация произвела достаточно сильное впечатление, пока непонятно, каким образом компания Powerset намерена заставить ее работать через Internet, — отметил глава аналитической фирмы Sterling Market Intelligence Грег Стерлинг. — Инженеры Powerset применяли свой механизм в относительно небольших сегментах Internet, в частности при организации поиска в Википедии. Но главный вопрос остается открытым: можно ли распространить то, что мы наблюдали по отношению к Википедии, на всю паутину Web?»
Пейшенс согласен с тем, что дальнейшее масштабирование технологии может быть сопряжено с немалыми трудностями. «Достаточно интересный прототип семантической технологии еще должен доказать свое право на существование на больших объемах информации, — подчеркнул он. — И пример Википедии в данном случае не показателен».
Возможно, вхождение в состав богатой компании (например, Microsoft) — это именно то, что нужно Powerset, для того чтобы распространить свою технологию на весь океан Web.
Не Yahoo, так Powerset?
Старший менеджер по продуктам Powerset Марк Джонсон в своем блоге выражает уверенность в том, что Microsoft поможет технологии Powerset заслужить признание пользователей быстрее, чем если бы компания решала эту задачу своими силами.
«Microsoft разделяет наше стремление улучшить поиск за счет более глубокого анализа запросов и документов, — пишет Джонсон. — В Microsoft понимают, что наша технология и наработки должны сыграть ключевую роль в эволюции поиска. Обладая развитой поисковой инфраструктурой, невероятными финансовыми возможностями, неограниченным объемом данных, командой, объединяющей ведущих специалистов в области информационного поиска, и четким пониманием необходимости совершения революции на рынке поисковых механизмов, корпорация Microsoft может помочь нам быстрее добиться прогресса в деле создания технологии семантического поиска и распространения ее на всю паутину Web.
Возможно, некоторые считают, что нынешнее приобретение — всего лишь рефлекторная реакция Microsoft на неудавшуюся попытку купить Yahoo, но на самом деле это не так. Я бы не стал рассматривать его как альтернативу покупке Yahoo. Ведь перед нами пока непроверенная технология, которая не приносит никакого дохода».
«Powerset не передаст Microsoft раскрученную торговую марку, не приведет за собой многочисленную армию пользователей и не откроет множество Web-ресурсов, которые имеются в распоряжении у Yahoo, — согласился Стерлинг. — Это приобретение нельзя считать заменой тому, что корпорация собиралась сделать с помощью Yahoo.
В то время как исследователи Yahoo продолжают заниматься вопросами семантического поиска, Microsoft, лишенная возможности использовать ресурсы Yahoo, решила попытать счастья в коммерциализации технологии Powerset. Возможно, в случае слияния инженеры Yahoo просто растворились бы внутри огромной Microsoft или даже покинули компанию. Что же касается специалистов Powerset, их шансы на успешное развитие поисковых технологий Microsoft представляются мне более предпочтительными, чем шансы, открывавшиеся перед инженерами Yahoo».
Microsoft планирует интегрировать технологию Powerset с рядом проектов подразделения Microsoft Research в области обработки естественного языка.
— Элизабет Монтальбано, Служба новостей IDG, Нью-Йорк