О технологиях системы Wolfram Alpha (www.wolframalpha.com), способной отвечать на вопросы из разных областей человеческой деятельности, известно меньше, чем, например, о внутреннем устройстве Yandex, — о ней с уверенностью можно сказать только то, что система успешно функционирует (более полумиллиона посетителей в день). Wolfram Alpha, по сути, первая и единственная общедоступная реализация идеи базы знаний, но, хотя количество исследований и публикаций, так или иначе связанных с базами знаний, исчисляется тысячами, до рядового пользователя они не доходили. Среди немногочисленных реализованных проектов баз знаний можно выделить только Cyc компании Cycorp, но и ее продукты не предназначены для массовой публики. И вот год назад появился публичный сайт с приятным интерфейсом, хорошей пользовательской документацией, где можно получить необходимые знания путем выборки из имеющейся базы. Если, например, вы спросите о погоде в Москве, то получите текущую метеосводку, если добавите период наблюдения, то получите все данные о погоде за этот отрезок времени и т. д. Варьируя вопросы, обращенные к Wolfram Alpha, можно получить и обобщить именно знания о погоде и климате, которые вам нужны. К сожалению, текущая версия, в отличие от поисковых систем, ориентирована на английский язык, более того, преимущественно, на американский сленг. Разумеется, сведения из точных и гуманитарных наук интернациональны, но, скажем, сведения о трафике в европейских городах получить невозможно.
Поначалу, когда система Wolfram Alpha только появилась, из-за ее новизны было сложно понять, что же это такое — [I]машина, вычисляющая знания[$] (computational knowledge engine), которую создал Стивен Вольфрам. Не случайно весной прошлого года на головы недоуменных читателей обрушился поток безапелляционных утверждений типа: «Wolfram Alpha — убийца Google!", слегка разбавленный сомнениями. Авторы таких публикаций слепо и без должной критики повторяли утверждение одного из идейных лидеров Web, Спивы Новака — основателя компании Radar Networks, специализирующейся на Semantic Web, внука патриарха современного менеджмента Питера Друкера. Однако более думающая аудитория была настроена скептически, понимая, что одолеть Google на его площадке будет сложно, как ни называй новые инструменты — "семантическая поисковая машина» или просто Web-поисковик. В правильности этого утверждения убеждает то, что первое мобильное решение Wolfram Alpha работает на смартфоне HTC T-Mobile G2 — Android, втором поколении официально утвержденного Google-телефона. А по существу Wolfram Alpha ничего общего с поисковой машиной не имеет, за исключением предоставления сервисов по сети и похожего на поисковые машины интерфейса. Скорее Wolfram Alpha стоит сравнивать с мощным графическим калькулятором, работающим в режиме онлайн, возможности которого выходят за рамки математических расчетов, а вовсе не с поисковой машиной. На главной странице Wolfram Alpha написано, что это "машина, вычисляющая знания", в этом качестве систему и следует воспринимать. Еще Wolfram Alpha можно представить как развитие идеи memex, гипотетической машины Ванневара Буша.
Возможно, Wolfram Alpha дает начало новому классу открытых информационных систем, вобравших в себя наработки, сделанные в процессе создания различных математических пакетов, в данном случае Mathematica. В отчетах Wolfram Research утверждается, что система не имеет себе равных и по вложенному интеллекту превосходит все известные Web-системы. Компания подчеркивает это обстоятельство, сообщая пользователю на каждой странице о присутствии «машины, вычисляющей знания". Первый вопрос в списке традиционного раздела FAQ звучит как: "Является ли Wolfram Alpha поисковой машиной?» — «Нет, Wolfram Alpha генерирует ответ, выполняя действия над собственной базой знаний, а не посредством поиска и с возвратом гиперссылок»
В отличие от большинства инноваций, у Wolfram Alpha есть серьезная философской основа — теория вычислимой вселенной (или панкомпьютеционализм), отражающая взгляд на вселенную как на большую вычислительную машину или, скорее, сеть вычислительных процессов. Заслуга Вольфрама состоит в том, что он нашел способ моделирования этой вселенной и придумал то, что сам назвал [I]вычислимым телескопом[$] (computational telescope), изобретя инструмент для извлечения знаний из этой модели. Но вот то, как устроена эта модель и как работает этот телескоп, — тайна, которая может быть кому-то приоткроется после изучения 1200 страниц книги Вольфрама New Kind of Science или из его немногочисленных и не слишком содержательных выступлений.
В известной степени подход, на котором построена система Wolfram Alpha, можно рассматривать как альтернативу той примитивной вычислительной силе, которую сейчас пытаются применять для решения многих задач, благо в ней недостатка уже нет. Самое нелепое, но характерное приложение такого вида — электронная таблица, работающая на HPC-кластере с тысячью ядер. Прошло более 30 лет с тех пор, как Дэн Бриклин написал VisiCalc для Apple II, а воз и ныне там, идеология работы с данными не претерпела заметных изменений, и замены таблицам пока не придумали. Получается, что чудовищная вычислительная мощность уходит всего лишь на то, чтобы человек мог каким-то образом визуализировать результаты и увидеть скрытые в больших объемах данных закономерности.
Вся база знаний Wolfram Alpha разделена на рубрики, их перечень дает представление об общей тематической направленности: математика, статистика, физика, химия, материаловедение, технические науки, астрономия, биология, науки о Земле, транспорт, компьютерные науки, единицы измерения, деньги и финансы, время и даты, география, социология, погода, медицина, история, питание, образование, общественные организации, спорт и музыка. Каждая из рубрик делится на подразделы. Тот, кому это покажется интересным, найдет на сайте немало примеров, чтобы научиться задавать вопросы по каждой из тем. Это умение отличается от работы с поисковыми машинами — здесь недостаточно указывать ключевые слова, а нужно освоить способы, необходимые для формулирования проблемы. Проще всего дело обстоит с математическими формулами и разного рода расчетами, сложнее в случаях, когда требуется не просто фактография, а некоторый анализ.
Нераскрытой, но заманчивой остается тема Wolfram Alpha в корпоративных приложениях, хотя на сайте компании есть соответствующая страница и интуитивно понятно, что превращение корпоративных данных в базу знаний плюс необходимый инструмент доступа открывают интересные перспективы для бизнес-аналитики. Есть указание на потенциальную возможность использования в режиме SaaS ресурса суперкомпьютеров, поддерживающих Wolfram Alpha, можно перенести Wolfram Alpha внутрь корпоративных защитных экранов, но как именно — не сказано.
В сентябре 2010 года прошла конференция Wolfram data summit 2010, где были подведены итоги первого года эксплуатации системы. Это было представительное собрание: Бюро переписи населения США, NASA, ООН и другие организации. Предметом обсуждения были приложения Wolfram Alpha в медицине, обрабатывающие большие объемы текстовых данных, приложения работы с биологическими и геологическими данными, а также опыт использования системы в инженерных и научных исследованиях, в финансах и бизнесе.
Какие имена сейчас наиболее популярны в США? Запрос popular names система интерпретировала как most popular given names и выдала неожиданный результат: оказывается, новорожденных сейчас чаще всего называют Isabella, Jacob, Ethan, Michael и Alexander. Список распределения имен ныне живущих более предсказуем: Michael, James, John, Robert и David. Как случилось, что в тройке лидеров оказались Isabella и Ethan? Если спросить об этом у Wolfram Alpha посредством запроса names Isabella Ethan, то оказывается, что так называть младенцев стали с середины 80-х, причем уступающий сейчас первое место Ethan раньше лидировал, поэтому сейчас в США живет почти 300 тыс. человек с этим именем, а Изабелл вдвое меньше, соответственно средний возраст мальчиков Ethan шесть лет, а девочек Isabella — три года. Спросим names Jacob Ethan Michael John James — и окажется, что среднему Джеймсу 63 года, средний Майкл на 10 лет младше, среднему Джону 46, а Якову всего 12. Интересно то, что система поняла, что мы интересуемся мужчинами, и исключила из сравнения женщин с именем Мишель.
Еще один пример возьмем из математики. Построим спираль Ферма, для этого введем "r^2 = 4*phi", а в ответ система не задумываясь выдаст картинку:
Если знания вложить в компьютер и научиться извлекать именно то, что нужно, заставив его отвечать на поставленные вопросы, то можно получить машину, вычисляющую знания. И это уже не фантастика.
http://www.osp.ru/os/2009/06/10070939