Выступая на восьмой Международной конференции World Wide Web (www8.org), глава Консорциума World Wide Web (W3C) Тим Бернерс-Ли изложил свое видение перспектив развития Internet, приведя в замешательство многих присутствующих.
Бернерс-Ли заявил, что в отличие от старой паутины Web, в которой люди обменивались информацией при помощи документов, новая концепция сети Semantic Web предусматривает совместную работу пользователей на основе технологии разделения данных.
В «старой» Web для просмотра нужных сведений использовался язык HTML, при этом содержание информации было отделено от ее представления. Для сети Semantic Web были разработаны спецификации XML, предусматривающие разделение содержания, представления и смыслового значения.
Стандарт XML 1.0 утвержден Консорциумом W3C в 1998 году.
Сегодня на средства поиска и ведения электронной торговли в Web ложится очень большая нагрузка. Известен хрестоматийный случай, когда в одном из унаследованных приложений, выполнявшемся на мэйнфрейме, программа была вынуждена пройти через 3270 экранов, чтобы отыскать требуемые данные. Сейчас же для выполнения аналогичной задачи приложениям приходится пробираться через многочисленные HTML-страницы.
Революция метаданных
XML представляет собой метаязык, то есть язык, на базе которого можно определять свои собственные языки. Он предназначен не только для создания программного обеспечения, служащего для организации обмена данными в Web, но и для распознавания семантического значения этих данных.
Подобная платформа, по словам Бернерса-Ли, является очень мощным средством, позволяющим проектировать интеллектуальное программное обеспечение.
Скорее всего, XML не сможет полностью вытеснить HTML. В настоящее время Консорциум W3C работает над спецификациями языка расширяемых стилей Extensible Style Language (XSL), предназначенного для улучшенного представления данных, и XHTML, служащего для определения HTML-документов на базе XML.
В те недавние годы, когда технология XML еще только завоевывала всеобщее признание, Консорциум W3C разработал объектно-ориентированную платформу определения ресурсов Resource Definition Framework (RDF). Теги HTML использовались для определения стандартных конструкций (в частности, теги B и I применялись соответственно для выделения текста жирным шрифтом и курсивом). В свою очередь спецификации RDF поддерживают теги, позволяющие определять любые понятия (например, теги PRICE и INVOICE можно использовать для обозначения типов данных, соответственно, «цена» и «счет»). В этом случае просматривать всю страницу в поисках нужной информации совсем не обязательно.
Данным в формате RDF присваиваются дескрипторы, которые могут определяться в отдельных файлах определения типов документов Document Type Definitions (DTD). В каждой отрасли имеется свой, постоянно расширяющийся список DTD.
Бернерс-Ли предлагает использовать XML и RDF в качестве долгосрочных решений. Возможно, рано или поздно они позволят справиться с текущими задачами.
Синтаксис языков, позволяющих определять семантику, изобилует разнообразными сочетаниями косых линий (TAG ... /TAG). Подобные конструкции напоминают плохую математическую теорию (с такими теориями мне не раз доводилось сталкиваться в своей практике) — множество определений и полное отсутствие теорем.
Признанный знаток Internet Боб Меткалф в 1973 году изобрел Ethernet, а в 1979 основал компанию 3Com. Электронную почту ему можно направлять по адресу metcalfe@idg.net. Желающие также могут ознакомиться с Web-страницей Меткалфа www.idg.net/metcalfe.