Удивительное дело - до сих пор у традиционного мира электронного обмена данными (electronic data interchange, EDI) между корпорациями и набирающей обороты электронной торговлей на базе Web было довольно мало общего.

Один из характерных признаков традиционного EDI - широкое использование стандартных форматов обмена данными, называемых наборами транзакций (transaction sets), - в существующих HTML-приложениях для электронной торговли практически полностью отсутствует. В отличие от давно известных форматов наборов транзакций, в частности ANSI X12 и формата электронного обмена данными в управлении, торговле и на транспорте (EDI for Administration, Commerce and Transport, EDIFACT), форматы HTML не способны четко определять роль, значение и структуру каждого элемента данных, который они содержат.

Вполне возможно, что отсутствие универсальных условных обозначений для семантики данных, в частности ANSI X12 и EDIFACT, ускорит конец электронного обмена данными между корпорациями. Это случится, если деловые партнеры не договорятся о юридической интерпретации полей некоторых электронных документов, например заказов на покупку товаров или транспортных накладных.

Кроме того, программисты не смогут воспользоваться стандартной схемой, позволяющей разбивать входящие данные на отдельные документы, записи и поля. В результате стоимость разработки и обслуживания EDI-приложений окажется чрезмерно высокой.

Язык HTML - слишком ненадежная основа для сложных типов EDI. Для его использования необходим сложный подбор сценариев и апплетов, предназначенных для определения и выделения элементов данных, атрибутов и значений в загружаемый на браузер набор транзакций на базе форматов. Требованиям, предъявляемым EDI к обработке данных, не вполне соответствует даже хваленая технология Dynamic HTML. Дело в том, что она, как и HTML, была разработана главным образом для представления и отображения данных.

Однако консорциум W3C уже подготовил и собирается утвердить новый формат разметки информационных объектов в Web-страницах, получивший название Extensible Markup Language (XML). Он позволит разработчикам программ для Web определять гибкие объектно-ориентированные форматы документов для различных приложений. По сравнению с существующими структурами простых HTML-данных они обеспечивают более эффективное выполнение операций по просмотру, поиску и обработке данных. Браузер Internet Explorer 4.0 уже поддерживает XML, а компания Netscape Communications пообещала реализовать его поддержку в следующей версии Navigator.

Некоторые профессиональные ассоциации предложили использовать XML при кодировании наборов транзакций EDI.

Среди них следует отметить прежде всего ассоциацию XML/EDI Group, которая опубликовала на своем Web-узле (www.xmledi.net) проект под названием "Рекомендации по использованию XML для электронного обмена данными".

Возможно, со временем инициатива XML/EDI Group приведет к появлению законченного комплекса соответствующих стандартов. Важнее всего то, что это позволит передавать вместе с наборами транзакций полный комплект бизнес-правил EDI, шаблоны документов, программное обеспечение обработки данных, статус документооборота и дополнительные данные, а также гиперссылки для всего вышеперечисленного.

Благодаря этому новые деловые партнеры, осуществляющие электронную передачу данных через Web, смогут без промедления привести свои внутренние системы в соответствие с существующими системами документооборота между различными организациями. Эти системы базируются на стандартных отраслевых форматах сообщений и моделях процессов, ориентированных на XML. Применение EDI позволяет объединять соглашения о реализации, заключенные между деловыми партнерами, с транзакциями, которые они планируют использовать. Таким образом будет обеспечен доступ новых партнеров к электронным коммуникациям.

Ясно, что сформулировать все эти задачи гораздо легче, чем их решить. Программа, за выполнение которой взялась XML/EDI Group, поражает своими масштабами. Она включает в себя утверждение предложенного стандарта и ряд инициатив по его реализации (в частности, стандартизацию синтаксиса, определение типа документов и создание словарей определения полей, связанных с наборами транзакций EDI, которые написаны на XML).

На переписывание наборов транзакций EDI в соответствии с требованиями XML и согласование такой деятельности с организациями по поддержке стандартов ANSI X12 и EDIFACT, а также с консорциумом W3C, уйдет много лет. Потребуется перекодировать тысячи существующих стандартов наборов транзакций. Огромная по объему работа не только займет уйму времени, но и замедлит скорость реализации проекта, предложенного XML/EDI Group.

Идея создания стандартов EDI на базе XML уже сейчас получила в отрасли широкую поддержку. Это означает, что организации по утверждению стандартов следует уделить этому вопросу первоочередное внимание. После того как XML станет устойчивым стандартом, компаниям, использующим EDI, необходимо будет создать на его основе пробные сети extranet с ограниченными возможностями. Создание таких сетей позволит дополнить стандартные наборы транзакций оболочкой из ряда метаданных и гиперссылок на внутренние базы данных.

Познакомившись с возможностями программирования на языке XML в части сбора необходимых EDI-данных в Web-страницах и унаследованных системах, вы убедитесь, что XML обещает стать основой будущих разработок, насыщенных данными Web-приложений.


Джеймс Кобайлас - главный аналитик компании LCC International, которая занимается проектированием, разработкой и интеграцией сетей. Его адрес - kobielus_james@lccinc.com.

IBM инвестирует в XML

Компания IBM возглавила движение ряда производителей за внедрение языка Extensible Markup Language (XML) в сферу корпоративных баз данных. При этом корпорация действует сразу в нескольких направлениях.

Во-первых, планируется расширить DB2 функциями обработки данных, снабженных тегами XML, что предоставит корпоративным пользователям более широкие возможности текстового поиска. Помимо этого, IBM собирается выпустить вскоре синтаксический анализатор XML, написанный на языке Java и поддерживающий классы и методы, что поможет пользователям производить синтаксический анализ, генерировать и обрабатывать XML-документы.

Несмотря на то что XML в основном применяется для подготовки публикаций, некоторые аналитики считают, что этому стандарту суждено завоевать всеобщее признание.

Язык XML, подмножество языка Standardized Generalized Marlup Language, быстро развивается как метаязык для создания наборов тегов, специфичных для конкретной отрасли или определенных приложений. Если теги XML построены на основе данных, эти данные становятся объектом, который может распознать любой совместимый с XML механизм поиска или приложение. Благодаря этому появляется возможность разблокировать большие объемы данных, поскольку отпадает необходимость в создании специализированных каналов связи между базой данных и Web.

Базы данных могут хранить текст HTML и XML в виде больших бинарных объектов (Blob), не вникая во внутреннее содержание данных, однако применение "родного" языка XML в DB2 позволит базе данных выступать в качестве совершенного средства построения интеллектуальных Web-узлов. Так считает Джеффри Джонс, менеджер компании IBM по маркетингу средств управления данными.

Поддержка XML позволит более гибко манипулировать с текстом, чем при использовании HTML, кроме того, упрощается связь с соответствующими Web-узлами.

"Если вы, как и большинство создателей динамического информационного наполнения, хотите иметь базу данных за пределами своего Web-узла, вас, скорее всего, не устроит то, что она вся окажется помещена в Blob", - объясняет Дон Депалма, главный аналитик компании Forrester Research. Ее конкурент - компания Informix Software - уже поддерживает XML в своей архитектуре.

Кроме того, недавно Microsoft, ArborText, DataChannel и Inso передали предложение по спецификации XML-данных для описания схемы базы данных или его структуры на рассмотрение World Wide Web Consortium.

- Пол Крил, Линда Радосевич,
InfoWorld, США