«Открытые cистемы»

Еще со времен пятидорожечной перфоленты, придуманной более 150 лет назад, и вплоть до современности любые технологии хранения текстов предполагали, что сведения о формате, в котором они представлены, хранятся отдельно от самих текстов, в виде неких таблиц или описаний. Времена менялись, вместе с ними менялись и технологии. В итоге за несколько десятилетий существования компьютеров скопилось бесконечное количество различных форматов, и обнаружилась малоутешительная истина: оказывается, если вы по какой-то причине теряете доступ к описаниям форматов, то любые объемы данных превращаются в лишенную какого-либо смысла последовательность символов, не более того

Дальнейшее движение по пути создания специализированных форматов в конечном итоге ведет в тупик. К счастью, с появлением XML открылась возможность выхода из этого неприятного положения: этот язык можно использовать в качестве универсального средства описания форматов непосредственно в теле информационных структур, в результате описания форматов и собственно данные начинают существовать в связке. Элементы разметки дают возможность выделить в потоке символов некоторые их последовательности, а также контейнеры, содержащие значимые коды. Актуальность подобного решения сегодня очевидна как никогда прежде, однако идея совмещения описания формата с данными отнюдь не нова, она впервые была реализована в конце 50-х годов в революционном по тому времени языке Lisp, предусматривавшем для этой цели специальные S-выражения.

Повышенное внимание, проявляемое в западных странах к архивированию и хранению документов, стимулировано не только развитием технических возможностей, но и множеством нормативных актов, определяющих требования к надежности хранения различного рода неструктурированных или полуструктурированных данных в бизнесе, науке, медицине и других областях. Однако полноценное архивирование до сих пор сдерживается отсутствием общепринятых стандартов представления документов. Проблему стандартизации призвана была решить общественная организация OpenOffice.org, созданная несколько лет назад в том числе и для того, чтобы выработать открытый общедоступный стандарт для представления документов OpenDocument Format (ODF). После того, как стандарт был создан и утвержден международной организацией OASIS, он стал известен как OASIS OpenDocument Format for Office Applications. Стандарт ODF распространяется на текстовые документы, электронные таблицы, различного рода графики и презентации. ODF предлагается в качестве альтернативы наиболее популярным частным форматам, DOC, XLS и PPT, используемым в Microsoft Office сейчас, а также готовящемуся формату Microsoft Office Open XML.

Перечисленные форматы Microsoft во многих случаях приобрели статус стандартов де-факто, однако им присущ целый ряд недостатков. Так, среди слабостей формата DOC отмечаются возможность заражения и переноса вирусов, слишком большой объем вспомогательных данных по отношению к содержательным данным, привязка к устройствам отображения определенных типов и ряд других. Файлы в формате DOC содержат множество сведений о форматировании (в том числе скрипты и сведения об операциях), что снижает их совместимость. Аналогичные слабости можно найти и в других форматах. До тех пор, пока документы использовались в локальном режиме, эти слабости не были особенно критичными, однако при использовании документов в приложениях к электронным письмам их значение многократно возрастает. Хранить серьезные документы в формате DOC не рационально, поэтому далеко не случайно, что с 1987 года в Microsoft вынуждены поддерживать свой собственный альтернативный формат Rich Text Format (RTF); он обеспечивает обмен документами между платформами, кроме того, в отличие от большинства других форматов доступен для чтения человеком. Всего же по действующему в США законодательству хранение документов, помимо RTF, допускается еще в формате ASCII (American Standard Code for Information Interchange), а также в двух открытых стандартах компании Adobe — PDF (Portable Document Format) и EPS (Encapsulated Post Script).

Становление стандарта ODF сопровождается несколькими крупными публичными акциями. Среди них обсуждение стандарта в странах Евросоюза на протяжении с 2003-го по 2005 год, бурные и драматичные события прошедшей осени, когда руководство штата Массачусетс (США) официально перевело свое делопроизводство на формат ODF, а также менее масштабные эпизоды в других странах. Не меньший вал дискуссий вызывают трактовки лицензирования в понимании OASIS и Microsoft соответственно. Но оставим в стороне внешнюю сторону событий: технологическая судьба ODF не менее интересна.

Инициаторами создания OpenOffice.org стали компании Adobe, Arbortext, Corel, IBM, KDE, SpeedLegal и, конечно же, Sun Microsystems. Имена представителей последней доминируют среди авторов документов, сопровождающих стандарт. В первой редакции стандарт был готов в 2001 году. Процесс утверждения затянулся на годы, первое обсуждение в OASIS состоялось в декабре 2002-го, а принятие в качестве стандарта — только в мае 2005 года. Все это время шла доработка исходного предложения OpenOffice.org, в него включались предложения и замечания от отдельных специалистов и целых компаний. Одной из главных целей совершенствования стало обеспечение возможности для включения старых, зачастую вышедших из употребления стандартов, существовавших на протяжении последних трех десятилетий. Итогом работы стал документ Open Document Format for Office Applications (OpenDocument) v1.0, OASIS Standard, датированный 1 мая 2005 года. Этот весьма объемистый труд занимает более 700 страниц. Сейчас OASIS передает стандарт ODF объединенному техническому комитету Международной организации по стандартизации (ISO) и Международной электротехнической комиссии (ISO/IEC) для утверждения в качестве внутреннего стандарта. Ожидается, что в скором времени он будет переведен в разряд «общедоступной спецификации». Следуя процедуре, стандарт ODF должен был также передан для ратификации в W3C. Но пока оттуда никакой реакции не последовало, не исключены определенные проблемы лоббирования.

Но процесс продвижения стандарта продолжается. Из числа последних событий можно отметить встречу OpenDocument Summit, организованную IBM и Sun в ноябре, в которой приняли участие Oracle, Google, Adobe, Novell, Red Hat, CA, Corel, Nokia, Intel и ряд более мелких компаний. В ответ на предпринимаемые инициативы корпорация Microsoft опубликовывала в сентябре 2005 года свои собственные форматы семейства Office Open XML Format. Взвешенных мнений, сравнивающих достоинства форматов, исходящих из двух лагерей, пока нет. По всей видимости, весь следующий год пройдет под знаком противоборства Office Open XML и ODF. У каждой из сторон есть сильные аргументы, а у наблюдателей — время на то, чтобы спокойно дождаться результатов противостояния.


Форматы документов: важные вехи

Дальнейшее движение по пути создания специализированных форматов в конечном итоге ведет в тупик. К счастью, с появлением XML открылась возможность выхода из этого неприятного положения: этот язык можно использовать в качестве универсального средства описания форматов непосредственно в теле информационных структур, в результате описания форматов и собственно данные начинают существовать в связке

1858, 1866-67 гг. — первые применения перфоленты — трансмиттер Уитстона и наборная машина русского изобретателя Петра Княгининского (1839-1870).

1967 г. — американский полиграфист Уильям Танниклиф предлагает метод разметки «обобщенным кодированием» (generic coding); позже этот метод стал основой полиграфического стандарта GenCode.

1987 г. — Microsoft реализует поддержку собственного альтернативного формата Rich Text Format (RTF).

1996 г. — при поддержке консорциума W3C и корпорации Microsoft начата разработка нового языка разметки силами рабочей группы, насчитывавшей 11 человек, под руководством известного эксперта в области программирования в открытых кодах Джеймса Кларка. Им же и было предложено название нового языка — XML.

8 декабря 1998 г. — спецификация XML 1.0 предложена для оценки и ратификации в W3C.

Август 2000 г. — объявлено о создании рабочей группы OpenOffice.org.

Май 2002 г. — опубликована версия OpenOffice.org 1.0.

23 мая 2005 г. — OASIS ратифицирует ODF 2.0.

Сентябрь 2005 г. — власти штата Массачусетс обнародовали план перехода с офисных приложений Microsoft и других производителей на системы, реализованные на базе открытых стандартов, в том числе стандарт ODF 2.0. В ответ на предпринимаемые инициативы корпорация Microsoft публикует свои собственные форматы семейства Office Open XML Format.

Октябрь 2005 г. — группа OASIS передает стандарт ODF 2.0 в Международную организацию по стандартизации (ISO).

Декабрь 2005 г. — Microsoft объявляет о намерении предложить технологию файлового формата Office Open XML Format в качестве международного стандарта.