.
Предприятия научились работать со структурированными данными — реляционные СУБД стали стандартным инструментом — но еще не всегда четко представляют, как управлять неструктурированными информационными активами, чтобы они не накапливались мертвым грузом, а работали на благо бизнеса.
В аналитических отчетах сейчас любят проводить параллель между историей развития СУБД и историей развития систем управления содержанием (content management). Управление структурированными данными прошло путь от тесной интеграции соответствующих функций в конкретные приложения к независимым, но частным решениям и затем к стандартизации реляционной структуры баз данных и консолидации рынка в руках нескольких основных поставщиков, прежде всего — Oracle, IBM и Microsoft. Зачатки управления неструктурированными информационными ресурсами появились спустя десять лет после первых реализаций систем управления структурированными данными, и эта функциональность также проходила фазы полной интеграции с приложениями, а затем постепенного отчуждения и превращения в независимые решения. Проблема современного этапа развития Enterprise Content Management (ECM) сходна с ситуацией на рынке СУБД в преддверии появления первых реализаций реляционной модели. Предлагаемые в изобилии разноплановые системы поддерживают управление разными категориями неструктурированных данных. Отсутствует совместимость между решениями разных поставщиков, а у их заказчиков преобладают несвязанные между собой инструменты управления для разных типов информационных активов (электронный документооборот, управления Web-содержанием, управление изображениями и т.д.). Следующим эволюционным шагом должна стать стандартизация форматов представления неструктурированных данных (XML дает реальные предпосылки для этого) и реализация общих корпоративных платформ управления содержанием вместо разрозненных решений. Видимо, неминуема и консолидация рынка, выделение ключевых поставщиков, системы которых будут обладать максимально полной функциональностью и смогут претендовать на роль единой инфраструктуры управления содержанием.
Впрочем, лидеры уже известны. Продолжая сравнение с СУБД, можно сказать, что Documentum постепенно становится «Oracle» рынка управления содержания, задавая тон глубиной и всеохватностью своей платформы; за ней вплотную движутся FileNet и IBM. Большой интерес представляют также усилия, которые предпринимает Microsoft по продвижению своих решений в этой области. Предложения компании нацелены на рынок малого и среднего бизнеса, который все больше интересуется средствами управления содержанием. Кстати, на интерес к внедрению таких систем со стороны компаний самого разного уровня влияет введение в Соединенных Штатах и в ряде европейских стран государственных регламентов, определяющих нормы хранения корпоративной информации, а также снижение цен на аппаратные системы внешней памяти. Но активное освоение Microsoft рынка ЕСМ может означать и то, что эти системы, которые, возможно, многими до сих пор воспринимаются как решения «для избранных», постепенно станут столь же распространенным, если не обязательным элементом ИТ-инфраструктуры, как текстовый редактор и СУБД.
WCM как часть ЕСМ
Международная ассоциация AIIM International, которая занимается проблемами управления документами, содержанием и бизнес-процессами, определяет ЕСМ как «совокупность технологий, средств и методов, которые используются для сбора, управления, безопасного хранения и предоставления пользователям содержания, имеющего отношение к различным процессам в организации» [1]. Под содержанием (content) подразумеваются как традиционные электронные текстовые документы, так и множество других типов неструктурированных данных, включая графику, картинки, метаданные, мультимедиа, таблицы стилей, сводки новостей и т.д. С середины 90-х, когда Internet-технологии стали активно эксплуатироваться компаниями в достижении своих бизнес-целей, сформировалось отдельное направление управления Web-содержанием (Web Content Management, WCM). По определению AIIM, «WCM представляет собой совокупность технологий и дисциплин для управления и эксплуатации неструктурированных информационных активов, которые предоставляются пользователям автоматически и в персонализированной форме посредством Web-сайтов» [2]. Как отмечают аналитики Meta Group [3], у большинства компаний за последние два года проявилась потребность в рационализации своего информационного хозяйства, на котором базируются внешние Web-сайты и ресурсы корпоративных сетей, и которое подчас находится в состоянии хаоса. И это стало важным движущим фактором развития рынка WCM-систем. Один из представителей этого рынка — Microsoft Content Management Server.
Системы управления Web-содержанием фокусируются на задачах создания, хранения, контроля и публикации страниц HTML и ASP, изображений, XML-файлов, текстовых документов и мультимедиа. WCM в целом можно представить как процесс, включающий в себя четыре последовательных этапа (рис. 1):
- создание - процесс получения или автоматической генерации содержания;
- хранение и организация - процессы сохранения, организации доступа, обновления, сопоставления и объединения Web-содержания из различных источников;
- доставка и персонализация - процесс оптимизации содержания в соответствии с контекстом, размещением, прикладными задачами, языком и текущими требованиями его потенциального получателя.
- администрирование и конфигурирование - управляющие процессы для обеспечения доступности, безопасности и масштабируемости системы WCM.
Рис. 1. Процессы управления Web-содержанием
На этапе создания система WCM должна организовать безопасную среду, в которой операции формирования и управления Web-содержания не потребуют специальных знаний и сложного инструментария. На ранних этапах активного освоения Сети создание сайтов было привилегией только избранных Web-мастеров, которые получали от пользователей необходимое содержание, переформатировали его и включали в шаблоны Web-страниц. Ключевой возможностью современных систем WCM является полная автоматизация этого процесса, которая делает пользователей полноценными участниками создания, а не просто потребителями Web-страниц. На этапе создания система WCM получает на входе произвольный электронный файл, содержимое которого должно быть представлено на Web-странице, а на выходе полностью определяет содержание этой страницы, ее структуру и метаданные. Ключевые стандарты, на которые опирается реализация первого этапа процесса управления Web-содержанием, включают язык HTML для описания Web-страниц, XML для определения структуры страницы и XSLT, позволяющий определить стиль Web-страницы.
Среди пользователей системы WCM могут быть как неспециалисты, которым требуется возможность обновления текстовых документов на страницах корпоративных сайтов, так и профессиональные разработчики Web-сайтов, а также различные приложения. Для непрофессионалов развитая система WCM предоставляет среду, в которой параметры размещения информации на странице, средства для обеспечения безопасности, контроля прав доступа и тестирования полностью скрыты, благодаря чему пользователь получает возможность вносить изменения в содержание Web-страницы с помощью простых, интуитивно понятных операций. Квалифицированным Web-дизайнерам предоставляются более сложные средства редактирования, позволяющие обрабатывать различные форматы файлов, интегрировать различные типы данных и т.д. Однако создавать Web-содержание могут не только люди, но и приложения, поэтому система WCM должна включать в себя возможности размещения информации на сайтах для прикладных бизнес-решений, а также специализированных систем по распределению аудио- и видеоинформации и профессионального мультимедиа.
Что касается хранения Web-содержания, то преимуществом современных средств WCM является возможность организации единого виртуального репозитория, даже если на самом деле он является распределенным по различным сетям, архивам и другим источникам. Функциональность хранения и организации в WСМ позволяет задать параметры защиты, доступности и возможностей использования для любых типов неструктурированных данных с помощью метаданных, средств классификации, категоризации и поиска. Процессы этой фазы управления Web-содержанием отвечают за определение атрибутов или метаданных для контроля за всеми этапами жизненного цикла содержания и извлекают информацию из обычных файловых систем, репозиториев сложных систем управления документами наподобие Documentum или FileNet, бизнес-приложений, внешних источников в Сети и т.д. На стадии организации содержания различные исходные файлы объединяются для создания Web-страницы. Ссылки на внешнее содержание вставляются в процессе создания страницы. Создание и встраивание ссылок может быть реализовано в редакторе, который используется на этапе создания Web-страниц, и содержание из внешних источников часто помещается в кэш Web-страницы для ускорения процесса доставки.
На этапе доставки и персонализации содержания ключевым процессом для современных систем WСМ является возможность в динамическом режиме создавать страницы, содержание которых ориентировано на потребности определенных лиц или групп. Для этого необходима дополнительная база данных для хранения информации о пользователях. Система WСМ устанавливает правила применения пользовательских профилей при предоставлении им персонализированного содержания. Персонализация может базироваться и на выделении общих принципов поведения некоторого сообщества взаимодействующих между собой пользователей. Дополнительным инструментом анализа потребностей пользователей может быть средство добычи данных.
Последним этапом управления Web-содержанием являются процессы администрирования и конфигурирования Web-сайтов. Как правило, управление содержанием для корпоративных систем, ориентированных на поддержку совместной работы сотрудников, сопряжено с достаточно рутинными и в то же время требовательными к вопросам безопасности процессами администрирования. В WCM управление ориентировано на Web-сайты и реализует различные модели электронного взаимодействия компании со своими клиентами и партнерами. Администрирование и конфигурирование Web-содержания должно поддерживать возможности быстрого восстановления при сбоях работы сайта, кэширование для обеспечения бесперебойной работы в моменты пиковой нагрузки, поддержку многоязыковой среды, интеграцию с центрами обработки вызовов и системами типа help desk, интеграцию с транзакционными системами партнеров компании для осуществления финансовых операций и т.д.
Управление содержанием в исполнении Microsoft
Централизованный подход к созданию, организации и публикации корпоративного Web-содержания реализован в системе Microsoft Content Management Server (CMS) 2002. Сервер, реализованный на платформе .NET, использует все возможности этой архитектуры и предоставляет системным администраторам и разработчикам средства построения Web-сайтов с использованием технологий ASP.NET и Web-сервисов. CMS позволяет включить управление Web-содержанием в среду совместной работы путем интеграции с инструментарием Visual Studio .NET и серверами Microsoft Commerce Server и SharePoint Portal Server. Бизнес-пользователи, не имеющие квалификации в Web-дизайне и разработке, могут использовать CMS для создания и публикации Web-содержания с помощью браузера или непосредственно из Word.
CMS хранит содержание в виде объектов, а сборка Web-страниц производится по запросу из специального кэша. Благодаря этому определенное содержание может неоднократно использоваться для разных целей без специального программирования и дублирования. Одно и то же содержание может разделяться между несколькими Web-страницами на сайте. Построенный с помощью CMS сайт имеет древовидную структуру (рис. 2) и включает следующие типы объектов:
Рис. 2. Структура Web-сайта в CMS |
- шаблон (template) - исходный файл в форматах ASPX, ASP или ASCX, который создается для описания общего вида некоторого множества страниц сайта и содержит исполняемый код;
- контейнер (container) - виртуальные хранилища для организации Web-страниц и содержания (в CMS предусмотрены контейнеры трех типов);
- канал (channel) - контейнер для хранения структуры страниц Web-сайта;
- галерея шаблонов (template gallery) - контейнер для управления доступом к шаблонам;
- галерея ресурсов (resource gallery) - контейнер для хранения графики, аудио и видеофайлов.
Архитектура CMS (рис. 3) включает две основные категории компонентов: средства разработки сайта и средства создания содержания.
Рис. 3. Компоненты CMS |
Средства разработки сайта
Инструменты разработки сайта в CMS предназначены для формирования структуры, построения и поддержки работающего Web-сайта. Ядром является Content Server, который динамически создает Web-страницы из объектов содержания и шаблонов. Он включает в себя интерфейсы Internet Server API и Publishing API, которые обеспечивают программируемый доступ к объектам MCMS и предназначены для построения динамических, настроенных на задачи определенных пользователей Web-сайтов и их интеграции с другими приложениями. Для отображения содержания на Web-странице используются компоненты Placeholder Controls (placeholder — текстовый или графический элемент электронного шаблона страницы, заменяемый реальным элементом), которые также могут использовать Publishing API для доступа к определенным версиям содержания. Различные Placeholder Controls отвечают за вывод различных типов содержания — текстов, графики и вложений.
Информацию о структуре и содержимом Web-сайта Content Server получает из централизованного репозитория для хранения содержания Content Repository, построенного на базе Microsoft SQL Server. Разделение хранения объектов содержания, кодов и элементов дизайна сайта упрощает использование содержания в динамическом режиме, например, при решении задач персонализации.
Компонент Site Manager автоматизирует выполнение административных задач по созданию и поддержке Web-сайта, предоставляя средства для организации контейнеров всех типов, определения ролей пользователей и контроля прав доступа. Использование в составе CMS клиента Visual Studio .NET позволяет создавать шаблоны Web-сайтов в этой среде разработки.
Средства создания содержания
Компонент Web Author — основной инструмент создания, редактирования и публикации содержания. Все операции осуществляются через браузер и не требуют специального клиентского программного обеспечения. Web Author дает возможность множеству пользователей одновременно работать над различными элементами одного и того же Web-сайта и оперативно размещать на нем свежую информацию. Консоль Web Author предоставляет пользователям меню средств создания и редактирования содержания, которое может быть соответствующим образом настроено разработчиками шаблонов с помощью Visual Studio .NET.
Дальнейшее упрощение задач создания и публикации содержания обеспечивает компонент Authoring Connector, который автоматизирует процессы утверждения и публикации на Web-сайте документов Word. Любой пользователь, неискушенный в вопросах дизайна и публикации в Web, может создать документ в обычном текстовом редакторе и затем, обратившись к Authoring Connector, отправить его на сайт, сопроводив, при необходимости, дополнительной информацией, например, об ограничениях периода публикации. Никаких других знаний о функциях CMS ему не потребуется. Таким образом, Authoring Connector обеспечивает создание содержания непосредственно в среде Word, причем не только простых текстовых документов, но и более сложных, включающих такие встроенные объекты, как изображения, видеофайлы и таблицы Excel.
Различные компоненты CMS предназначены для поддержки функций четырех основных категорий ролей пользователей этого сервера.
- Разработчик сайта отвечает за построение инфраструктуры, на базе которой будет развернут Web-сайт, реализует шаблоны для Web-страниц, организационную структуру шаблонов и схему навигации сайта. Эта роль - основной "пользователь" клиента Visual Studio .NET в составе CMS.
- Системный администратор отвечает за контроль параметров безопасности сайта, включая средства аутентификации, а также за развертывание работающего сайта. Для автоматизации задач этой роли предназначен компонент Site Manager.
- Менеджер сайта реализует структуру сайта и также использует возможности Site Manager.
- Автор сайта создает, редактирует и публикует содержание, являясь основным пользователем компонентов Web Author и Authoring Connector.
Кирпичик на фундаменте .NET
Многими своими возможностями CMS обязан интеграции с платформой .NET. На основе .NET Framework поддерживается управление XML-содержанием, обеспечивающее интероперабельность, необходимую для включения в Web-сайты информации из унаследованных систем, бизнес-приложений и систем от партнеров. Специальный тип объекта в CMS позволяет создавать и хранить XML-содержание, а также применять таблицы стилей формата XSLT для вывода содержания и XML Schema Definition для реализации правил проверки данных. Сервер также включает интерфейсы для импорта и экспорта XML-содержания, и может взаимодействовать с использующим XML сервером MS BizTalk Server для интеграции данных из унаследованных систем.
Интеграция с .NET Framework и ASP.NET обеспечивает и такую важную для управления Web-содержанием возможность, как поддержка Web-служб, потенциально открывающую путь к интеграции сайтов и содержания, созданных и управляемых с помощью CMS, с разнообразными приложениями, независимо от платформы и языка их разработки. Для сервера управления содержанием от Microsoft, который по природе своей замкнут на инфраструктуру этой компании, подобные возможности имеют очень большое значение.
Тесная интеграция CMS и Visual Studio .NET формирует единую, динамическую среду разработки Web-сайта, которая обеспечивает доступ к объектной модели CMS, средствам создания и управления шаблонами сервера управления содержанием и одновременно ко всем возможностям по поддержке цикла разработки в Visual Studio .NET, например, средствам отладки кода.
CMS взаимодействует с другими серверами на платформе .NET, обеспечивая формирование единой среды совместной работы для их пользователей. Управление Web-содержанием, например, может стать важным элементом портальных технологий, и не только потому, что позволяет сделать портал информационно насыщенным, но и потому, что дает бизнес-пользователям реальные инструменты для контроля за своими данными, освобождая тем самым администраторов от утомительной работы по ежедневной публикации содержания на портале. Интеграция CMS с SharePoint Portal Server автоматизирует доступ пользователей портала, построенного на базе этого сервера, к содержанию из репозитория CMS и позволяет создавать сайты с интегрированными портальными сервисами — поиском, управлением документами и функциями работы с накопленными знаниями. CMS может служить для пользователей портала не только в качестве централизованного хранилища содержания и инструмента для его создания и публикации. Портал, интегрированный с CMS, получает механизм управления потоками работ, который отвечает за утверждение содержания перед его публикацией на сайте и реализован на ролевой основе.
В CMS реализован также специальный компонент Content Connector для сервера Commerce Server, поддерживающего реализацию систем электронной коммерции. Эта интеграция обеспечивает создание Web-содержания для таких систем, построение Web-сайтов с интегрированной функциональностью электронной коммерции, персонализацию сайтов с помощью выделения содержания для определенных групп пользователей на выбранных страницах, реализацию средств анализа сайтов и т.д.
Среди других возможностей CMS надо отметить средства планирования содержания, которые автоматизируют процесс составления расписания для публикации и архивирования, гарантируя своевременность публикации. Персонализация предоставления содержания поддерживается путем динамической сборки страниц на базе пользовательских профилей и аналитической информации.
Обеспечивая разнообразие возможностей по централизованному управлению Web-содержанием, сервер CMS, однако, не является полнофункциональной системой ЕСМ. Как подчеркивают аналитики Patricia Seybold Group [4], Microsoft пока предлагает только один из строительных блоков для инфраструктуры на платформе .NET, который обеспечивает функциональность WCM и не более. Правда, дополнительные преимущества дает интеграция между разными серверными решениями Microsoft и со средой разработки Visual Studio .NET. Это позволяет получить нужную конфигурацию системы для создания, представления и управления жизненным циклом документов и других типов неструктурированной информации в Web, будь то сервер электронной коммерции, внешний информационный корпоративный портал или портал, нацеленный на поддержку совместной работы. И все это, естественно, в рамках среды, ориентированной исключительно на продукты Microsoft. Хотя на обеспечение гетерогенности направлены включенные в CMS средства поддержки XML и Web-сервисов, однако сильная зависимость от .NET не позволяет предположить, что CMS найдет широкое применение на других платформах.
В настоящее время в Microsoft ведутся работы над новой серверной архитектурой Jupiter, которая должна обеспечить полную интеграцию средств управления Web-контентом с управлением бизнес-процессами и электронными коммуникациями. Однако первоначальные планы по выпуску этого сервера сильно скорректированы и более четкие очертания эти инициативы получат не раньше, чем в конце 2005 года. По прогнозам, до выхода Jupiter от Microsoft не стоит ожидать каких-либо серьезных усовершенствований в области возможностей управления содержанием, хотя компания продолжит развивать свои продукты в рамках общей стратегии развития платформы .NET.
ЕСМ в операционной системе
Помимо отдельного сервера для централизации процессов создания, хранения и публикации Web-содержания Microsoft предоставляет возможности создания Web-сайтов для разделения информации и совместной работы с документами, интегрированные непосредственно в инфраструктуру Windows Server 2003. Сервисы Windows SharePoint Services (WSS) расширяют функциональность MS Office System средствами совместной работы пользователей над документами, задачами и проектами. Таким образом, традиционный инструмент автоматизации индивидуальной офисной деятельности становится инструментом для повышения продуктивности рабочих групп. WSS реализует необходимые атрибуты системы управления документами, включая механизмы блокировки и контроль версий, а также различные средства для организации коммуникаций между пользователями. Кроме того, WSS позиционируется как платформа для разработки дополнительных возможностей и специальных приложений по управлению и совместному использованию документов. Не так давно Microsoft реализовала в CMS специальный коннектор для SharePoint, который упрощает публикацию документов с сайтов рабочих групп на Web-сайтах под управлением CMS и наоборот.
WSS также не является полномасштабной ЕСМ-системой и возможности этих сервисов ограничены базовой функциональностью управления документами в рамках рабочей группы, но примечательно, что WSS, по существу, являются составной частью операционной системы и тесно интегрированы с офисными приложениями от Microsoft, что расширяет круг потенциальных пользователей функций ЕСМ, пусть и достаточно ограниченных. Продвижение WSS в совокупности с другими серверами, обеспечивающими различные аспекты управления содержанием и совместной работы, такими как CMS, SharePoint Portal Server, Commerce Server, будет способствовать не только укреплению позиций Microsoft на рынке ЕСМ, но и активному привлечению к использованию возможностей ЕСМ предприятий малого и среднего бизнеса.
Литература
- Planning for an Enterprise Content Management System. AIIM International, 2004.
- Document and Web Content Management. AIIM International, 2003.
- Content Infrastructure. Meta Group, January 2004.
- Geoffrey Bock. Understanding the Strategies of Major Enterprise Content Management Suppliers. Patricia Seybold Group, November 2003.
Продукты Microsoft для управления содержанием и совместной работы
SharePoint Portal Server 2003. Сервер для построения порталов различного назначения. Интегрирует информацию из различных систем по принципу единого входа, реализует функции развертывания и управления порталом, обеспечивает сбор и организацию данных для совместной работы и инструменты поиска, поддерживает возможности персонализации содержания, в том числе с учетом роли пользователя в организации и его персональных интересов, членства в той или иной рабочей группе, параметров безопасности и по другим критериям. SharePoint Portal Server интегрирован с CMS, BizTalk Server и WSS.
Content Management Server 2002. Сервер управления Web-содержанием. Интегрирован с серверами: SharePoint Portal Server для реализации поиска и средств управления потоком работ; BizTalk Server для агрегирования содержания; Commerce Server для персонализации и аналитики.
Commerce Server 2002. Сервер для построения решений электронной коммерции. Предоставляет платформу для разработки сайтов, средства обратной связи и аналитики. Интегрирован с серверами CMS для управления Web- содержанием и BizTalk Server для корпоративной интеграции.
BizTalk Server. Сервер интеграции приложений предприятия (enterprise application integration, EAI) и управления бизнес-процессами, поддерживающий взаимодействие внутри организации и с внешними партнерами. Интегрирован с серверами CMS для управления Web-содержанием и Commerce Server для сквозной обработки транзакций.
Windows SharePoint Services. Средства на базе Web для управления документами и организации совместной работы в рабочей группе.
SQL Server. Сервер управления базами данных и анализа данных, используется всеми решениями по управлению содержанием и организации совместной работы в качестве базового хранилища информации.