Cегодня нет и в помине технических барьеров, отделяющих привилегированных пользователей от остальных участников бизнес-процессов, — монитор, подключенный к корпоративной информационной системе, имеется у любого сотрудника, деятельность которого хотя бы в минимальной степени связана с принятием решений. Как следствие — произошла заметная эволюция самих работников, для них личная активность, оперативная реакция на происходящие события и принятие тактических решений становится нормой. Однако сохранялся разрыв в обеспечении всех этих новых пользователей нужными им данными и возможностями, а главное — ценой соответствующих систем.
Поиски путей преодоления такого разрыва в конечном итоге привели к появлению нового направления в бизнес-аналитике, получившего название Pervasive BI, что можно перевести как «вездесущий» или «тотальный» BI. Внедрение Pervasive BI на основе активных хранилищ данных (Active Data Warehousing) и сервисных архитектур SOA позволяет расширить круг пользователей BI до работников, находящихся на передовой бизнеса (линейных менеджеров), причем в форме, соответствующей их возможностям и полномочиям. Помимо изменения корпоративной культуры это оказалось еще и прибыльно — аккумуляция тысяч решений, принимаемых сотнями исполнителей, положительным образом влияет на прибыльность компании и на ее имидж.
Внедрение Pervasive BI зависит от поддерживающих подсистем и выдвигает к ним новые требования — классические подходы извлечения, трансформации и загрузки (Extract Transform Load, ETL) должны сочетаться со сбором данных из разных распределенных источников и c интеграцией данных в режиме реального времени. Как следствие — современные хранилища данных должны поддерживать смешанную нагрузку, состоящую из классических процедур загрузки в них данных для длительного хранения и стратегической аналитики этих данных. Они должны сочетать в себе средства для подготовки информации, ориентированной на тактическую аналитику. Нынешние BI-технологии должны анализировать все виды данных и поставлять оперативную информацию, как в виде традиционных отчетов, так и в более оперативной форме (например, предупреждений), а также выводить ее на корпоративные инструментальные панели. В такой интерпретации Pervasive BI можно рассматривать как средство обеспечения интегрированной информацией широкого круга участников бизнес-процесса: линейных менеджеров, поставщиков, потребителей и партнеров. Средствами Pervasive BI обеспечивается достоверное представление процессов, происходящих на предприятии и, следовательно, возможность для более точного принятия решений на всех этапах бизнес-процесса.
Для реализации такого подхода к BI компания Informatica предлагает использовать в качестве основы сервисную архитектуру в сочетании с традиционной инфраструктурой хранилищ данных. Сервисы можно разделить на три группы: Data Integration Services (сервисы интеграции данных), Decision Repositories (репозиторий решений) и Decision Services (сервисы решений). По совокупности они обеспечивают доступ к данным через Web-портал, Web-приложения, витрины данных, мобильные устройства, голосовые порталы и даже через торговые терминалы типа POS (Point of sale или point of service). Традиционные функции, связанные с накоплением данных, учетом системных ресурсов, реализуются с помощью транзакционных сервисов (Transaction services). В их числе такие приложения как CRM, ERP, SCM, а также и унаследованные системы. На рисунке представлена архитектура, сочетающая в себе традиционные BI-решения c SOA и активные хранилища данных.
Активные хранилища данных (Active Data Warehouse, ADW) реализуют поддержку процесса принятия решений в реальном времени (RT) или близком к нему (NRT). Они отличаются, во-первых, способностью реагировать на происходящие события и, во-вторых, способностью обрабатывать потоки запросов от множества пользователей или приложений. Кроме того, они отличаются тем, что обеспечивают доступ к данным для разных категорий пользователей, интегрируя информацию, поступающую из разных каналов, от разных объектов, позволяя использовать средства для раскопок данных (data mining) и моделирования для оперативной проверки гипотез.
Традиционные хранилища в основном получают данные от индикаторов производительности (Key Performance Indicator, KPI) и служат для глубокого анализа в таких сферах, как маркетинг, финансы и стратегическое планирование с участием ограниченного количества лиц, ответственных за принятие решений. Тактическое принятие решений не столь ответственно, оно сводится к тому, чтобы, например, ответить заказчику, как изменить грузопоток, как разумнее использовать те или иные ресурсы. Каждое из этих решений не имеет такого значения, как любое из стратегических, но здесь действует аккумуляционный эффект, множество правильных решений приносит огромную прибыль.
По определению принятие тактических решений более оперативно, чем стратегическое, поэтому при внедрении Active Data Warehousing необходимо пересмотреть сложившиеся соглашения об уровне сервиса (SLA), а именно, должна быть повышена частота обновления данных, производительность и доступность данных. Требуемый уровень этих показателей может быть достигнут с использованием преимуществ, предоставляемых сервисной архитектурой. За этими словами скрывается драматический сдвиг от парадигмы «извлечения» данных, основанный на пакетной диспетчеризации работ к парадигме принудительного распределения данных о событиях в режиме, близком к реальному времени. С внедрением Active Data Warehousing удается перейти от масштаба времени, измеряемого в случае стратегических решений днями и месяцами, к минутам и секундам.
Изначально технологии интеграции данных служили средствами для извлечения, трансформации и загрузки данных в хранилища, но на протяжении последних 10 лет они активно эволюционировали и постепенно превратились во всеобъемлющую, многопрофильную платформу для сбора, преобразования и интеграции данных, поступающих из различных источников, расположенных в гетерогенных системах. Обычно они реализуются с использованием Java Message Service (JMS) или каких-то иных систем обмена сообщениями, но с появлением сервисных архитектур решение задачи интеграции данных выходят на новый уровень. Их решение подчинено трем основным принципам SOA:
Слабая связанность и сервисы интеграции данных предоставляют недостижимую прежде гибкость, позволяя клиентским приложениям получать доступ к существенным для бизнеса данным вне зависимости от того, где эти данные находятся и в какой форме, единственное условие состоит в том, что эти данные должны быть точными и полными.
Компонентный подход обеспечивает такую форму представления данных, которая позволяет использовать их разным системам многократно без дополнительной переработки.
Подчинение открытым стандартам (XML, SOAP и WSDL) дает возможность интеграционным технологиям работать по всему стеку SOA, как на стороне поставщика, так и на стороне потребителя данных.
Сервисный подход обеспечивает универсальность доступа к данным, к метаданным, миграция на SOA открывает возможность для интеграции данных с использованием различных протоколов, не только протоколов Web-сервисов, но и JDBC/ODBC и JMS. Однако следует учесть, что внедрение архитектуры SOA требует преодоления не только технических сложностей — на ее пути могут быть и административный барьер, и даже барьеры, вызванные особенностями корпоративной культуры.