Создавая корпоративное информационное хранилище, ОАО РЖД прошло большой путь внедрения разнообразных систем бизнес-аналитики, начиная от средств формирования производственных показателей оперативной деятельности до развертывания отраслевой аналитической платформы.
Проект «Информационное хранилище МПС» стартовал в Главном вычислительном центре МПС (ГВЦ МПС) в 1998 году. Толчком к началу этих работ послужили сложности работы с разнородными базами данных ГВЦ, которые используют различные прикладные отраслевые системы (ДИСПАРК, АБД ПВ, ЕК ИОДВ, ДИСКОН и др.), оперирующие своим набором средств с основными объектами (поезд, вагон, груз, контейнер и т.д.). Чтобы при имеющемся разнообразии программного обеспечения и источников данных получить полную и объективную картину состояния дел в компании, требовалась консолидация информации из различных систем, что означает необходимость работы с разными визуальными интерфейсами и формами представления однотипных данных, а это иногда сопровождалось нестыковками показателей.
Подобная ситуация типична для корпоративных информационных систем во всем мире, поэтому вполне естественный выход — создание единого информационного хранилища МПС (ИХ МПС), в которое помещаются тщательно выверенные и унифицированные данные из различных систем, причем обязательно наличие метаданных, объединяющих разнообразную информацию в единое целое.
Другой важной предпосылкой построения ИХ стало состояние вычислительной инфраструктуры в ГВЦ МПС: мощные мэйнфреймы с дисковыми массивами большой емкости, высокоскоростные каналы связи с комплексной информационно-вычислительной сетью МПС, достаточно разнородный аппаратный ИТ-ландшафт МПС, состоящий из серверов разных производителей (IBM, Sun Microsystems и ряд других платформ).
Первоначально хранилище работало с данными по грузовым перевозкам, полученным из систем ЭТРАН (электронная транспортная накладная) и ЕК ИОДВ (единый комплекс интегрированной обработки дорожных ведомостей), и имело прямой доступ к «Модели перевозочного процесса сети» и «Автоматизированному банку данных вагонного парка», в которых хранятся детальные сведения об актуальном состоянии и дислокации вагонов с грузами, включая их паспортные характеристики.
Управление грузовыми перевозками предполагает работу с агрегированными данными о заявках на перевозки, сведениями об отправлении и прибытии грузов по станциям, отделениям, дорогам, административным районам и округам, государствам ближнего и дальнего зарубежья, грузоотправителям и грузополучателям, организациям-плательщикам и ряду других показателей. В состав анализируемых количественных и качественных показателей входят: объем перевозок грузов (в тоннах, вагонах и контейнерах), грузооборот, средняя дальность перевозок, провозная плата (в рублях и валюте), сумма скидки, доходная ставка и др.
Для эффективной работы с накопленным объемом оперативной информации требовалась система OLAP-отчетности, позволяющая отвечать на вопрос «Что и куда везут?».
Выбор платформы
Для МПС огромное значение в выборе платформы для решения имел отраслевой опыт потенциального партнера, поскольку МПС (теперь ОАО РЖД) — это огромная транспортная корпорация, не имеющая аналогов в мире, и технологический партнер должен был предложить адекватное решение для работы с колоссальными информационными фондами. Кроме того, в ОАО РЖД имеется собственная ИТ-служба, обладающая созданными за многие годы разнообразными системами: «Электронная транспортная накладная» — автоматизация всей коммерческой работы в сфере грузовых перевозок; «Экспресс» — автоматизация продаж билетов на пассажирских перевозках; внутренние информационные системы ОАО РЖД, например, ИОММ (информационная обработка маршрутного листка машиниста) и ряд других. Эксплуатацией информационных систем ОАО РЖД занимаются 18 вычислительных центров, расположенных по всей России.
«Прежде чем выбрать методологию и инструментарий для работы, специалисты ГВЦ в конце 1998 года реализовали несколько пилотных проектов, — рассказывает главный технолог ГВЦ ОАО РЖД Игорь Мовчиков. — Их результаты были одобрены Научно-техническим советом, и было решено создавать информационное хранилище на базе продуктов компании SAS». «Наша уверенность в успехе проекта для ОАО РЖД была основана на богатом опыте внедрения компанией SAS решений в транспортной отрасли по всему миру, — отметил Кирилл Бутаев, менеджер по развитию бизнеса SAS Россия/СНГ. — Например, крупнейший перевозчик Италии Trenitalia использует аналитику SAS для построения отношений с клиентами и для разработки новых услуг и тарифов, а железнодорожная компания США Union Pacific успешно прогнозирует спрос на услуги и планирует потребление ресурсов с помощью аналитической системы SAS Business Intelligence». С 1998 года началось активное сотрудничество ОАО РЖД (МПС) и SAS Россия/СНГ.
Правильный путь
В 2000 году проект создания информационного хранилища вошел в активную стадию внедрения — возросло количество пользователей, расширился их круг, появились новые группы потребителей ИТ-услуг из различных служб железных дорог и эксплуатационных департаментов. Информационные потребности этих групп пользователей часто дополнились вопросом: «Чем везут?», ответом на который стало создание нового среза ИХ — «Вагонные парки». Эта подсистема аккумулирует информацию как из моделей перевозочного процесса железнодорожной сети, так и из баз данных вагонного парка. Для обработки сведений о состоянии, местонахождении и других характеристик парка грузовых вагонов были разработаны приложения, позволяющие проводить анализ распределения вагонов по объектам дислокации (станциям, отделениям, дорогам, депо), типам парка (рабочий, нерабочий, резерв, запас и др.), роду подвижного состава и т.д. Путем отслеживания передач вагонов по стыковым междорожным и межгосударственным пунктам выявляются непроизводительные простои вагонов на дорогах и станциях, нарушения в погрузке и работе вагонов на кольцевых маршрутах, контролируется продвижение вагонов в адреса припортовых станций и пограничных переходов, проведение всех видов ремонтных работ, а также время нахождения «чужих» вагонов на территории России и на территории других администраций железных дорог и др.
Одновременно назрела необходимость совершенствования базовой технологии хранилища. Был осуществлен переход с версии SAS 6.12. на версию 8.2, которая предлагала не только совершенствование «движка» информационного хранилища, но и включение ряда дополнительных продуктов, автоматизирующих процесс администрирования ИХ. Суть назревших перемен была связана в первую очередь с резким ростом объемов информации в хранилище и ее разнообразием, а также разнородностью и многообразием информационных запросов пользователей. Возникла потребность в специальных средствах управления ИХ и соответствующих дополнениях методологии проекта. В результате, в 2002 году ИХ окончательно оформилось в глобальный отраслевой многоверсионный проект с постоянной интерактивной поддержкой всех групп пользователей — Корпоративное информационное хранилище (КИХ).
Среди основных технологических трудностей развертывания КИХ в первую очередь можно отметить экспоненциальный рост количества пользователей — только за 2003 год их число утроилось. Кроме того, проект был реализован по технологии «толстого клиента», причем реализация считалась столь удачной, что долгое время в ГВЦ от него не отказывались. Однако в технологии «толстого клиента» приходилось специально решать вопросы синхронизации клиентской и серверной части, автоматического обновления версий системы, поддержки большого числа территориально удаленных пользователей и т.д. Возникали проблемы с управлением правами и с технической поддержкой. Но самые большие сложности вызывали изменения в учетной политике, затрудняющие ретроспективный анализ показателей — один и тот же формальный показатель в разные периоды времени мог отражать, по сути, разную информацию.
Параллельно с КИХ развивались аналитические системы, базирующиеся на данных из корпоративного хранилища. Часть из них, такие как ИАС ЭМиП (позже — ЦСУ РЖД), относились к классу систем стратегического управления. В их основу легла технология интеграции на уровне аналитической системы информации из КИХ и иных источников для создания цельной информационной картины отрасли. Другие системы дополняли OLAP-надстройку более глубокими и/или специфическими аналитическими возможностями. Корпоративная система управления маркетингом, автоматизированная система прогнозирования, ГИС (геоинформационная система) «Маркетинг», ИС «Грузовой Экспересс» — вот далеко не полный перечень информационных систем, опирающихся на КИХ.
Сегодня на базе КИХ функционирует пять предметных областей: «Грузоперевозки», «Вагонные парки», «Контейнерные парки», «Локомотивные парки» и «Пригородные пассажирские перевозки». В общей сложности это 330 различных разновидностей отчетов, создаваемых по 350 срезам, а общий объем данных КИХ составляет более 1 Тбайт. Число пользователей на сегодняшний день превысило 3 тыс. Важно отметить, что сегодня корпоративным стандартом аналитической отчетности по глубине ретроспективы является представление отчетов с момента основания ОАО РЖД — с 2003 года. Большинство отчетов КИХ дает возможность получения информации за период с 1997-го, а ряд отчетов — с 1992 года.
Основная функция КИХ состоит сегодня в обеспечении широкого круга пользователей динамической отчетностью по различным срезам прикладных областей. Кроме того, на основе данных хранилища готовится ряд форм отраслевой статистической отчетности, представленных двумя большими блоками: «Многоформатная справка» и «Информационная система руководителя» (ИСР). «Многоформатная справка» — это система подготовки статических отчетов сложной структуры по заказу конкретных департаментов. Разработка ИСР началась во второй половине 2005 года по указанию президента ОАО РЖД В.И. Якунина и является инструментом управления руководителя компании высшего уровня, в разрезе инфраструктуры формирующим сводную отчетность по основным ключевым показателям (производственным, кадровым и финансовым). По каждому из них существует возможность сразу перейти от статической отчетности к более глубокому анализу по динамической отчетности, предоставляющей возможность перехода на более детальный уровень представления (так называемое «сверление»). С помощью «сверления» можно отследить все уровни вычисления показателей (KPI) и выявить источник проблемы.
«Информационное хранилище позволяет нам «разложить» перевозки, особенно грузовые, в различных системах координат, — подчеркивает Владимир Павлов, заместитель начальника отдела анализа и статистики Департамента информатизации и корпоративных процессов управления ОАО РЖД. — С помощью информационного хранилища мы получили возможность проводить широкий экономико-статистический анализ, определять и анализировать такие ситуации, как транзит через Россию, транзит грузов через различные пограничные переходы, поток грузов в различные порты различного характера, поток и назначение грузов в СНГ или страны участницы соглашения и обратно». Информационным хранилищем сегодня пользуются разные подразделения ОАО РЖД — практически по истечении суток можно взять любой срез данных и использовать его для анализа.
Перспективы КИХ РЖД
Развитие КИХ РЖД идет в двух направлениях: бизнеса и ИТ. Пользователи предъявляют к хранилищу ряд дополнительных требований. Во-первых, им необходим больший объем информации, особенно в части пассажирских перевозок, макроэкономической информации, а также сведений по альтернативным видам транспорта. Во-вторых, многие пользователи отдают предпочтение не динамической, а статической отчетности, сформированной в принятом в конкретном департаменте виде и предоставляемой на регулярной основе. Эти отчеты предоставляются руководству преимущественно в виде твердой копии. И, в-третьих, на определенной стадии работы некоторые пользователи КИХ экспортируют информацию в Excel или Word и продолжают формирование отчета в привычных офисных программах, что определяет повышенные требования к стыковке клиента КИХ и MS Office.
Интеграционные процессы в ОАО РЖД определили необходимость переориентации клиента КИХ на Web-технологии. Резко вырос круг аналитических задач, решение которых предполагается проводить в рамках КИХ, что обусловило переход информационного комплекса ОАО РЖД от уровня отраслевого хранилища к уровню интегрированной аналитической платформы.
В декабре 2007 года для создания унифицированной отраслевой системы подготовки отчетности и анализа данных с целью принятия управленческих решений в ОАО РЖД началось развертывание платформы SAS Enterprise Intelligence Platform. К началу 2008 года завершился первый этап ее внедрения и ввода на ее основе в промышленную эксплуатацию системы «Банк показателей» в ГВЦ РЖД как средства формирования статистической корпоративной отчетности и инструмента управления для руководителей среднего и высшего звена, в том числе президента компании. Система предоставляет сведения по всем ключевым показателям деятельности ОАО РЖД.
Преимущество SAS Enterprise Intelligence Platform состоит в обеспечении интегрированной платформы, способной работать с большими объемами данных, опирающейся во всех стадиях аналитического процесса на единые метаданные. Кроме того, для КИХ РЖД были крайне важны решения в области повышения достоверности корпоративной информации — четырехуровнего контроля достоверности данных: форматно-списочный контроль, статистический контроль, логический контроль (на основе взаимосвязи между показателями) и fraud beating — анализ внешних связей и показателей компании. Миграция КИХ РЖД на SAS Enterprise Intelligence Platform проходит параллельно с текущим развитием проекта и «невидима» для пользователей.
Успешное внедрение КИХ вызывает интерес со стороны разных отраслей и организаций: дочерних компаний ОАО РЖД, которые хотят самостоятельно анализировать и решать возникающие у них проблемы обработки информации, а также более обоснованно прогнозировать свою деятельность; зарубежных железнодорожных компаний (польских, казахских, прибалтийских и т.д.), которых очень привлекают функционирующие ИТ-продукты, обеспечивающие решение отраслевых задач; крупных российских холдингов (добывающие и металлургические компании, для которых все более важное значение приобретает прозрачность и достоверность корпоративной отчетности и сбалансированность системы показателей KPI), которых прежде всего интересуют возможности работы с большими объемами разнородных данных и интеграции разнородных программных систем; компаний, интересующихся сложными, надежно работающими продуктами (телекоммуникационные компании, для которых особенно важен опыт ОАО РЖД по «выживанию» в сложных экономических условиях); государственных органов, которых интересует внедрение современных ИТ в условиях строгих нормативных требований.
платформа для будущего
Для дальнейшего развития корпоративной аналитики у компании SAS имеется ряд аналитических разработок, например решение для процессно-ориентированного управления SAS Activity-Based Management, позволяющее управлять себестоимостью и повышать прибыльность, планировать потребности в ресурсах, определять факторы прибыльности компании, осуществлять внутреннее ценообразование в рамках холдинга и обоснование тарифов перед регуляторами.
Решение Enterprise Miner — интегрированный компонент системы SAS, созданный для выявления в массивах данных информации, необходимой для принятия решений. Enterprise Miner включает в себя эффективные методы статистического анализа, соответствующую методологию выполнения проектов поиска скрытых закономерностей и графический интерфейс пользователя.
SAS Bridge to ESRI — шлюз, обеспечивающий обмен данными между ПО SAS и геоинформационной системой ArcGIS от компании ESRI. Это решение позволяет совместить географические данные с показателями работы предприятия (финансовыми, маркетинговыми, кадровыми и пр.) и наглядно отобразить коммерческую информацию на карте.
Эти инновационные решения соответствуют возросшему уровню зрелости корпоративной информационной среды ОАО РЖД и позволяют сделать очередной шаг в развитии аналитических возможностей КИХ. В частности, в связи с переходом компании к холдинговой структуре обострилась потребность в решении, обеспечивающем прозрачную модель ценообразования как в отношениях с дочерними предприятиями (внутрихолдинговое ценообразование), так и с государственными регуляторами.
Александр Семенов (Semenov53@mail.ru ) — независимый автор (Москва).
ОАO «Российские железные дороги»
ОАO «Российские железные дороги» — национальная компания, занимающаяся железнодорожными перевозками, является третьей по размеру корпорацией в стране и контролирует 80% российского грузооборота и 45% пассажирооборота. В компании работают 1 млн 300 тыс. сотрудников. Это крупнейшая транспортная компания не только в России, но и во всем мире, играющая важнейшую роль в экономике государства.
SAS Enterprise Intelligence Platform
В мировой бизнес-практике естественным развитием систем бизнес-аналитики является переход к отраслевым аналитическим платформам Enterprise Intelligence Platform (EIP), интегрирующим отдельные компоненты технологии внутри существующей инфраструктуры в единую унифицированную систему. Принятые сегодня в типичной организации архитектуры бизнес-аналитики не оптимизированы для развертывания и использования на всем предприятии, однако руководству требуется целостная картина, что вынуждает ИТ-группы предоставлять информацию в масштабе всего предприятия, при этом не повышая эксплуатационных расходов.
SAS Business Intelligence сводит разные части картины функционирования компании вместе. Построенное на основе EIP решение по бизнес-аналитике SAS Business Intelligence предоставляет пользователям доступ к информации в необходимом формате в любой момент времени и в любом месте. При этом обеспечиваются необходимые интерфейсы для различных уровней пользователей.
Интегрированное с хранилищем SAS Data Integration и сервером SAS Scalable Intelligence Server решение SAS Business Intelligence может объединять в себе все данные, необходимые для анализа, независимо от их источника или формата. Такая интеграция гарантирует, что данные, использованные в анализе, являются полными, последовательными и должным образом очищенными — без разрастания метаданных, что стало общей проблемой в архитектурах бизнес-аналитики.
Решение SAS Business Intelligence создает совместную область, связывающую ранее изолированных специалистов по статистике, финансам, маркетингу и логистике. Все пользовательское сообщество имеет доступ к стандартным аналитическим процедурам компании и шаблонам отчетов. Это не только позволяет получать согласованные, надежные результаты, но также способствует более тесному взаимодействию и партнерству между отдельными командами.
Будучи частью интегрированной платформы, все компоненты и услуги управляются из единого центра, тем самым уменьшаются административные усилия по поддержанию приложений, пользователей и безопасности. Обеспечивается согласованность данных, поскольку метаданные хранятся в едином хранилище метаданных и совместно используются всеми технологиями и решениями SAS.