«Директор информационной службы»
В компании Informatica утверждают, что интеграция данных сегодня выделяется в отдельную отрасль
В своих прогнозах относительно развития информационных технологий в 2007 году аналитики IDC отмечают, что одним из ключевых требований бизнеса к ИТ в настоящее время становится возможность быстрого доступа к нужной информации. При этом соответствующие программные решения, по мнению аналитиков, остаются достаточно фрагментарными. Многие производители специализируются на унифицированных решениях для обеспечения доступа, поиска и бизнес-интеллекта (например, компании FAST, Autonomy, Endeca, Business Objects или Cognos) или на управлении информацией (Informatica).
Исторически сложилось так, что средства управления информацией являются частью интеграционных платформ, но сегодня ситуация меняется. «Сегодня можно говорить о развитии нового сегмента рынка, — заявил Марк Сигер, вице-президент по продажам компании Informatica в регионе EMEA, выступая на втором международном форуме Data Integration Forum 2007, прошедшем в Москве. — Отдельных разрозненных решений по интеграции данных достаточно много, но нужны комплексные решения, и мы готовы вести рынок и задавать правила игры на нем».
Первый проект в России c участием компании Informatica был начат в 2004 году, а в 2005 году заработал ее представитель в России и странах СНГ — компания Data Integration Software. На мировом рынке продукты Informatica присутствуют уже более десяти лет. Однако они редко используются отдельно, например только для миграции данных и улучшения их качества, хотя такая возможность тоже существует. Обычно применяются ОЕМ-версии, работающие как часть BI-продуктов. В России, как заявил Павел Лихницкий, генеральный директор Data Integration Software, у компании есть совместные проекты с Нewlett-Packard, i2, ЛАНИТ и рядом других. Кроме того, компания ISG разработала совместное решение по миграции данных, Teradata использует продукты Informatica в качестве средства сбора и доставки данных в аналитическую платформу. Из клиентов был отмечен «ВымпелКом».
В состав единой платформы для интеграции данных Informatica PowerCenter 8, являющейся основным продуктом компании, входят сервер постоянной готовности, сквозная инфраструктура метаданных, графическая среда разработки и администрирования, а также средства анализа метаданных из различных источников, включая отчеты BI-средств. Платформа позволяет обеспечить единый доступ к большому числу типов данных, как структурированных, так и неструктурированных. При этом можно комбинировать физический и виртуальный подход к интеграции данных, осуществлять их передачу согласно любому регламенту.
Сегодня уже практически никого не нужно убеждать в том, что в большинстве случаев успех компании зависит от наличия своевременной актуальной и качественной информации для принятия решений.
Но как ее получить, если в компании несколько разнородных систем, решающих свои локальные задачи, и данные из них можно извлечь, только открыв эти приложения. Объемы данных таковы, что часть их переносится на внешние носители, то есть значительно возрастает фрагментация данных.
Если систем немного или компания небольшая, то с интеграцией данных или их актуализацией можно справиться вручную или с помощью самостоятельной разработки, осуществив локальную интеграцию.
Но если речь идет о создании и ведении справочников НСИ или клиентской базы, когда необходима информация из унаследованных систем, ее синхронизация и «очистка», а также когда нужно получить консолидированную отчетность, требующую сведения данных из различных систем, — без единой интеграционной платформы обойтись довольно сложно.
Повысить лояльность
Для телекоммуникационных компаний грамотное управление данными — одна из наиболее актуальных задач. По словам Сергея Федечкина, заместителя директора по архитектуре систем управленческой информации и отчетности «ВымпелКома», абоненты очень чувствительны к уровню сервиса: если он выше ожидаемого, то удовлетворенность абонента повышается достаточно быстро и потом остается стабильной. С другой стороны, если возникает неудовлетворенность, то она растет еще быстрее.
Внедрение новой CRM-системы и системы учета и анализа данных об абонентах позволило компании выделить самую активную часть клиентов и начать работать с ней более адресно. В хранилище, созданное в 2005 году, информация собирается из 23 источников. Появилась возможность сегментировать клиентов, создать тарифы для крупных групп абонентов, изучить, чем клиенты бывают недовольны, и т. п.
Такой подход требует хранения информации о клиентах за 13 месяцев, при том что клиентов у компании около 50 млн., а объем данных уже превышает 100 Тбайт.
BI-система «ВымпелКома» работает на базе продуктов Oracle. Она состоит из нескольких серверов, наиболее мощный из которых имеет 72 процессора. Проведенная оптимизация оборудования позволила увеличить производительность, например по вводу/выводу, на 70%. Пользователей в системе около 1200 чел. В качестве средства загрузки и трансформации данных избрали продукт Informatica PowerCenter 7. Построенные витрины данных наполняются с помощью продуктов Informatica. Загружаемая ежедневно информация обрабатывается на двух серверах, один из которых обслуживает все операции, связанные с трафиком, а другой — все, что касается согласования данных. В компании собираются осуществить интеграцию между приложениями внутри транзакционных систем при помощи продуктов Informatica.
Реальные изменения от внедрения системы, по словам Федечкина, проявились уже через три месяца. Согласно расчетам, возврат на инвестиции составит 65%, а срок окупаемости всего проекта — три года.
В настоящее время осуществляется переход на PowerCenter 8. Поскольку хранилище очень большое, для отладки процесса построили экспериментальный стенд, соответствующий текущей конфигурации, который позволяет оценить скорость загрузки, производительность, а также выявить возможные проблемы.
Развертывание BI-системы в представительствах в странах СНГ планируется провести на той же архитектуре, осуществив интеграцию с центральным хранилищем данных, так как в компании функционирует единая бизнес-модель.