Большинство участников рынка решений для работы с Большими Данными стремятся объединить возможности по обработке данных различной природы. Структурированные данные бизнес-приложений, годами накапливаемые в корпоративных хранилищах, и безграничные потоки новых типов данных из социальных сред и от различных устройств формируют информационный актив, из которого при умелом подходе компании могут извлечь дополнительную прибыль.
Однако нельзя забывать и о пассиве Больших Данных – тех обязательствах, которые накладывает владение ими на организации. Ведь получить ценность из гигантских объемов данных вряд ли удастся без продуманной организации их хранения, резервирования и архивирования, обеспечения безопасности, удовлетворения нормативных требований и прочих рутинных, но крайне важных процессов.
Чтобы обеспечить баланс между активами и пассивами Больших Данных, повышая вес активов и снижая стоимость пассивов, нужны правильные инструменты. Компания Hewlett-Packard, всерьез задумавшись над этим, включила в свой портфель Big Data, наряду с единой платформой для обработки разных типов данных, системы для управления корпоративной информацией. На пресс-завтраке в Москве представители компании рассказали об обновленной стратегии HP в области Больших Данных и анонсировали успешные проекты.
Новая структура программного портфеля компании по работе с Большими Данными состоит из двух основных компонентов. Первый – это платформа HP Haven, основным назначением которой является предоставление заказчикам возможности строить эффективные аналитические приложения для максимально полного раскрытия потенциала, заложенного в накапливаемых данных различных типов. Если HP Haven решает задачу повышения веса активов Больших Данных в компании, то снизить вес пассивов поможет второй компонент – набор готовых решений HP Big Data Solutions, интегрирующий в традиционные инструменты управления информацией возможности работы с Большими Данными.
Единая платформа
Платформа HP Haven базируется на двух механизмах – системе обработки неструктурированных данных HP IDOL (Intelligent Data Operating Layer) и высокопроизводительной аналитической базе данных HP Vertica. Они не просто интегрированы между собой, но, что самое важное, объединены общей концепцией: платформа Больших Данных должна давать возможность обрабатывать 100% доступных данных, поддерживать различные варианты развертывания (локально и в облаке) и предоставлять API для разработки приложений на своей базе.
«Для принятия управленческих решений бизнесу уже недостаточно традиционных инструментов, не способных работать с многократно возросшими объемами машинных данных, доля которых неуклонно растет, и социальными данными – информацией о взаимодействии людей, — объясняет Евгений Степанов, руководитель направления по продвижению решений НР Big Data в России. – Невозможность оперативно учесть влияние такого рода данных на события, например, в области корпоративных рисков или соблюдения нормативных требований чревато крахом бизнеса. Именно поэтому мы в HP систематически работаем на совершенствованием единой платформы, поддерживающей все возможные типы данных в организации».
Оба инструмента платформы интегрированы с Hadoop, наиболее популярной на сегодня технологией хранения больших объемов неструктурированных данных. HP Haven включает в себя дистрибутив Hadoop компании Hortonworks, но позволяет работать и с другими реализациями этой системы. «Сегодня рынок Больших Данных взрослеет – заказчикам уже недостаточно развернуть хранилище разнородных данных на базе Hadoop, они стремятся получить эффективные средства аналитики и управления этими данными. Платформа HP Haven предоставляет им такие возможности», — подчеркивает Степанов.
Примером реализации перспективного подхода к работе с данными на базе платформы HP Haven может служить концепция «озера данных» (data lake), востребованность которой становится все более заметной. Информационная инфраструктура современной компании должна быть очень динамична из-за необходимости работать с разнородными источниками данных и вследствие частых процессов поглощения и слияния с другими бизнесами. Возникает потребность в альтернативе традиционным хранилищам, монолитная структура которых осложняет интеграцию новых источников данных. Система HP Vertica, получившая широкое распространение в качестве классического корпоративного хранилища, с неменьшим успехом может выступить как база для создания озера данных благодаря практически неограниченной масштабируемости (от одного терабайта в бесплатной версии Vertica Community Edition до десятков петабайтов данных) встроенных аналитических функций и возможности интеграции, с одной стороны, с Hadoop, а с другой – с различными системами анализа данных. Озеро данных, реализованное на базе платформы HP Haven, не только обеспечивает сбор разнородной информации в единой среде, но и позволяет задать определенные правила работы с этими данными, наполняя смыслом их интеграцию.
Управление Большими Данными
Рост объемов различных типов неструктурированных данных, от которых зависит работа компании, налагает особые обязательства по их управлению – без эффективных инструментов информационные пассивы могут лишить бизнес возможности инновационного развития с использованием Больших Данных, заставляя идти на несоизмеримые затраты времени и средств только на то, чтобы разобраться в своих документах и обеспечить их сохранность. Трансформация традиционных решений по управлению информацией в сторону поддержки механизмов Больших Данных – не дань моде, а объективная потребность заказчиков, подчеркивает Евгений Степанов: «Даже для простого резервного копирования эффективность радикально повысится, если выполнять его не вслепую, а с пониманием той информации, которая резервируется».
Набор продуктов HP Big Data Solutions, являющийся вторым ключевым компонентом портфеля HP для работы с Большими Данными, адресует все основные задачи по управлению корпоративной информацией и включает в себя такие системы, как HP Data Protector для резервного копирования и восстановления, HP Consolidated Archive для универсального архивного хранения, HP Control Point для анализа и систематизации неструктурированных данных, HP Records Management для управления архивными записями. Все они оснащены механизмом HP IDOL, обеспечивающем широкие возможности поиска и анализа для более чем тысячи различных форматов данных.
Помимо развития основного портфеля продуктов по Большим Данным, компания HP уже не первый год работает над интеграцией этих инструментов в свои программные решения по управлению ИТ. Средства анализа Больших Данных в системе HP Operations Analytics для мониторинга ЦОД и модуле Smart Analytics в HP Service Manager обеспечивают этому традиционному направлению программной стратегии HP дополнительные конкурентные преимущества, и подобные возможности будут расширяться. Один из последних анонсов HP – включение инструментария Больших Данных в HP Service Anywhere, SaaS-версию ITSM-решения компании.