Международная конференция IBM Information on Demand 2011 стала самым масштабным мероприятием IBM в этом году, собрав более 10 тыс. участников. Ключевой темой форума были Большие Данные.
Стив Миллз, старший вице-президент IBM Software & Systems Group, поделился с аудиторией несколькими цифрами. Утверждается, что 90% накопленных на сегодняшний день цифровых данных создано за последние два года, в ближайшее десятилетие их объем увеличится в 44 раза, и львиную долю будут составлять неструктурированные данные. Проблему усугубляет то, подчеркнул Миллз, что сегодня мы имеем дело не только с данными «в покое», но и во все большем количестве – с данными в динамике, которые поставляют различные сенсоры, системы мониторинга, RFID-устройства. Для них требуется анализ практически в реальном времени. Немудрено, что специалисты и руководители бизнеса в отсутствие эффективных инструментов работы с данными начинают в них буквально «захлебываться» – 60% участников традиционного международного опроса топ-менеджеров IBM сообщили, что количество накапливаемой в организации информации превышает возможности ее использования. Но при этом четверо из пяти респондентов IBM считают информацию жизненно необходимым источником для достижения конкурентных преимуществ.
IBM считает принципиальным органическое включение технологий Больших Данных в свою платформу управления информацией, которая объединяет весь спектр решений корпорации для работы с данными. Ядром платформы являются механизмы интеграции и централизованного контроля данных Infosphere Information Server. Теперь эта система поддерживает и интеграцию с двумя основными продуктами, которые IBM предлагает для Больших Данных, – Infosphere BigInsights и Infosphere Streams.
BigInsights – решение на базе открытого фреймворка для работы с Большими Данными Apache Hadoop, добавляющее к нему ряд средств, необходимых для управления данными в корпоративной среде, а также встроенные аналитические возможности, основанные на разработках IBM Researсh. Продукт Streams предназначен для анализа поступающих в реальном времени потоков структурированных и неструктурированных данных. На конференции были анонсированы новые версии решений Infosphere BigInsights 1.3 и Infosphere Streams 2.0, а также объявлено о доступности BigInsights в облачной среде IBM SmartCloud Enterprise. Как утверждают в корпорации, облачный вариант позволит получить работающую аналитическую функциональность BigInsights буквально за полчаса.
На форуме был представлен образовательный интернет-ресурс BigDataUniversity.com с разнообразными учебными материалами по Hadoop, BigInsights, технологиям управления базами данных и разработки с открытым кодом. Многие из них находятся в свободном доступе. Как сообщают в корпорации, в новом интернет-университете уже зарегистрировались более 8 тыс. студентов из различных стран, в том числе из России.