Очередная конференция IBM Information on Demand 2010, прошедшая в конце октября в Лас-Вегасе, порадовала несходством с предшествующими аналогичными форумами. На этот раз задачи были понятны, а цели ясны, почти ничего не осталось от былых расплывчатых рассуждений о специфической роли информации и о запросах пользователей. Произошедшая метаморфоза объясняется изменением в работе с данными — от пространных доказательств роли информации в жизни современного общества в сторону широкого спектра проблем, связанных c использованием данных в бизнес-аналитике. Подобная трансформация вполне закономерна, ведь в нынешних условиях аналитическая работа с данными становится решающим фактором для успехов в бизнесе; сегодня это понимают и поставщики решений, и потребители. И хотя общая риторика относительно грандиозных объемов данных сохранилась, в большинстве выступлений шла речь не просто об информации и данных, а о том, как и какими средствами объемы эти обратить на пользу.
Актуальность аналитических средств подтверждается еще и тем, что за минувшие два года IBM успела купить Cognos и SPSS и еще несколько меньших по масштабу фирм, занимавшихся, помимо аналитики, оценкой рисков, управлением данными и другими смежными темами. В соответствии с пакетом предложений изменилось и содержание конференции, как следствие, она привлекла к себе новые лица. Открывая IOD 2010, глава IBM Software Group Стивен Миллз с гордостью заявил, что количество участников, пусть незначительно, но перевалило за 10 000. Большинство присутствовавших не являлись техническими специалистами — многие приехали, чтобы оценить возможность использования методов бизнес-аналитики, понимая их важность. Этот факт повлиял на программу, она была пользовательско-ориентированной, с демонстрацией большого числа примеров успешных внедрений. Как это принято в Америке, где высоко ценится чужой опыт, многие приезжают не только за новыми знаниями, а еще и ради того, чтобы посмотреть, что и как сделали другие. Поэтому в своих выступлениях представители IBM стремились показать не столько преимущества обсуждаемых продуктов, сколько достижения клиентов и партнеров. Мне довелось побеседовать с одним из участников, руководителем ИТ-службы известного производителя сельскохозяйственной техники John Deer. Он описал круг данных, связывающих фермеров с компанией, в него входят снятые с оборудования показатели, данные о почвах, о погоде, полученные из глобальных систем позиционирования, спутниковая информация о состоянии растений и многое-многое другое. Все эти данные обрабатываются в реальном времени, превращаясь в результате анализа в рекомендации по обслуживанию техники.
Особый фокус на аналитику нашел свое отражение и в той реорганизации, которой подверглась IBM Software Group в январе нынешнего года. Тогда в ее составе было образовано подразделение Business Analytics, основу которого составили активы, полученные вместе с Cognos и SPSS. Компания Cognos была приобретена в 2007 году, после того, как SAP приобрела Business Objects, а Oracle — Hyperion; в результате IBM, наряду с SAP, Oracle и Microsoft, составила группу "мегавендоров аналитических средств". Последовавшая затем покупка SPSS еще сильнее укрепила IBM в этом статусе.
Канадская компания Cognos, основанная в 1969 году, в свои лучшие времена имела численность 3,5 тыс. сотрудников и работала более чем в 100 странах. До середины 90-х она специализировалась на консалтинге и продаже ПО, затем очень удачно вышла на рынок со своим собственным продуктом BI, рассчитанным на работу в локальных сетях, но затем рост прекратился — помешало появление интернет-технологий. К тому же незадолго до приобретения ее IBM компания угодила в коррупционный скандал, и в итоге продажа за сумму, близкую к 5 млрд долл., оказалась лучшим выходом. На конференции было объявлено о выпуске нового продукта IBM Cognos 10, расширяющего возможности прежних версий. Традиционно программное обеспечение Cognos Business Intelligence объединяло аналитику, составление отчетов, создание приборных досок (dashboard), затем добавились подсистемы планирования, сценарного моделирования, мониторинга в реальном времени и предиктивной аналитики. В Cognos 10 разработчики пошли дальше — теперь есть возможность для объединения в виртуальные коллективы, создания «сетей решения» (decision network), позволяющих делиться идеями, координировать действия сотрудников, расставлять нужных людей по нужным местам. В IBM Cognos 10 рабочее пространство BI не имеет границ, в итоге бизнес-аналитика становится доступной всем, позволяет добиться усиления интеллекта за счет совместной работы. Аналитика в реальном времени превращается в реальную повседневную практику. Сети решений согласуют работу разных сотрудников и позволяют документировать принятие решений, что очень важно для накопления опыта, формирования корпоративной культуры предприятия, их даже можно рассматривать в качестве инструмента управления корпоративными знаниями.
У SPSS, второй из приобретенных компаний, история иная. В последние годы своего самостоятельного существования она специализировалась на предиктивном программном обеспечении PASW (Predictive Analytics SoftWare). Компания была создана в 1968 году с целью разработки статистических пакетов для обработки социальных исследований, отсюда и название SPSS (Statistical Package for the Social Sciences). Ее IBM приобрела немногим дороже, чем за миллиард долларов. Продукты SPSS используются в исследованиях рынка, в медицинских, правительственных, образовательных и других организациях. Руководство по SPSS, соавтором которого является создатель компании, профессор Стэнфордского университета Номан Ни, признано одной из самых влиятельных публикаций в социологии. Математика SPSS включает в себя практически все известные статистические методы, что и делает пакет предиктивным, а возможность использования данных практически любых форматов расширяет сферу его применения. В последние годы SPSS предприняла серьезные усилия для адаптации своих технологий к нуждам бизнеса. Можно надеяться, что методы, предлагаемые SPSS, найдут более широкое применение и в России. К примеру, в беседе с представителем компании выяснилось, что в бесконечную дискуссию за и против ЕГЭ они могли бы внести ясность. В частности, статистический анализ помог бы установить связь между баллами, полученными школьниками, например, с образовательным уровнем региона их проживания и тем, каковы их дальнейшие вузовские успехи.
Продукты SPSS и Cognos удачно дополняют друг друга, первые позволяют выявить в данных скрытые закономерности и сделать прогноз, а вторые — включить их в цикл бизнес-процессов. К числу наиболее удачных внедрений аналитики от IBM можно отнести бизнес-проекты компаний Hertz и Visa.
Как бы ни была важна аналитика, она не существует без технической и информационной поддержки. Эту функцию продолжают выполнять традиционные технологии, упомянутый выше IBM InfoSphere Information Server, платформа хранилищ данных IBM InfoSphere Warehouse и классический аналитический инструментарий IBM Smart Analytics System. Их возможности дополняют новые технологии, в первую очередь IBM System S, обеспечивающие обработку больших объемов данных в потоковом режиме (stream computing). Для работы в этом направлении создан центр IBM European Stream Computing Center в Дублине, призванный стать концентратором многочисленных исследований. В основе System S лежит математический аппарат непрерывной аналитики (perpetual analytics), разработанный Джеффом Джонасом, научным руководителем IBM Entity Analytics Group. Эта группа была образована после приобретения компании Systems Research and Development, которая выполнила ряд уникальных проектов, в том числе по защите игровой индустрии Лас-Вегаса от групповых атак в карточных играх. System S позволяет параллельно анализировать в реальном времени сотни и тысячи потоков данных, например, биржевые цены, цены на продукцию, погодные факторы и многое другое. Коммерциализация System S позволила создать программный продукт InfoSphere Streams, который можно отнести к категории "обработка сложных событий" (Complex Event Processing, CEP).
IBM не обошла вниманием и проблему обработки больших объемов данных — Big Data. Для ее решения предложен продукт IBM InfoSphere BigInsights, являющийся аналитической платформой, построенной поверх Apache Hadoop. От аналогов он отличается сочетанием знаний и опыта, полученных при разработке классических реляционных СУБД, с возможностями Apache Hadoop.