Конференция Meet The Experts II, организованная представительством Sybase при участии московского офиса IBM 19 июня, оправдала свое название. Ее участники получили возможности для встречи с экспертами в области бизнес-аналитики (Business Intelligence, BI), приехавшими из-за рубежа, и со специалистами из торговой компании «Азбука вкуса» и Альфа-Банка, которые уже внедрили у себя подобные системы.
Обычно к мысли о необходимости создания системы BI руководители корпораций приходят тогда, когда они осознают, что их знания о собственном предприятии недостаточны, и что дальше так жить нельзя. Конференция была призвана ответить на возникающие в такой ситуации вопросы: что такое Business Intelligence, в чем преимущества, получаемые от использования хранилищ данных, критерии выбора технологических компонентов и т. д.
По сложившейся традиции для чтения основного доклада приглашаются выдающиеся специалисты.
В прошлом году на конференцию «Многомерное моделирование для BI-систем» был приглашен Ральф Кимбалл, в этом году в роли почетного гостя оказался Билл Инмон.
Это второй визит признанного «отца концепции хранилища данных»; впервые он посетил Москву в ноябре 2005 года, приняв участие в конференции, организованной совместно IDC и издательством «Открытые системы».
Инмон начал свое выступление с печального факта: предприятия, даже самые большие, плохо знают себя.
Он привел пример своего участия в консультировании одной крупной нефтяной компании, действующей в Мексиканском заливе, ее оборот более 100 млрд долл.
Инмон был приглашен в тот момент, когда все сведения были сосредоточены исключительно в электронных таблицах. Он заметил: «Электронные таблицы полезны, но только до тех пор, пока их не слишком много, с какого-то момента они становятся врагом корпорации».
Он сослался на Microsoft, по его словам, и там не все ладно, — сведения о более 120 типах продуктов разбросаны по разным источникам, и в итоге в Microsoft не могут ответить на такой, на первый взгляд, простой вопрос: «Сколько лицензий приобрела IBM?»
Главной целью создания хранилища данных должна быть, по мнению Инмона, выработка единого видения корпоративной среды.
При создании хранилищ необходимо в определенном смысле перестроить мышление, если так можно сказать, «испорченное» созданием приложений.
Приложения должны быть эффективны, поэтому при их разработке стремятся избавиться от лишних данных, а хранилища решают обратную задачу, они вбирают в себя все возможные исторические данные. Единство взгляда обеспечивается согласованием форм представления данных, а также выбором общей для всех источников данных модели.
Естественным продолжением сказанного Инмоном стало выступление исполнительного директора российской Sybase Алены Еникеевой, которая говорила о влиянии модели данных на функциональность хранилища и стоимость получения информации.
Вполне ожидаемо ею было показано, что подход, реализованный в Sybase Industry Warehouse Studio и сочетающий в себе хранение с моделированием, а также обеспечивающий замену физических витрин данных виртуальными, оказывается эффективнее конкурентных решений.
Эффектность аналитики еще выше, если использовать СУБД Sybase IQ, не ориентированную на транзакционные приложения и хранящую данные по колонкам.
Скептицизм и прогресс
После своего выступления Билл Инмон ответил на несколько вопросов.
Что вы считаете наиболее актуальным из новых тенденций в хранилищах данных?
Я бы поставил на первое место специализированные устройства для хранилищ данных, производимых начинающими компаниями, такими как Netezza, DATAllegro, Vertica, ParAccel, Greenplum и Infobright. Их преимущества в том, что соотношение стоимости инфраструктуры к стоимости дисков во много раз меньше, чем у традиционных производителей специализированных систем наподобие Teradata или универсальных систем, состоящих из дисковых накопителей и серверов. Беда в том, что в процессе эволюции инфраструктура становится настолько дорогой и сложной, что она начинает поглощать средства без видимой продуктивности. Поверьте, в мире не более пяти человек, хорошо знающих и могущих использовать СУБД IBM DB2, вероятно, знатоков Oracle побольше, но все остальные платят за ресурс, который не могут использовать. Так что далеко ходить за примером не нужно: мало кто в полной мере использует Microsoft Word, а платить-то приходится. Я убежден, что, создавая слишком сложные системы, многие вендоры загоняют себя в угол, рано или поздно эта ситуация дойдет до критической точки.
Как вы относитесь к таким начинаниям, как Pervasive BI («всепроникающая бизнес-аналитика»); сбор данных в режиме реального времени или времени, близкого к реальному, с использованием сервис-ориентированных архитектур; интеграция средств бизнес-анализа с механизмами обработки сложных событий?
Я если не скептик, то уж, во всяком случае, не слишком восторженный человек. Мне представляется, что и существующие технологии не слишком хорошо освоены. Я приводил в своем выступлении данные о том, что даже в многомиллиардных корпорациях обычные аналитические хранилища не внедрены — что уж говорить о реальном времени. Архитектуры с сервисными шинами и шинами данных, использующие сервисы, видимо, имеют право на существование, но уж больно плохо все определено, нет должной строгости. Слишком много слов, я привык к более доказательным подходам.
Чем вы можете объяснить то, что строгость, которая была присуща компьютерному миру два-три десятилетия назад, уступает маркетингу?
В то время, о котором вы говорите, фундаментальные исследования велись на государственные средства, что было косвенным эффектом холодной войны. Сейчас технологическую политику определяют крупные вендоры. Заметьте, что они сами не слишком сильны в инновациях: реальные изобретения делаются небольшими компаниями, большинство из которых потом поглощается. Этому процессу способствует венчурная схема финансирования, в чем-то она, безусловно, полезна, но явно не во всем. Неуправляемая сложность инфраструктур — это первая бомба, а полная коммерциализация компьютерных технологий — вторая. Мы явно подходим к критическому периоду в развитии нашей отрасли.
Связываете ли вы прогнозируемый вами кризис с тем, что сейчас стали называть «синдромом фон Неймана», то есть кризисом вычислительной архитектуры, господствующей вот уже более 60 лет, кризисом последовательного программирования, не способного справиться с грядущей многоядерностью?
Может быть, и так. Плотность транзисторов, а в будущем — каких-то иных элементов, будет возрастать, развитие физики твердого тела невозможно остановить. Как следствие, рано или поздно те концепции, которые родились в прежних условиях, которые кажутся незыблемыми, устареют, и на смену им придут другие. В любых технологиях периодически происходят радикальные изменения, деревянные корабли заменили железными, а паруса — машинами. Компьютеры и все, что с ними связано, — не исключение.