InfoWorld, США

Выпуск новой версии IBM DB2 может стать серьезным технологическим прорывом, сравнимым по своей значимости с переходом от иерархических баз данных к реляционным
Джанет Перна : «Объемы информации, представляемой и обрабатываемой в формате XML, в мире растут»

С появлением в 2006 году следующей версии IBM DB2, разрабатываемой сейчас под кодовым наименованием Viper, стремление инженеров корпорации создать систему управления базами данных, которая позволяла бы работать как со структурированной, так и с неструктурированной информацией и поддерживала бы запросы на SQL и Xquery, возможно, наконец завершатся успехом. По крайней мере, генеральный менеджер подразделения управления информацией IBM Software Джанет Перна рассчитывает на это. Официальное бета-тестирование Viper должно начаться в сентябре. Выпуск новой версии DB2 должен стать серьезным технологическим прорывом, вполне сравнимым по своей значимости с переходом от иерархических баз данных к реляционным. В то же время осуществить нынешний переход крупным организациям будет значительно легче, поскольку Viper строится на основе реляционных технологий и при этом обладает расширенной поддержкой XML, что упрощает процедуры разработки и интеграции. (В начале августа стало известно о предстоящей отставке Джанет Перна. — Прим. ред.) В беседе с редактором еженедельника Infoworld Перна рассказала об особенностях новой версии СУБД DB2.

Удастся ли разработчикам Viper осуществить свою давнюю мечту и интегрировать механизмы управления структурированными и неструктурированными данными?

Да, думаю, это наконец произойдет. Во-первых, нужно понимать, что технологии XML проникли во все сферы, связанные с управлением данными, идет ли речь собственно об управлении структурированными и неструктурированными данными, об их транспортировке или о стандартах интеграции данных. XML становится неотъемлемой частью всего этого.

Иными словами, именно благодаря XML разработчикам СУБД следующего поколения, в частности Viper, удалось совершить гигантский скачок вперед?

Да. Происходящие изменения по своей значимости вполне сравнимы с переходом от иерархических СУБД к реляционным. Но не надо думать, что все это случилось в один день. Мир не мог в один миг развернуться и перейти на реляционную модель данных. Однако, когда это произошло, последствия оказались очень серьезными. И переход, который мы наблюдаем сейчас, будет столь же революционен.

Какие технологические моменты следует учесть при переходе к Viper?

Перейти на Viper проще, чем к реляционной модели, ведь она не теряет связи с реляционными базами данных. К ней применим весь ранее накопленный пользователями опыт в части администрирования и использования инструментальных средств. Перемены же по большей части скрыты внутри. Поэтому вопрос фактически заключается в том, насколько быстро им удастся создать требуемое множество приложений на базе XML и накопить необходимое количество XML-документов. Этот процесс уже начался, но его нельзя завершить за один день. И тем не менее рано или поздно любой желающий получит возможность совершить переход на Viper, не отказываясь при этом от ранее полученных навыков и не меняя персонал и привычных инструментов. Нельзя забывать и о росте производительности и упрощении администрирования, сопутствующих данному переходу. Кроме того, у пользователей появится возможность создавать приложения, обрабатывающие как структурированные, так и неструктурированные данные.

Вы считаете, что XML сыграет важную роль в деле объединения структурированных и неструктурированных данных? Можно ли говорить о каком-то прогрессе в этом направлении, произошедшем за последние три-четыре года?

Да, потому что объемы информации, представляемой и обрабатываемой в формате XML, в мире растут. Почему люди решили перейти от иерархических к реляционным базам данных? Потому что их проще было строить, а благодаря языку запросов извлекать необходимые сведения из баз данных стало значительно легче. Посмотрите на использование XML в сегодняшних реляционных базах данных — работает ли это? Безусловно. Можем ли мы еще более упростить данную процедуру и вывести ее на новый качественный уровень? Конечно. Кроме того, объемы информации, представленной в формате XML, растут, а ее важность повышается. XML — ключевой компонент процесса формирования метаданных и средств управления метаданными в DB2.

А почему СУБД, созданные на основе «чистой» XML-модели, не имели успеха?

На мой взгляд, ситуация здесь очень похожа на ситуацию с чисто объектными СУБД. Частично все объясняется недостаточно высокими характеристиками готовности и масштабируемости. Можно ли довести все это до ума? Несомненно. Дело заключается лишь в том, что выбрать в качестве отправной точки. Что лучше: начать с чистых объектов или с чистых XML-документов, пристраивая туда все остальное? Или же оттолкнуться от реляционной СУБД и встраивать в нее механизмы поддержки XML?

Помимо бета-тестирования Viper, на что еще направлены сегодня усилия вашего коллектива?

Если взглянуть на управление информационными ресурсами в исторической ретроспективе, мы увидим, что большинство компаний нацеливались на получение первичных данных путем обработки транзакций и лишь потом думали об организации эффективного хранения и управления этими данными. Я называю это пассивным отношением, потому что с данными практически ничего не происходит. Мы создавали резервные копии и восстанавливали их, причем больших затрат на это не требовалось, что и определяло правила игры. Но сегодня руководители стремятся к полноценному использованию этих данных, для того чтобы лучше узнать свой бизнес. В средней компании, входящей в список Fortune 500, в прошлом году было накоплено уже 177 Тбайт данных, тогда как в 1996 году их объем не превышал 7 Тбайт, причем 85% приходится на неструктурированные данные. Таким образом, вопрос заключается в том, как их извлечь и интегрировать с другими данными, с другими источниками данных, которые позволят лучше понять ситуацию.

Охарактеризуйте в общих чертах стратегию ваших приобретений за последние несколько лет. Вы вели себя здесь весьма активно.

Да, это так. Все приобретения, совершенные за последние несколько лет, направлены на совершенствование наших технологий. Наработки Cross Access помогли нам укрепить свои позиции на рынке баз данных для мэйнфреймов, обладающих возможностью интеграции, технологии Formatica расширили набор средств управления репозитариями. Разработчики Ascential специализировались на очистке и профилировании данных, а также на управлении метаданными. От AlphBlox и SRD мы получили ряд базовых технологий встроенных систем. Технологии Green Pastures способствовали дальнейшему совершенствованию средств управления документами.

И какое место Viper занимает во всем этом?

Эта система лежит в основе всего, что мы делаем. Прежде всего, с ней связано все, что касается управления базами данных, но, посмотрев на наш репозитарий управления контентом, вы увидите, что она используется и в качестве хранилища метаданных, а следовательно, является неотъемлемым компонентом Content Manager.