Год нынешний характерен широкой пропагандой основными игроками рынка аббревиатуры ILM. Что стоит за этим — желание появлением нового именования дать импульс продажам собственных систем или реальная потребность в смене парадигмы в управлении инфраструктурой хранения, — пытались разобраться участники конференции, в название которой был вынесен вопрос: «Как на практике управлять жизненным циклом информации?»

Третий год издательство «Открытые системы» и аналитическая компания IDC проводят конференцию, посвященную системам хранения данных. Тема остается одной из самых интригующих — на рынке хранения каждый год возникают и новые подходы, и новые технологии, и соответственно новые предложения поставщиков.

Казалось бы, не так давно ИТ-сообщество впервые заговорило о том, что системы хранения — не периферия вовсе, как было принято считать во времена мэйнфреймов, а важнейший компонент информационной инфраструктуры предприятия, поскольку информация ныне считается одним из главных активов современного бизнеса. Но за это время фокус внимания успел несколько раз переместиться — от перспективности технологий сетей хранения SAN и сетевых устройств NAS к задачам их конвергенции, от программных решений по управлению сетевыми ресурсами хранения к виртуализации как инструменту построения единой инфраструктуры хранения.

Год нынешний характерен широкой пропагандой основными игроками рынка аббревиатуры ILM (Information Lifecycle Management). Что стоит за этим — желание появлением нового именования дать импульс продажам собственных систем или реальная потребность в смене парадигмы в управлении инфраструктурой хранения, — пытались разобраться участники конференции, в название которой был вынесен вопрос: «Как на практике управлять жизненным циклом информации?»

Что есть ILM

Если все прежние темы обсуждений, связанные с хранением данных, концентрировались главным образом вокруг технических преимуществ и технологических особенностей систем хранения и средств управления ими, то ILM впервые заставляет задуматься об инфраструктуре хранения в контексте бизнес-задач. ILM — не просто установка тех или иных систем для хранения данных на разных этапах их жизненного цикла. Эта концепция подразумевает задание корпоративных правил и процедур, определяющих, где должны находиться данные в зависимости от их значимости для бизнеса. А решения по реализации ILM призваны автоматизировать процессы размещения, миграции и удаления данных в соответствии с этими правилами, поддерживая классификацию информации в зависимости от ее использования в бизнес-приложениях на разных этапах жизненного цикла, начиная от создания и заканчивая полным выводом из употребления. Производители и аналитики подчеркивают — говорить о некоем ILM-продукте нельзя. ILM — стратегия по отношению к информации на предприятии, которая охватывает и регламенты обращения с данными, и аппаратные системы, и управляющий программный инструментарий.

Бурный рост популярности идей ILM связан с рядом факторов, среди которых на первом месте, конечно, экспоненциальное увеличение объемов информации, которые организациям надо обрабатывать и хранить. При этом постоянно говорится о том, что расширение информационных ресурсов не сопровождается сопоставимым ростом бюджетов ИТ-служб, а значит, их руководителям необходимо искать способы более эффективного освоения средств. Кроме того, дисковые массивы становятся дешевле и появляются новые технологии, такие как Serial ATA, благодаря чему возникает возможность добавить еще один «слой» дискового хранения для нечасто используемых данных между традиционными оперативными хранилищами на высокопроизводительных массивах и архивами на недорогих лентах. На Западе необходимость ILM связывается, в частности с появлением серии государственных нормативов, регулирующих сроки и условия хранения определенных типов документов.

Реализации

Несмотря на то что ILM не ограничивается проблемами систем хранения, ее проповедниками сегодня выступают, прежде всего, основные производители соответствующих систем и программных средств управления ими. Многие из них представили свои подходы и продукты для реализации ILM в докладах на конференции. Технический директор HP Жан-Люк Шатлен остановился на задаче архивирования как одном из краеугольных камней ILM, подчеркнув, что этот процесс нельзя отождествлять с резервным копированием. Последнее позволяет реализовать в компании политику защиты данных от сбоев, в то время как архивы предназначены для долгосрочного хранения информации с возможностями поиска и извлечения нужных данных. Среди фундаментальных характеристик архивирования в ILM Шатлен назвал интеллектуальные возможности по сохранению данных, индексацию, поисковые средства и механизмы доступа к архивным данным, устойчивость к внешним воздействиям, защиту от несанкционированного доступа и обеспечение целостности данных, масштабируемость для работы с очень большими объемами информации. Отметив, что значительная часть присутствующих сегодня на рынке решений для построения архивов сложны и ориентируются главным образом на определенный вид архивирования, Шатлен рассказал о последней разработке НР, системе хранения справочной информации Reference Information Storage System. RISS представляет собой универсальный программно-аппаратный комплекс для обеспечения крупномасштабного хранения, доступа к данным и поиска по содержимому архива. В первую очередь система ориентируется на работу с сообщениями электронной почты, которая, судя по частоте упоминаний в докладах, становится основным «убойным приложением» для ILM.

RISS является первой реализацией новой архитектуры HP StorageWorks Grid, в которой хранение организуется в виде распределенной системы с массовым параллелизмом обработки. Интеллектуальные ячейки в этой «решетке», так называемые Smart Cell, помимо собственно пространства для хранения данных, включают в себя специальные средства индексирования и вычислительный блок для реализации поиска и извлечения данных из архива. Тем самым обеспечивается высокая производительность и масштабируемость системы архивирования.

Свою концепцию storage grid развивает и компания Network Appliance. Ее вице-президент по стратегическому развитию Энди Ватсон рассказал, что перенос принципов вычислительного grid в область хранения данных позволит реализовать унифицированную архитектуру с возможностью объединить в общий пул все ресурсы хранения, реализовать глобальное пространство имен, полностью централизовать управление хранением и сделать абсолютно прозрачной любую реконфигурацию архитектуры. Но это в перспективе. Среди продуктов от NetApps для реализации ILM Ватсон выделил дисковый массив NearStore на базе технологии Serial ATA для организации промежуточного уровня хранения данных, которые не требуют постоянного высокопроизводительного доступа, но еще не помещаются в архив.

Глава представительства Hitachi Data Systems в Центральной и Восточной Европе Руперт Графендофер посвятил свое выступление незадолго до этого анонсированной системе TagmaStore, которую в компании называют «универсальной платформой хранения». Универсализм проявляется прежде всего в возможности управлять огромным по объему виртуальным дисковым пространством, объединяющим массивы разных поставщиков. Реальная поддержка гетерогенных сред хранения выгодно отличает предложение HDS от других решений по виртуализации.

Пожалуй, впервые удалось услышать об ILM из уст представителя IBM. Еще в начале года компания явно воздерживалась от использования этой аббревиатуры, хотя подчеркивалось, что все необходимое для реализации управления жизненным циклом информации в арсенале IBM есть. И в выступлении на конференции директора компании по решениям ILM Синди Клойд не прозвучало каких-либо новых анонсов, связанных с ILM, но были представлены основные технологии IBM, позволяющие реализовать такие фундаментальные компоненты ILM, как многоуровневое хранение, виртуализация и архивирование.

Бронислав Вуйович, региональный менеджер компании EMC, которая является одним из главных «локомотивов» ILM в мире, помимо технологических аспектов остановился на подходах к реализации ILM в организациях. EMC предлагает делать это в три этапа, начав с развертывания многоуровневого хранения как технологической базы для ILM. Затем можно определять политики управления жизненным циклом информации для наиболее важных приложений, например электронной почты или прикладных решений типа управления медицинскими записями или медиаданными. Последний этап — полномасштабное ILM, охватывающее все типы информации в компании.

Быть или не быть ILM в России

По словам Ватсона, более 80 клиентов компании в мире реализуют стратегию ILM. Но, как и следовало ожидать, у российских заказчиков очередная иностранная аббревиатура вызывает скорее скепсис, чем энтузиазм. Это отношение выразил на завершавшем конференцию круглом столе ведущий ИТ-инженер «Альфа-банка» Дмитрий Кочнов. В банке есть определенный тип данных, к хранению которых предъявляются строгие требования, но удовлетворять их удается и без правил и технологий ILM. Да, объемы информации в банке удваиваются каждый год, а ИТ-бюджет не растет аналогичными темпами, но и это не составляет особой проблемы. А самое главное, по словам Кочнова, бизнес-подразделения не испытывают потребности в управлении жизненным циклом информации, поэтому ИТ-служба пока не намерена инициировать соответствующие проекты.

То, что российские заказчики не вполне готовы к восприятию идей ILM, косвенно подтверждают и выступления на конференции представителей компаний — системных интеграторов «Инфосистемы Джет» и «Крок», доклады которых фокусировались на традиционных темах построения и оптимизации сетей хранения. Возможно, наиболее точным было замечание одного из представителей компаний-заказчиков во время круглого стола. Выступавший отметил, что современные подходы к управлению данными значительно обгоняют понимание ситуации сегодняшним руководством российских компаний. Надо осознавать, что ILM — это прежде всего изменение принципов организации информации и лишь во вторую очередь технологические решения, позволяющие эти принципы реализовать. Значительные массивы информации и не всегда оптимальное их хранение и использование — объективная реальность для многих отечественных организаций. Поэтому, если даже «флаг» ILM и является очередным маркетинговым ухищрением вендоров, это косвенно служит необходимому просвещению рынка.


Два взгляда на ILM.

Версия IBM

Есть свое видение настоящего и перспектив управления жизненным циклом информации и в компании IBM. О причинах роста востребованности ILM-систем, их воплощении в реальные продукты, разработке стандартов и отличии ILM от концепции иерархического хранения данных рассказывает директор корпорации IBM по решениям ILM Синди Клойд.

О концепции ILM основные игроки рынка заговорили фактически только в этом году. С чем это связано, какие факторы стимулировали развитие этих идей и технологий?

Основная движущая сила для ILM — огромные объемы информации в компаниях и их неуклонный и быстрый рост. Бизнес пытается справиться с этим доступными средствами, покупая дополнительные системы хранения и в основном вручную выполняя операции удаления информации, перемещения ее в другие хранилища и т. д. В результате часто мы храним то, что хранить не обязательно, и предоставляем пользователям информацию, которая им на самом деле не нужна. Появилась необходимость в эффективном управлении этими колоссальными объемами данных, которое не будет сводиться только к приобретению все новых и новых систем хранения, а обеспечит систематизацию информации в зависимости от ее значимости для бизнеса.

Во многих странах имеет место и еще один фактор, стимулирующий развитие ILM, — государственное регулирование сроков и условий хранения информации.

В чем принципиальное отличие ILM от технологий иерархического хранения (HSM)?

HSM существует давно. IBM реализовала эту технологию на своих мэйнфреймах много лет назад. Главное отличие HSM от ILM состоит в том, что концепция ILM ставит во главу угла приложение, проводя различия между значимостью информации для разных бизнес-задач. В HSM управление данными реализуется очень просто, как правило, на файловом уровне на базе таких атрибутов файлов, как срок создания, дата последнего открытия файла и его размер. ILM обеспечивает управление информацией на гораздо более сложном уровне, позволяя, например, анализировать важность для того или иного приложения различных версий данных. ILM поддерживает средства для поиска, безопасного доступа, архивирования данных и реализует необходимую интеграцию различных технологий для управления информацией на протяжении всего ее жизненного цикла.

В ILM важен такой компонент, как возможность определить корпоративные правила и политики для использования, хранения данных, их перемещения с одних типов носителей на другие. Что делается вашей компанией, чтобы реализовать эти функции в своих продуктах?

Один из ключевых продуктов IBM для решения этих задач — DB2 Records Manager. Эта система позволяет проводить категоризацию информации в соответствии с широким набором бизнес-политик, включая не только факторы времени хранения информации, но и некоторые события, действия отдельных пользователей или групп пользователей.

Какова роль аппаратных и программных компонентов в реализации ILM?

Фундаментальная идея, заложенная в ILM, — это многоуровневое хранение. И для ILM необходимо интеллектуальное программное обеспечение, позволяющее размещать информацию в системе хранения надлежащего уровня. Уровень определяется как с точки зрения стоимости хранения, так и исходя из требований к времени доступа к информации. Обычно это реализуется в приложениях в сочетании с возможностями системы управления хранением, такой как IBM Tivoli Storage Manager.

Какова роль технологий виртуализации хранения в ILM?

Виртуализация хранения — способ эффективного развертывания хранения информации, который обеспечивает не только пользователям, но и приложениям доступ к единой структуре хранения в масштабе всей организации. На всех архитектурных уровнях — уровне управления хранением, уровне управления данными и уровне информации — виртуализация поддерживает доступ ко всем системам хранения как к одному устройству. Это очень эффективное решение для бизнеса.

На какие стандарты должна опираться реализация ILM, чтобы обеспечить поддержку гетерогенных ИТ-инфраструктур?

Фактически сегодня таких стандартов еще нет, если не считать нескольких стандартов, связанных с XML. Но в ассоциации SNIA ведется интенсивная работа над созданием новых стандартов, и уже есть определенные предложения. Я думаю, они будут поддержаны вендорами.


Два взгляда на ILM.

Версия Hewlett-Packard

В чем причины популярности идей ILM, что нужно сделать, чтобы эти идеи воплотились в реальность, какие рецепты и продукты предлагают ведущие производители? Ответы на эти вопросы мы попытались получить у участников конференции, в частности — у технического директора компании Hewlett-Packard Жана-Люка Шатлена.

О концепции ILM основные игроки рынка заговорили фактически только в этом году. С чем это связано, какие факторы стимулировали развитие этих идей и технологий?

На самом деле ILM — отнюдь не новая концепция, скорее новое название, мы работаем над этими решениями уже в течение 20 лет. То, что сейчас этому уделяется такое пристальное внимание, объясняется колоссальными объемами данных, а также появлением множества новых государственных предписаний касательно информации, особенно в США и в ряде стран Европы.

Мы всегда понимали, что важно иметь эффективные средства для того, чтобы находить нужную информацию и синхронизировать ее с бизнесом, но никогда раньше в этом не было столь настоятельной потребности. Эти проблемы испытывают все — и госструктуры, и компании, как в России, так и в других странах мира.

В чем принципиальное отличие ILM от технологий иерархического хранения (HSM)?

HSM — это технология, которая относится только к хранению данных и позволяет реализовать долгосрочное хранение данных на более дешевых носителях. А ILM затрагивает не только хранение. ILM имеет четыре компонента. Прежде всего, это все технологии, необходимые для так называемого захвата информации: приложения для ПК, такие как Word или электронная почта, цифровые устройства — фото или видеокамера, диктофон и т. д.

Следующий компонент — это поток работ, который реализуется на различных программных уровнях и предназначен для манипуляций с информацией, например, регистрации входящих/исходящих электронных документов, управления версиями. Далее — репозитарии, то есть непосредственно само хранение.

Существуют два типа репозитариев — оперативный и справочный. В оперативном хранятся данные, с которыми постоянно идет работа, а в справочном — данные, которые после своего создания не изменяются в течение очень длительного времени. И наконец, вывод информации — просто на экран компьютера или на принтер. Фактически технологии HSM реализуют только один компонент этой структуры, а именно репозитарии. Но это далеко не весь ILM. На рынке же вендоры систем хранения часто пытаются уверить нас, что ILM тождествен HSM, то есть сводится к управлению системами хранения, что в корне неверно.

В ILM важен такой компонент, как возможность определить корпоративные правила и политики для использования, хранения данных, их перемещения с одних типов носителей на другие. Что делается вашей компанией, чтобы реализовать эти функции в своих продуктах?

Здесь надо сказать о системе RISS. В ней есть пользовательский интерфейс администратора, который позволяет задавать политики управления информацией. С консоли RISS мы можем определить, что, например, всю электронную почту, поступающую от руководителя компании, необходимо хранить в течение 30 лет, все отчетные документы — в течение трех лет, а некоторые менее значимые директивы — в течение двух недель. Кроме того, система управления OpenView позволяет задавать определенные пожелания пользователя в отношении информации и контролировать их выполнение.

Какова роль аппаратных и программных компонентов в реализации ILM?

Не будем забывать, что в ILM технологии лишь инструмент. Такого понятия, как ILM-продукт, нет. Мы не можем купить ILM 1.0 или ILM 2.0. Технологии — инструмент для реализации процессов и политик в масштабе всей компании, гарантирующих, что информация будет создана в нужное время и в нужное время удалена.

В различных семействах продуктов Hewlett-Packard реализуются как программные, так и аппаратные компоненты ILM. С одной стороны, мы выпускаем цифровые фотокамеры и ПК, с другой — делаем программные средства для поддержки потоков работ. В арсенале НР присутствуют разнообразные системы хранения для реализации репозитариев — дисковые массивы, ленточные библиотеки. Но система RISS объединяет в себе все необходимое для ILM аппаратное и программное обеспечение.

Какова роль технологий виртуализации хранения в ILM?

Виртуализация хранения, как и HSM, — это одна из технологий, которая все чаще используется для реализации репозитариев. Виртуализация относится в большей степени к оперативным данным, то есть данным, которые постоянно модифицируются и редактируются. Виртуализация дает однородное представление всего корпоративного оперативного хранилища.

На какие стандарты должна опираться реализация ILM, чтобы обеспечить поддержку гетерогенных ИТ-инфраструктур?

Важно помнить, что ILM-решения говорят на языке приложений и потому не должны зависеть от конкретных платформ. Например, важнейшим приложением для ILM является электронная почта, по которой сегодня пересылается 85% бизнес-информации. Но почтовые системы не используют частные протоколы, скажем, от НР, они опираются на стандарты SMTP, MAPI или HTTP.

Поэтому важно, чтобы ILM-решения от разных вендоров говорили на языке открытых стандартов приложений — электронной почты, баз данных, Web-cервисов, а не создавали частные коннекторы.