Объемы данных растут, но одинаковая обработка требуется не для всех. Этот принцип известен еще по иерархическому управлению хранением.

Управление жизненным циклом информации (Information Lifecycle Management, ILM) — не технология и не отдельный продукт, а основополагающий деловой процесс. ILM описывает путь файла от его создания до окончания использования.

В начале каждого проекта ILM ставится одна и та же задача: анализ данных. Вопрос об их значимости для повседневного бизнеса и управлении ими занимает не только крупные предприятия. Каким данным и когда необходимо отдать приоритет, более того — как можно отделить активные данные от неактивных?

Опыт показывает, что приблизительно 65% размещенных на файловом сервере данных неактивны или используются лишь спорадически. В таком случае нужны не дорогостоящие носители для оперативного доступа, как SCSI RAID, а более дешевые. В то же время исследовать тысячи или даже миллионы файлов на их релевантность возможно лишь при помощи надлежащих инструментов, которые необходимо иметь под рукой. По завершении процесса оценки требуются провести анализ результатов. Очень важной, к примеру, является дата последнего обращения к файлам. Если такие значения известны, то на их основе можно приступить к разработке стратегии оптимизации хранения, причем для выполнения поставленной задачи понадобятся приложения внутри соответствующей инфраструктуры. Наиболее существенным при этом оказывается вопрос правильного назначения приоритетов отдельным группам данных с учетом мнений пользователей и необходимости постоянного хранения информации на быстрых носителях. В большинстве случаев потенциальными «источниками затрат» в существующей инфраструктуре остаются электронная почта, графические приложения или совместно используемые ресурсы, где пользователи могут размещать данные.

ТРЕБОВАНИЯ К РЕШЕНИЮ ILM

Каждый проект предполагает индивидуальный подход, однако в основе любого решения — и ILM, в частности, — лежат известные базовые требования. Ими являются:

  • оптимальное использование применяемых сред хранения или ресурсов;
  • эффективное и простое администрирование;
  • низкая стоимость приобретения и обслуживания в расчете на 1 Тбайт;
  • быстрое и надежное восстановление данных;
  • независимое от среды хранение в файловой системе;
  • быстрая реализация;
  • автоматическое управление данными;
  • оптимизация существующей инфраструктуры;
  • защита будущих инвестиций;
  • недорогое масштабирование.

ПРИМЕР РЕШЕНИЯ ILM

Сегодня очень многие компании рекламируют ILM. В каждом отдельном случае необходимо тщательно подбирать продукт с учетом потребностей предприятия. Так, базовой функцией Infinistore Archive Filer (IAF) от Grau Data Storage является объединение преимуществ двух носителей: скорости жестких дисков и надежности магнитных лент. При этом процессы внутри системы протекают следующим образом: файлы с высокопроизводительных дисков автоматически переносятся на другой, более дешевый носитель в соответствии с заранее определенными критериями (правилами), к которым относятся, например, возраст файла, дата создания, размер или тип файла (см. Рисунок 1). После успешной миграции остается лишь один метафайл, содержащий ссылку на новое месторасположение данных. Сам пользователь не заметит произошедших изменений и будет разыскивать файл прежним способом. В таком случае говорят о прозрачной миграции.

Рисунок 1. Изменение статуса при управлении файлами.

При помощи IAF, к примеру, при необходимости создаются несколько копий (см. Рисунок 2). Это может означать, что в каком-либо другом месте также находится дисковый пул или ленточная библиотека, где сохранена еще одна копия перемещенных данных (избыточность). Таким образом, появляется возможность использования в пределах программного обеспечения ILM решений «диск—диск» или «диск—лента». Путем предоставления вовне логического диска большой емкости (простая точка монтирования) каждое приложение, которое производит запись на диски, интегрируется без проблем.

Рисунок 2. Функциональность удаленной копии.

ПОНЯТИЯ ТЕХНОЛОГИИ HSM

Под первым уровнем миграции (Migration Level 1, ML1) в области иерархического управления хранением (Hierarchical Storage Management, HSM) понимается доступ к сетевым устройствам хранения данных (Network Attached Storage, NAS). В данном случае имеется в виду общий каталог или точка монтирования сетевой файловой системы (Network File System, NFS), посредством которого пользователь в состоянии скопировать или переписать свои данные в систему ILM. Это происходит либо автоматически при помощи программного обеспечения HSM, либо вручную путем простого перемещения или копирования файлов. Поскольку речь идет о прямом соединении с сетью, на этом этапе используются так называемые производительные диски.

Второй уровень миграции (ML2) обозначает вторую ступень HSM. В большинстве случаев речь идет о магнитных лентах или жестких дисках. В таких продуктах, как система IAF, могут одновременно использоваться как лента, так и диски. Время загрузки в случае повторного вызова составляет несколько секунд и не увеличивается из-за загрузки и перемотки ленты, как в случае традиционных систем, поэтому комбинированная архитектура обладает заметными преимуществами по сравнению с обычным использованием магнитной ленты. Кроме того, теперь и пул данных имеется в двойном экземпляре. Файлы, находящиеся в ML2 — на диске и/или магнитной ленте, — уже «мигрировали» и «освобождены». Это означает, что на ML1 находятся только пользовательские метаданные, а собственно содержимое расположено на ML2. При обращении к одному или нескольким файлам система HSM переписывает информацию обратно в область ML1 (повторный вызов).

МИГРАЦИЯ

При миграции данные переписываются с одного физического местоположения на другое, чтобы освободить клиентам место для размещения новых данных. Автоматическая миграция запускается, когда превышается определенное правилом граничное значение. После этого для новых или измененных файлов создаются дополнительные метаданные (атрибуты или содержимое файла), а они сами копируются на диск или ленту. В случае метаданных речь идет о файлах (фрагментарные файлы), которые не содержат данных, причем их физический размер соответствует кластеру файловой системы (от 4 до 64 Кбайт). Они обладают теми же свойствами, что и исходный файл, используются в качестве держателя места и указывают на новое физическое размещение мигрировавшего файла. Всем процессом можно управлять вручную через командную строку.

ТРЕХСТУПЕНЧАТОЕ HSM

Для достижения трехступенчатого HSM (клиент, сервер и устройство хранения) производители предлагают дополнительные продукты. В случае Grau Data Storage используется клиентское программное обеспечение HSM GDS, пригодное для инсталляции на файловые серверы Windows. Миграция в соответствии с заданными правилами позволяет перемещать данные с файловых серверов на вспомогательные устройства. Таким образом освобождается ценное дисковое пространство на файловых серверах. Тем не менее данные все же остаются оперативно доступными, временное окно для резервного копирования сокращается, а административные издержки снижаются.

ПРЕИМУЩЕСТВА БЛАГОДАРЯ ILM

Преимущества решения ILM очевидны: последующие инвестиции минимизируются так же, как и издержки. Кроме того, пользователь приобретает дополнительную гибкость в отношении последующих миграций технологий. Целью является обеспечение доступности важных данных в нужный момент времени, как если бы они находились в первичном месте хранения. Для снижения стоимости следует обращать особое внимание на разделение активных (действительно необходимых) и неактивных данных. Полное решение ILM решает эту проблему автоматически. Постоянный мониторинг позволяет выявить узкие места или изменения в шаблонах использования, чтобы администратор смог без промедления адаптировать параметры миграции.

Штефан Ройш — специалист компании Grau Data Storage. С ним можно связаться по адресу: wj@lanline.awi.de.


© AWi Verlag