С точки зрения высокой доступности и отказоустойчивости, виртуализация и централизация в ИТ имеют как положительные, так и отрицательные свойства. С одной стороны, консолидированные и централизованные среды ИТ легче администрируются и упрощают внедрение архитектур высокой доступности, но с другой, в случае отказа или ошибки последствия могут быть гораздо более фатальными — с этим обстоятельством связан главный риск использования централизованных ИТ. Именно поэтому подходы к обеспечению высокой доступности и отказоустойчивости, а также методы для защиты ресурсов хранения должны претерпеть определенные изменения.
Потребность в ресурсах хранения до конца удовлетворить невозможно. Это привело к появлению больших и очень сложных инфраструктур хранения с множеством различных уровней (Tier) систем SAN и NAS. Самая большая проблема заключается в том, что очень сложно и дорого задавать и соблюдать для каждого уровня систем хранения последовательную стратегию, правила и возможности восстановления данных. До сих пор на многих предприятиях используются различные массивы хранения для удовлетворения всевозможных требований к производительности и доступности данных. Администраторы вынуждены обслуживать эти массивы с помощью программного обеспечения, приобретенного у разных производителей.
В результате ИТ-персоналу приходится сталкиваться со множеством требований при использовании разнообразных программных продуктов, приобретать необходимые навыки и умения и затем поддерживать их в актуальном состоянии — все это приводит к значительным расходам.
ХРАНЕНИЕ И ЗАЩИТА В ОДНОЙ СИСТЕМЕ
Однако на рынке уже предлагаются новые решения для хранения информации, представляющие собой консолидированную систему с различными интегрированными уровнями хранения и к тому же обеспечивающие — в зависимости от критериев доступности многочисленных приложений — соответствующие уровни производительности. Однако определенный риск сохраняется и при таком подходе: в случае отсутствия надлежащих технологий реализации высокой доступности, отказоустойчивости и RAID по-прежнему остается угроза возникновения потенциальных точек общесистемного отказа (Single Point of Failure). Поэтому в системах хранения SAN — особенно в тех, которые сегодня централизованно используются в центрах обработки данных, — необходимо предотвратить появление точек общесистемного отказа, будь это энергоснабжение, контроллеры, процессоры или управляющая консоль.
Для того чтобы обеспечить высокую доступность и отказоустойчивость систем хранения, администраторам ИТ необходимо принять во внимание два пункта: во-первых, следует организовать защиту и сохранение данных — как локально, так и в распределенных филиалах; во-вторых, важную роль для достижения высокой доступности и отказоустойчивости играет производительность систем хранения. В современных системах хранения делается ставка на проверенные технологии, такие как репликация данных, зеркалирование, создание моментальных снимков (Snapshots), а также избыточное исполнение накопителей и других компонентов. Дополнительный важный вклад вносят новые концепции: качество сервиса (Quality of Service, QoS), автоматическое определение уровней Tier, интеллектуальная аварийная сигнализация и функции для сохранения данных на уровне RAID.
Так, при использовании репликации каждая директива для системы хранения должна определять данные, которые подлежат копированию, а также способ и место их сохранения. Это может быть как простое копирование только данных по принципу «блок за блоком», так и всеохватывающий подход с интеграцией типов поддерживаемых приложений, а также возможностей миграции. Для последней требуется репликация между двумя одинаковыми системами либо гетерогенная репликация между системами разных производителей.
Следовательно, для каждого типа проектов по аварийному восстановлению данных (Disaster Recovery) или обеспечению высокой доступности в качестве отправной точки должна выступать первичная оценка рисков, связанных с утратой данных, для приложений, использующих конкретную файловую систему. Не всем приложениям потребуется самый высший уровень защиты. Так, сбой сервиса поддержки системы E-Commerce наверняка окажется гораздо более весомым, чем отказ программы для архивирования документов.
ПОСТРОЕНИЕ АРХИТЕКТУРЫ ВЫСОКОЙ ДОСТУПНОСТИ
Возможности отказоустойчивости и восстановления, предлагаемые современными системами хранения, можно проиллюстрировать на примере системы Axiom компании Pillar Data. При этом важную роль играют как аппаратные, так и программные аспекты.
В частности, интегрированное оборудование, изначально рассчитанное на обеспечение стабильной работы и высокой готовности, будет так же необходимо, как и концентрация всех инструментов на одной-единственной административной консоли. Последний пункт избавит ИТ-специалистов от неизбежного использования различных программных ассистентов — этот фактор ненадежности предприятиям не следует недооценивать.
На уровне контроллеров хранилищ к архитектуре высокой доступности относятся спаренные активные контрольные модули. Каждая пара содержит два процессора, а у одного контроллера имеются два кэша емкостью, к примеру, 48 Гбайт с питанием от аккумуляторов. Таким образом, каждый контроллер хранилища по умолчанию является устройством высокой доступности.
Избыточность соединений дисковых массивов и контроллеров гарантирует доступность разных путей передачи данных. Стойкость такой системы можно увеличить за счет парного использования контроллеров RAID в каждом массиве для поддержки производительности. Добавление дополнительных контроллеров позволит добиться еще большего повышения доступности и производительности такой аппаратной архитектуры.
Еще один элемент в рамках подобной архитектуры — возможность использования различных групп и типов RAID. Стратегия интеллектуального распределения данных на основе групп RAID обеспечивает возможность гибкого предоставления большего или меньшего количества групп RAID, а следовательно, и накопителей, в зависимости от потребности в производительности. Сценарий с максимальными требованиями к производительности предусматривает возможность связать все имеющиеся в системе накопители. Как и выбор уровня RAID, этот процесс выполняется автоматически — администратору не нужно производить распределение дисков или что-то подобное.
Для достижения высшей степени доступности в области систем хранения и максимального предотвращения отрицательных последствий при сбоях системы необходимо обеспечить как защиту данных, так и возможность их резервного восстановления, что достигается, в частности, с помощью функции «упреждающее копирование» (Preemptive Copy), которая при возникновении признаков возможного отказа жесткого диска копирует данные на другой диск еще до возникновения ошибки. Если же какой-то активный жесткий диск все-таки выйдет из строя, то ранее упомянутые избыточные контроллеры хранения и дисковые массивы обеспечат непрерывность работы систем.
ФАКТОР ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ
Когда речь заходит об обеспечении высокой доступности, то, помимо интеллектуального аппаратного обеспечения, важную роль играет управляющее ПО (см. Рисунок 1). Оно должно предоставлять администраторам возможность максимально гибкой настройки. Пример таких настроек — создание профилей восстановления (Recovery Profile) в соответствии с приоритетом приложений, использующих ресурсы хранения. Так, избыточное сохранение наиболее важных данных может осуществляться дважды. К этому добавляются формирование копий целых дисков, моментальных снимков, занимающих мало места на диске, клонов, созданных в определенные моменты времени, а также репликация данных в различных филиалах.
Повышение эффективности и интенсивности использования архитектуры хранения не должно противоречить требованиям о сокращении числа систем, уменьшении потребления энергии или снижении временных затрат на администрирование — не важно, построен ли ЦОД вокруг частной «облачной» (Private Cloud) инфраструктуры или представляет собой консолидированную архитектуру хранения. Извлечь из инфраструктуры хранения все возможные преимущества можно только в том случае, если пользователь способен точно установить необходимые уровни для резервного копирования и высокой доступности. Архитектура хранения должна позволять своему владельцу не просто реагировать на изменения, а эффективно действовать.
Франк Пюц — региональный директор компании Pillar Data Systems по Центральной и Восточной Европе.