Избежать потери доступа к данным при отказе компонентов призваны помочь различные инструменты и технологии. Однако многие из них предлагают невысокую производительность за большие деньги, поэтому необходимо разобраться в их преимуществах и недостатках.
Избыточный массив независимых дисков (Redundant Array of Independent Disks, RAID) предусматривает сохранение идентичных данных в разных местах на нескольких жестких дисках. Простейшая модель — чередование, или RAID 0 — не предлагает никакой избыточности. Она обеспечивает повышенную производительность, но не отказоустойчивость. При выходе из строя хотя бы одного диска в составе группы теряются все данные.
RAID 5, напротив, предлагает комбинацию чередования и контроля четности. Информация о данных и четности распределяется по жестким дискам таким образом, что при отказе одного диска находившиеся на нем данные при помощи математической операции «исключающее или» могут быть восстановлены на основании дополнительных сведений о четности, хранящихся на остальных дисках. Поэтому RAID 5 осуществляет непрерывное резервирование всех данных.
МАССИВ RAID 6
RAID 6 представляет собой расширение RAID 5. При использовании этой технологии даже отказ сразу двух жестких дисков в одной группе не приведет к потере данных. В случае RAID 6 для восстановления информации необходимо провести две математические операции. Первая та же, что и в случае технологии RAID 5 («исключающее или»), вторая требует наличия дополнительного жесткого диска Q, поэтому и сама технология называется проверкой четности P+Q. Некоторые производители утверждают, что с введением технологии RAID 6 — особенно при использовании их собственной реализации RAID 6 — устраняются все проблемы, связанные с готовностью. Действительно, RAID 6 предлагает высокий уровень защиты при отказе двух жестких дисков сразу, однако во многих возможных сценариях применения, к примеру, в случае пользовательских ошибок — эта технология не является оптимальным решением для обеспечения максимальной готовности данных.
В средах, где требуется обеспечить высокий уровень готовности данных, RAID 6 может рассматриваться — вне зависимости от затрат и влияния на производительность — в качестве дополнительной возможности решения хранения высокой готовности. Однако необходимо учитывать и недостатки
RAID 6:
-
чаще всего RAID 6 рассматривается как средство защиты от «отказа двух дисков». Предлагая максимальный — из всех вариантов RAID — уровень защиты при сбоях жестких дисков, эта технология широкого распространения пока так и не получила. Сегодня лишь немногие предприятия готовы пойти на дополнительные затраты или смириться со снижением производительности, чтобы защититься от сравнительно редкой ситуации, когда отказ затрагивает два диска сразу;
-
из-за роста емкости жестких дисков и связанного с этим увеличения времени восстановления данных на запасном диске возникают опасения, что в процессе длительного восстановления первого диска может отказать и второй. Они еще более усилились после появления жестких дисков SATA (Serial ATA) высокой емкости. Из-за сравнительно низкой производительности и большой вместимости им требуется более длительное время на восстановление, чем дискам Fibre Channel. Кроме того, жесткие диски SATA считаются менее надежными и вероятность их отказа выше. На деле же одновременный отказ двух жестких дисков все еще является довольно редким событием. Поэтому предприятиям следует задуматься над тем, готовы ли они пойти на связанные с RAID 6 затраты, чтобы защититься от маловероятного сценария;
-
потенциальное преимущество RAID 6 заключается в защите от непоправимой ошибки в процессе восстановления данных. Лучший пример события такого рода — невосстановимая ошибка чтения, которая, правда, может быть обнаружена и исправлена до отказа жесткого диска, что уменьшает вероятность подобного инцидента;
-
в отличие от RAID 10 и RAID 5, которые реализуются одинаково, независимо от производителя, и уже показали себя на деле, для реализации RAID 6 в системе хранения данных есть большое число возможностей, и не все они совпадают. Методы RAID 6 заметно отличаются у разных производителей, точно так же, как производительность и степень полезности.
КОЛИЧЕСТВО ПОДДЕРЖИВАЕМЫХ ДИСКОВ
Реализация с двойными значениями четности RAID 6 иногда ограничивает количество дисков в системе RAID простым числом. RAID 5, напротив, поддерживает в распространенных на рынке продуктах от трех до 30 дисков в одной системе и не предъявляет требования по ограничению числа жестких дисков в соответствии с предполагаемой областью применения. Такую возможность устройства RAID 6 предложить все еще не могут.
RAID 6 ПО СРАВНЕНИЮ С ДРУГИМИ УРОВНЯМИ RAID
По сравнению с RAID 10 и RAID 5 технология RAID 6 представляет собой уровень RAID с самой низкой производительностью. Хотя при нормальных условиях скорость чтения для всех этих уровней примерно одинакова, продолжительность записи сильно отличается. А при восстановлении, когда система никогда не работает на полную мощность, отличия еще более заметны:
-
факультативный процесс записи — как реализация P+Q, так и реализации DP RAID 6 примерно на 50% медленнее, чем RAID 5 из-за дополнительных вычислений и записи избыточных данных;
-
последовательные процессы доступа — реализации DP RAID 6 работают медленнее RAID 5, а разница составляет до 40%, в то время как P+Q RAID 6 медленнее, чем RAID 5, примерно на 10%;
-
восстановление отдельных жест-ких дисков — технология P+Q RAID 6 приблизительно так же быстра, как RAID 5, DP RAID 6 — самая медленная;
-
в случае приложений, для которых большую роль играет производительность и поддержание ее на определенном уровне, нужно знать, какое влияние на этот показатель будет оказывать RAID 6. Из-за второго параметра четности конфигурации RAID 6 проводят больше операций ввода-вывода при записи и восстановлении, поэтому производительность RAID 6 в таких ситуациях значительно снижается по сравнению с RAID 5 и RAID 10;
-
пользователи RAID 5 уже привыкли к тому, что могут создавать системы RAID любых размеров. Некоторые охотно используют конфигурацию 4+1 (четыре жестких диска с данными на каждый жесткий диск четности), другие предпочитают системы 12+1. Большая часть систем поддерживает массивы RAID от небольших (2+1) до крупных (15+1) конфигураций, причем в ряде систем предлагается конфигурация 29+1. RAID 6 с двойной четностью часто не в состоянии обеспечить такой же уровень гибкости. Многие реализации с двойной четностью требуют, чтобы количество жестких дисков в одной системе RAID было равно простому числу или — в отдельных случаях — простому числу минус единица. Таким образом, размер системы RAID ограничивается пятью (три жестких диска с данными и два диска для контроля четности), семью (5+2), одиннадцатью (9+2), тринадцатью (11+2) и т. д. жесткими дисками.В случае RAID 6 с двойным контролем четности это не обязательное требование, но когда количество жестких дисков в системе RAID не является простым числом, необходимо изменить метод вычисления четности для вертикальной полосы, чтобы поддерживать все возможные размеры групп. Это ведет к дополнительному усложнению алгоритмов и еще более негативно сказывается на производительности. Реализации P+Q RAID 6 не накладывают никаких ограничений в отношении размера группы и подобно технологии RAID 5 поддерживают добавление отдельных дисков (n+2).
КАК RAID 6 ВЛИЯЕТ НА ЕМКОСТЬ?
RAID 6 предлагает больше полезной емкости, чем RAID 1, где половина имеющихся ресурсов задействуется для обеспечения контроля четности, но полезная емкость RAID 6 все же меньше, чем у RAID 5. Конфигурация, в которой под данные отводится пять жестких дисков, в случае RAID 5 (5+1) использует для хранения данных о четности 16% всего дискового пространства, в то время как в случае RAID 6 эта величина достигает 29%. Кроме того, добавление лишь одного дополнительного диска в систему RAID в конфигурации RAID 6 ведет к увеличению вероятности отказа диска на 17%, из-за чего восстановление придется проводить чаще, да еще мириться с увеличением длительности процесса и снижением производительности. Поставщики решений RAID 6 утверждают, что создание крупных систем RAID позволяет сократить протокольные издержки на контроль четности. Однако у этого подхода имеются и подводные камни, поскольку крупные системы RAID более подвержены отказам дисков, а их восстановление занимает больше времени, что означает длительную работу с низкой производительностью.
РЕАЛИЗАЦИЯ RAID 6
Итак, как же реализуется RAID 6? Эта технология представляет собой систему двух независимых линейных уравнений. В принципе, есть две возможности построения RAID 6:
-
исключительно математический подход, при котором две выбранные независимые системы коэффициентов перемножаются с данными;
-
данные должны выбираться из разных наборов, чтобы в любой момент путем итерации систему можно было свести к одному, хотя и сложному, уравнению с одной переменной.
В большинстве классических реализаций P+Q используется первый метод (поле Галуа) (см. Рисунок 1). Проблемой является «простой и быстрый» выбор подходящих множителей (полином). Первый полином очень прост: 0x1. Таким образом, первое уравнение выглядит так же, как и в случае RAID 5:
данные о четности сохраняются на жестком диске Р. Все имеющиеся аппаратные ускорители для RAID 5 будут работать и в этом случае. Однако второй полином сложнее и требует значительных вычислительных издержек. В лю-бом случае речь идет об операции «исключающее или» с множителем, которая в RAID 5 не применяется, но может быть получена путем незначительной модификации аппаратного обеспечения для функции «исключающее или».
Второй метод — двойной контроль четности (Dual Parity, Double Parity) (см. Рисунок 2), когда обычные «горизонтальные» полосы комбинируются с «вертикальными» рядами. Любая вертикальная полоса использует не более одной горизонтальной полосы от каждого жесткого диска. Благодаря двум разным наборам данных о четности система RAID может быть восстановлена при отказе одного или двух жестких дисков. Данные о четности для горизонтальных и вертикальных полос обрабатываются так же, как и в современных системах RAID 5 (при помощи операции «исключающее или»). Но сложные алгоритмы вычисления вертикальной четности, а также нетривиальные механизмы обработки ошибок и исключений ведут к тому, что такие реализации RAID 6 работают заметно медленнее, чем P+Q RAID 6.
В зависимости от того, где хранятся данные, для их восстановления может потребоваться несколько итераций, как минимум три, но чаще их число равно квадрату количества жестких дисков. В принципе, система RAID 6 с двойным контролем четности всегда предлагает удовлетворительную производительность, но восстановление данных при отказе двух жестких дисков ведет к неприемлемому сокращению производительности. В качестве побочного эффекта возможна даже перегрузка оперативной памяти из-за адаптера, что еще более снижает производительность. Хотя подходы отдельных производителей и различаются, реализация P+Q считается отраслевым стандартом, поскольку в любых условиях она гарантирует целостность данных и высокую производительность (см. Рисунок 3). LSI и Intel совместно работали над стандартизацией полинома MDS для спецификации формата диска данных (Disk Data Format, DDF), которой занимается Отраслевая ассоциация сетевых систем хранения данных (Storage Networking Industry Association, SNIA). Эта спецификация уже зарегистрирована Международным комитетом по стандартам информационных технологий (International Committee for Information Technology Standards, INCITS). Стандартов для реализации DP не существует, поэтому системы разных производителей весьма отличаются друг от друга.
КАК RAID ИСПОЛЬЗУЕТСЯ СЕГОДНЯ?
RAID 1 и RAID 5 являются проверенными технологиями, и все производители реализуют их одинаково. Они используются в производственных системах хранения данных уже более 15 лет. Специалисты знают, как реализуются эти уровни RAID и каким образом в таких конфигурациях и решениях достигаются оптимальные производительность, емкость и готовность. Что же касается RAID 6, то это сравнительно молодая технология, и подходы, применяемые к ней, очень различны.
Постоянная готовность данных имеет решающее значение для успешной работы предприятия. Поэтому системы хранения данных должны обладать большим количеством функций, чтобы предлагать высокий уровень готовности. При помощи одного только инструмента этой цели не достичь. Построить систему хранения данных высокой готовности возможно лишь при наличии стратегической комбинации целого ряда инструментов, функций и возможностей конфигурации.
Гюнтер Штегнер — директор подразделения Engenio Storage Group компании LSI Logic в регионе Central EMEA.
© AWi Verlag