Network World, США
За повышенную надежность хранения, достигаемую при использовании схемы RAID 6, приходится расплачиваться потерей производительности
Технология RAID (Redundant Array of Independent Disks) позволяет обеспечивать различные уровни защиты данных в зависимости от требований конкретных приложений. Чаще всего используются дисковые массивы уровней 0, 1, 5 и 10, причем для безаварийной работы применяется, как правило, RAID 5 (с распределенными контрольными суммами), так как эта технология позволяет восстанавливать данные на вышедшем из строя диске без потери доступа к хранящейся информации. RAID 6 (с двойной контрольной суммой) обеспечивает в случае сбоя более высокий уровень защиты данных с использованием емкости двух накопителей.
В дисковом массиве RAID 5 информация записывается поочередно на все накопители, и контрольная сумма распределяется и хранится на всех дисках. Если диск выходит из строя, то массив работает в «деградированном» режиме до тех пор, пока сбойный диск не будет заменен, а его данные не будут восстановлены с использованием информации контрольной суммы. Однако все данные будут потеряны в случае, если в момент восстановления выйдет из строя еще один накопитель либо обнаружится скрытый дефект накопителя, приводящий к ошибкам чтения в процессе восстановления информации. С ростом емкости современных жестких дисков процесс восстановления информации становится все более длительным, что увеличивает вероятность выхода из строя второго накопителя во время их выполнения.
RAID 6 устраняет эту проблему. В системе, использующей RAID 6, производится вычисление второй контрольной суммы, которая записывается и распределяется по всем дискам. Такой двойной расчет контрольных данных обеспечивает существенно более высокую устойчивость к сбоям, так как при этом из строя могут выйти два диска, что не приведет к потере данных (см. рисунок).
Однако дополнительные вычисления снижают производительность массивов, использующих технологию RAID 6 в режиме записи. Эталонные тесты показывают, что уменьшение производительности в таком RAID-контроллере по сравнению с RAID 5 может превышать 30%. В то же время массивы RAID 5 и RAID 6 сравнимы по скорости операций чтения.
Поскольку поставщики решений RAID различным образом реализуют эту технологию, важно выбрать контроллеры RAID 6 с минимальными потерями при выполнении операций записи. Желательно найти такие контроллеры, которые одновременно осуществляют вычисление двух контрольных сумм и используют для этого специализированные микросхемы, значительно снижающие потери производительности.
Оценка емкости
Для организации RAID 5 требуется не менее трех дисков. Суммарная продуктивная емкость хранения данных равняется объему N-1 дисков (где N — число дисков), поскольку емкость, эквивалентная объему одного из них, предназначается исключительно для хранения контрольных данных. К примеру, в массиве из четырех 200-гигабайтных дисков, общая емкость которого составляет 800 Гбайт, для данных может использоваться только 600 Гбайт.
RAID 6 требует не менее четырех дисков, а полезная емкость будет равна объему N-2 дисков, потому что емкость, соответствующая двум дискам, будет выделена только для контрольных сумм. Доступная полезная емкость в данном случае составит 400 из 800 Гбайт.
Технология RAID 6 может использоваться не менее чем с четырьмя дисками. RAID 10 является конфигурацией с более высокой производительностью, так как способна работать при выходе из строя практически любой пары дисков в четырехдисковом массиве. В технологии RAID 10 данные зеркалируются и распределяются для повышения избыточности и производительности. Зеркалирование не требует выполнения операций чтения-модификации-записи, как в RAID 5 и RAID 6. Массивы RAID 6 рекомендуется применять вместо RAID 10 при наличии более четырех накопителей.
Таким образом, RAID 6 обеспечивает более высокий уровень защиты данных, их доступности и устойчивости к сбоям, чем RAID 5, но это имеет свои отрицательные стороны. RAID 6 требует выделения емкости двух дисков в массиве для хранения контрольной информации, и большинство систем RAID 6 имеют низкие показатели производительности операций записи из-за дополнительных вычислений контрольных сумм и прерываний работы памяти. Параллельное вычисление контрольных сумм может снизить такие потери производительности.
Чарльз Эйшен — старший менеджер по маркетингу подразделения устройств хранения компании AMCC