В прошлом эволюция систем RAID позволяла им соответствовать все новым требованиям. Высокую скорость ввода/вывода данных при этом удавалось обеспечить благодаря постоянному повышению количества традиционных жестких дисков. Но в эпоху Больших Данных, облачных вычислений и мультимедийных технологий этот подход достиг пределов своих возможностей. RAIDконтроллеры на базе флэш-памяти открывают новые пути для решения поставленных задач.

Традиционные технологии RAID сейчас тщетно пытаются не отставать от стремительно растущей производительности процессоров. Для современных ЦПУ типичными скоростями записи данных считают 1 нс для кэша первого уровня (L1-Cache), 10 нс для кэша второго уровня (L2-Cache) и 100 нс для основной памяти. Это значительно быстрее, чем скорость записи 10 мс для систем хранения данных уровня Tier I или 20 мс для систем уровня Tier II и вторичных хранилищ данных (Nearline). Следовательно, возникающие задержки (Latency) могут оказаться в 100 тыс. раз больше (см. Рисунок 1). Экспоненциальный рост объема данных и трафика в сетях приводит к тому, что традиционные инфраструктуры RAID, предназначенные для хранения информации, достигают пределов своих возможностей. Возникающие в результате узкие места препятствуют быстрой работе приложений и мешают предприятиям эффективно использовать свои данные.

 

Рисунок 1. Время доступа в иерархических системах памяти: доступ к многоуровневым системам хранения обычно в 100 тыс. раз медленнее, чем к основной памяти. Использование флэш-памяти на RAID-контроллере позволит заметно приблизить показатели систем хранения к производительности процессоров.
Рисунок 1. Время доступа в иерархических системах памяти: доступ к многоуровневым системам хранения обычно в 100 тыс. раз медленнее, чем к основной памяти. Использование флэш-памяти на RAID-контроллере позволит заметно приблизить показатели систем хранения к производительности процессоров.

 

Узкие места при чтении/записи данных критически важных приложений вынуждают вплотную заняться темой технологий RAID и стимулируют новый этап их развития. Многие специалисты считают твердотельные накопители (Solid State Drive, SSD) наилучшим способом заполнения столь явной бреши между производительностью процессоров и систем хранения. Использование систем SSD значительно сокращает время доступа к информации, повышает скорость обмена данными, уменьшает задержки и обеспечивает более стабильную производительность считывания по сравнению с традиционными жесткими дисками.

Однако из-за их высокой стоимости замена всей архитектуры хранения данных на системы SSD невозможна, следовательно, экономически более оправданный альтернативный вариант состоит в том, чтобы интегрировать высокопроизводительную и энергосберегающую технологию флэш-памяти, на которой базируются системы SSD, в ключевые сегменты ИТ-инфраструктуры.

ЭВОЛЮЦИЯ RAID

Проблемы с производительностью всегда тормозили развитие ИТ-инфраструктуры, а разрешились они с появлением творческих решений. Некоторое время назад технология RAID играла ключевую роль при доступе к системам хранения данных. История RAID началась в 1978 году, когда Кен Норман Оучи из компании IBM подал заявку на патент под названием «Система для восстановления данных в отказавшем блоке памяти», основной принцип которой впоследствии был реализован в RAID 5. Примерно девять лет спустя ученым из Университета Беркли (Калифорния) пришла мысль объединить несколько жестких дисков в одну логическую единицу. Эта идея была изложена в статье под названием «Аргументы в пользу избыточного оснащения недорогими дисками», где основной акцент делался не на обеспечении сохранности данных, а на удовлетворении требований к производительности ввода/ вывода. У систем RAID тогда появилось новое предназначение, не связанное с обеспечением избыточности систем хранения.

В течение последующих лет получило развитие множество различных моделей RAID, сегодня известных как уровни RAID. RAID 0 позволял повысить производительность, но не был терпим к отказам, а RAID 1 делал возможным зеркальную запись данных на два одинаковых диска. Другими важными шагами стали синхронизация вращения шпинделей дисков и последовательная запись на жесткий диск в RAID 2 и RAID 3. В RAID 4 можно было осуществлять параллельные операции ввода/вывода на независимых жестких дисках, однако недостаток этой концепции заключался в том, что данные о четности сохранялись на отдельном диске. В RAID 5 одинаковые данные сохранялись параллельно, в результате отказ одного из жестких дисков больше не приводил к потере данных, а информация о четности распределялась по имеющимся дискам. Лишь уровень RAID 6 смог обеспечить полную отказоустойчивость даже при сбое двух дисков, что облегчило использование больших групп RAID в системах высокой готовности.

RAID НА АППАРАТНОМ И ПРОГРАММНОМ УРОВНЕ

Распределение данных в системе RAID может осуществляться на программном или аппаратном уровнях. Программный RAID обычно реализуется посредством операционной системы. Операционные системы для серверов с функционалом управления томами поддерживают обычно несколько уровней RAID, чем обеспечивается по крайней мере рудиментарный функционал RAID. Некоторые продвинутые файловые системы, к примеру ZFS компании Sun, разрабатывались специально для того, чтобы управлять данными, расположенными на различных устройствах хранения. ZFS как программный RAID поддерживает всевозможные уровни RAID и их самые экзотические комбинации. Что касается флэш-памяти и ее способности ускорять операции ввода/вывода, то файловые системы могут использовать SSD либо в качестве одного из уровней иерархии, либо как кэш.

Однако тема флэш-памяти становится особенно интересной при рассмотрении аппаратной реализации: благодаря контроллерам RAID операционная система воспринимает массив RAID как один логический накопитель. Кроме того, RAIDконтроллеры оснащены кэшем для ускорения операций чтения/записи, что тоже способствует повышению производительности системы. Таким образом, отдельные процессы перестают носить волатильный характер, и (если кэш защищен посредством механизма резервирования) незавершенные процессы записи не приведут к потере данных, к примеру, после сбоя в подаче электроэнергии. Аппаратные RAID-контроллеры не создают дополнительной нагрузки на хост-компьютер и обеспечивают стабильно высокую производительность, однако необходимо помнить, что модели от различных производителей упорядочивают данные по-разному, так что может оказаться, что в одном массиве RAID не получится использовать контроллеры разных марок.

Использование флэш-памяти в существующих многоуровневых массивах хранения данных (Tiered Storage Array) — лишь один из способов их эффективного использования. В новейших решениях флэш-память устанавливается на сами RAID-контроллеры в комбинации с технологией PCIe и интеллектуальным ПО для кэширования и управления. Такое решение позволяет исключить необходимость передачи данных на твердотельные накопители или жесткие диски через сеть с малой пропускной способностью. Вполне обычным результатом использования этой технологии является шестикратное повышение производительности приложений, а в некоторых случаях измерения показали даже тридцатикратный рост (по сравнению с традиционными архитектурами). Этот метод позволяет — в зависимости от среды хранения данных и используемого приложения — добиться непрерывной скорости передачи данных 4 Гбайт/с и выше.

УСКОРЕНИЕ ОПЕРАТИВНОЙ ПАМЯТИ, SAN И DAS

 

Рисунок 2. RAID-контроллеры на базе флэш-памяти для применения в среде DAS предлагаются, к примеру, во флэш-памяти NAND емкостью от 100 до 800 Гбайт. На рисунке представлен контроллер Nytro MegaRAID компании LSI.
Рисунок 2. RAID-контроллеры на базе флэш-памяти для применения в среде DAS предлагаются, к примеру, во флэш-памяти NAND емкостью от 100 до 800 Гбайт. На рисунке представлен контроллер Nytro MegaRAID компании LSI.

RAID на базе флэш-памяти подходит для выполнения множества различных задач. Так, решения высокой емкости на основе флэш-памяти и PCIe идеально подходят в качестве первичного хранилища, к примеру для баз данных. Хороший баланс между затратами и пользой обеспечивают решения, где используются флэш-накопители средней емкости и интегрированное ПО для интеллектуального кэширования и ускорения, что лучше всего проявляется в сетях хранения (Storage Area Network, SAN) и сложноорганизованных средах хранения данных с прямым подключением (Direct Attached Storage, DAS). Более простые решения DAS могут оснащаться флэшрешениями небольшой емкости, включая ПО для кэширования и ускорения, а значит, многие предприятия смогут улучшить время доступа к своим данным (см. Рисунок 2). Кроме того, ускорение приложений оказывает минимальное воздействие на существующую ИТ-инфраструктуру, а экономия энергии и ресурсов охлаждения наряду с уменьшением размеров систем позволяет снизить совокупные эксплуатационные затраты.

Таким образом, технология с применением флэш-памяти уже сейчас может эффективно использоваться в средах RAID, помогая предприятиям справляться с нарастающей лавиной данных. При организации многоуровневой структуры, куда войдут и существующие системы хранения, она позволит заменить огромное количество вращающихся жестких дисков, традиционно применяемых для обеспечения высокой скорости операций ввода/ вывода. Привычные технологии перестали соответствовать основополагающей идее RAID — «избыточные массивы недорогих дисков» (Redundant Array of Inexpensive Disks), ведь если дополнительные жесткие диски приобретаются только ради повышения производительности систем, а не из-за потребности в дополнительных емкостях для хранения данных, то цена таких решений оказывается слишком высокой. Подход, при котором флэш-память на базе PCIe объединяется с программным обеспечением для интеллектуального кэширования, возвращает технологии RAID ее исконный смысл, ведь основной задачей разработчиков этой концепции было именно повышение производительности операций ввода/вывода.

Томас Павел — директор по продажам компании LSI