Фото: Intel |
Хотя твердотельные накопители (Solid State Drive, SSD) корпоративного класса стоят значительно дороже накопителей на жестких дисках, устранение дублирования повлечет за собой уменьшение потребности в емкости хранения и превратит флэш-память в достаточно эффективную и высокопроизводительную альтернативу жестким дискам.
«Если цена не имеет особого значения, было бы удобно перенести все данные на накопители на основе флэш-памяти, – говорится в опубликованном недавно отчете Forrester Research. – Они не только значительно опережают вращающиеся диски по скорости работы, но и не имеют движущихся частей, потребляют меньше энергии, не тратят времени на поиск данных и обладают постоянным быстродействием. Ни один жесткий диск не в состоянии конкурировать с ними по этим параметрам».
Во внешних дисковых массивах устройства SSD занимают верхний уровень хранения и дополняются высокоемкими жесткими дисками SATA, а также обладающими меньшей емкостью, но более высокой производительностью накопителями с интерфейсами SAS и Fibre Channel. Идея многоуровневой инфраструктуры заключается в том, чтобы размещать на высокопроизводительных накопителях данные, к которым обращение производится чаще всего. А данные, используемые реже, переносятся на более емкие и дешевые жесткие диски.
Крупные производители многоуровневых систем хранения интегрируют в существующие дисковые массивы высокопроизводительные флэш-накопители, которые устраняют узкие места в подсистеме ввода-вывода. При этом ИТ-администраторы должны знать, какие данные размещаются на SSD. Облегчить их задачу призвано зарождающееся сегодня программное обеспечение автоматизации многоуровневого размещения данных.
Высокая стоимость и трудности управления
По мнению представителей Forrester, SSD могут обойтись в десять раз дороже жестких дисков. Другие исследовательские фирмы говорят о еще более значительном ценовом разрыве. Аналитики компаний iSuppli и Objective-Analysis утверждают, что средняя стоимость SSD составляет приблизительно 17 долл. в пересчете на гигабайт. Ожидается, что в следующем году она уменьшится до 12 долл., а к 2015 году упадет до 5 долл.
Многоуровневые архитектуры позволяют добиться улучшения производительности и более эффективного использования пространства хранения, но при этом порождают дополнительные трудности, связанные с управлением данными.
Во многих корпоративных ИТ-подразделениях передовые инструменты анализа производительности средств хранения не используются, поэтому сотрудникам приходится вручную определять, каким данным требуется более высокое быстродействие, и вручную перемещать их в нужное место в рамках многоуровневой архитектуры. Кроме того, подмножества данных, к которым обращение производится чаще всего, имеют свойство меняться с течением времени. Это означает, что в процессе работы ИТ-персоналу придется заниматься мониторингом обращения к данным и их перемещением.
Даже при наличии программного обеспечения автоматизации многоуровневого хранения (например, систем Dell Compellent Fluid Data и EMC Fully Automated Storage Tiering) адаптация существующих систем, не приспособленных для перемещения различных подмножеств томов данных, будет сопряжена с серьезными трудностями.
«Эффективность таких решений с привязкой и без привязки к их стоимости значительно отличается, – подчеркивают авторы отчета Forrester. – За постоянное перемещение придется расплачиваться некоторым снижением производительности. Кроме того, информация, используемая при принятии решений, отстает от текущей ситуации – отсутствие частого обращения к той или иной порции данных в недавнем прошлом вовсе не означает, что этого не произойдет в будущем».
Встроенная система устранения дублирования
Сейчас в моду входит новая архитектура, полностью построенная на SSD. Встроенная система исключения дублирования данных используется здесь для снижения требований к емкости хранения путем устранения избыточных объемов данных еще до записи их на диск.
Такой подход оказывается даже более эффективным, чем исключение дублирования данных, хранящейся одновременно на устройствах обоих типов. Благодаря более высокой производительности и отсутствию задержек при обращении к данным на SSD обработка процедуры исключения дублирования ускоряется по сравнению с ее выполнением на гибридных и флэш-дисках.
Между флэш-памятью NAND корпоративного класса на одноуровневых ячейках (Single-Level Cell, SLC) и флэш-памятью на многоуровневых ячейках (Multi-Level Cell, MLC) есть весьма существенная разница с точки зрения производительности, срока службы и цены. В одной ячейке памяти SLC хранится только 1 бит данных, а в одной ячейке памяти MLC – 2 или 3. Зато память с одноуровневыми ячейками отличается более высокой производительностью, а срок ее службы в десять раз превышает срок службы памяти MLC.
В настоящее время цена флэш-памяти NAND, выполненной в виде твердотельного диска, составляет примерно 9 долл. за гигабайт для SLC и 3 долл. за гигабайт для MLC. Новый класс флэш-памяти с многоуровневыми ячейками (получивший название enterprise MLC или eMLC) выдерживает в 30 раз больше циклов перезаписи по сравнению с бытовой технологией MLC и стоит на 20% дороже.
Для сравнения, цена традиционных накопителей с интерфейсом Fibre Channel или SAS в пересчете на гигабайт составляет 50-60 центов.
Компании Fusion-io, Texas Memory Systems, Micron и Virident Systems выпускают флэш-карты NAND с интерфейсом PCIe. Их можно использовать в массивах, состоящих только из флэш-памяти, и в серверах приложений. Цены на такие устройства пока весьма высоки, но то же самое относится и к производительности, которая находится на очень приличном уровне благодаря высокоскоростным межкомпонентным соединениям и близости флэш-памяти к центральному процессору.
В отчете Forrester были рассмотрены SSD-предложения трех производителей: Nimbus Data Systems, Pure Storage и SolidFire.
«Другие поставщики тоже выпускают массивы, объединяющие исключительно твердотельные диски, – пояснил аналитик Forrester и ведущий автор отчета Эндрю Рейхман. – Но у них нет встроенной системы исключения дублирования, поэтому мы не включали их в наше исследование».
Разработчики Nimbus обеспечивают самую широкую поддержку различных протоколов, предоставляя пользователям возможность подключаться к контроллерам через интерфейсы Fibre Channel, Gigabit Ethernet или 10GbE iSCSI, CIFS, NFS и Infiniband.
Недавно компания eBay развернула у себя SSD-массив Nimbus емкостью 100 Тбайт, который должен помочь устранить узкие места в сетевой системе хранения. Массив Nimbus S-Class помог eBay уменьшить свои потребности в стоечном пространстве на 50% и снизить энергопотребление на 78%. Еще более важным представляется то, что производительность твердотельных дисков позволила сократить время, требуемое для запуска новой виртуальной машины, с 45 до 5 минут.
Решение Nimbus базируется на двух контроллерах, поддерживающих до 23 серверов хранения x86-архитектуры высотой 2U на кластер, заполненных флэш-памятью eMLC. Система поддерживат до 250 Тбайт дискового пространства. Средства исключения дублирования предоставляются опционально. Цены на свои продукты Nimbus назначает в пересчете на терабайт. За каждый терабайт дисковой емкости клиентам предлагается заплатить 10 тыс. долл.
Компания Pure Storage также поставляет систему с двумя контроллерами общей емкостью до 22 Тбайт. В перспективе разработчики намерены увеличить как ее производительность, так и емкость. Pure Storage предлагает своим клиентам высокий уровень готовности – оба контроллера постоянно находятся в активном состоянии. Внутренняя система сжатия и устранения дублирования постоянно задействована и позволяет обрабатывать блоки размером не менее 512 байт. При розничной цене в 5 долл. за гигабайт массив объемом 22 Тбайт обойдется покупателям в 110 тыс. долл.
И наконец, компания SolidFire в январе планирует представить масштабируемую кластерную систему хранения, наполненную флэш-памятью с многоуровневыми ячейками. Ожидается, что оборудование будет поддерживать устранение дублирования и сжатие данных. Технология тонкого резервирования (thin provisioning) позволит системе выделять серверам приложений дисковое пространство по мере возникновения такой потребности, тогда как при традиционном полном резервировании (over provisioning) все свободное пространство выделяется сразу. Система, которая предлагает гарантированный уровень сервиса, использует только протокол iSCSI. Это делается для того, чтобы удержать цены на относительно низком уровне. Максимальная емкость системы должна достичь 1000 Тбайт, или 1 Пбайт.
В своем отчете аналитики Forrester предупреждают, что все массивы SSD появились на рынке недавно (в текущем или в прошлом году) и должны быть тщательно изучены потенциальными пользователями. Необходимо проверить механизмы создания моментальных снимков данных и выполнения репликаций, а также оценить совместимость систем с имеющимися приложениями. Целесообразность развертывания инфраструктуры твердотельных накопителей во многом зависит от эффективности средств устранения дублирования.
«Эффективность по отношению к затратам будет определяться темпами снижения цен на флэш-память, – говорится в отчете. – И если вы не устраните дублирование, приблизиться к стоимости жестких дисков вам не удастся».
Улучшение работы средств исключения дублирования требует большой вычислительной мощности процессора (с тем, чтобы внутренние процедуры не снижали общую производительность) и эффективного алгоритма устранения дублирования.
«Устранение дублирования позволяет приблизить стоимость твердотельной архитектуры к стоимости жестких дисков, – отметил Рейхман. – Осталось только посмотреть, действительно ли предлагаемая альтернатива жестким дискам окажется жизнеспособной».