По данным исследования IDC «Worldwide All-Flash Array and Hybrid Flash Array 2014–2018 Forecast and 1H14 Vendor Shares» (IDC #252304), объем рынка систем на базе флеш-технологий в 2014 году составил 11,3 млрд. долл. Стремительный рост показали оба его основных сегмента — и системы, выстроенные целиком на основе флеш-памяти (их рынок оценивается в $1,3 млрд.), и гибридные флеш-массивы ($10 млрд.). В исследовании подчеркивается увеличение числа надежных решений, способных справиться со сложной растущей нагрузкой, в том числе созданием «снимков» (snapshots) информационных систем, клонов, шифрованием данных, репликацией и управлением качеством предоставляемых ИТ-сервисов (QoS). На рынке появляются системы на базе флеш-технологий, обладающие все более высокой производительностью, надежностью и улучшенными экономическими характеристиками.
Благодаря массовому распространению флеш-массивов серьезные изменения предстоят многим центрам обработки данных, причем это касается не только СХД, но и самих методологий работы с данными и управления ими. Так, уже сегодня появляется множество специализированных программно-аппаратных решений, включающих в себя СХД и оптимизированных для работы с наиболее популярными СУБД и бизнес-приложениями, такими как SAP, Oracle и пр. Также активно развиваются платформы, максимально учитывающие специфику флеш-СХД и обеспечивающие эффективное управление этими системами, в том числе сжатие и дедупликацию хранимых на них данных.
«По своему опыту можем сказать, что флеш действительно в десятки раз увеличивает производительность бизнес-систем. Это показывают и наши проекты для заказчиков, и внедрение флеш-СХД в инфраструктуру публичного облака КРОК. В нем можно размещать самые высоконагруженные приложения, и, что очень важно, предупредить возможную конкуренцию заказчиков внутри облака за вычислительные ресурсы», — отметил Руслан Заединов, заместитель генерального директора КРОК.
Вызовы и задачи для флеш-массивов
Флеш-диски и флеш-массивы появились как нельзя кстати. Старожилы ИТ-отрасли наверняка помнят «гонку» процессоров, когда ведущие производители CPU свои главные усилия прилагали для увеличения рабочей тактовой частоты своей продукции, и рост производительности компьютеров происходил в первую очередь за счет «разгона» процессоров. В результате образовался колоссальный разрыв между быстродействием процессоров и скоростью их обмена с оперативной памятью, с одной стороны, и скоростью доступа к дисковым подсистемам — с другой. Ликвидировать эту пропасть помогли флеш-технологии.
Как раз к началу массового распространения флеш-технологий появилось множество новых задач, справиться с которыми, опираясь на традиционные технологии жестких дисков, практически невозможно. В частности, все более высокими становились требования к производительности и доступности развернутых бизнес-приложений, а сами приложения — все более сложными и «тяжелыми». Рост данных (причем и структурированных, и неструктурированных) за последнее время стремительно ускорился, в том числе за счет данных, собираемых из социальных сетей и генерируемых Интернетом вещей. Все чаще бизнесу требуется практически мгновенная обработка данных, максимально приближенная к реальному времени. Претерпевают эволюционный скачок современные СУБД — рынок предлагает системы на базе новых архитектур, ориентированных на Большие Данные и обработку информации в оперативной памяти (in-memory).
Новые задачи появились и в отношении систем хранения данных: в частности, бизнес-заказчики требуют от вендоров обеспечить возможность мгновенной репликации данных, предельно быстрое резервное копирование и восстановление данных для обеспечения непрерывности бизнеса, сильно зависящего от ИТ, шифрование хранимых данных без заметного ущерба для производительности ИТ-систем, которые с ними работают, и другие полезные возможности.
Преимущества флеш и факторы окупаемости
Появление флеш-технологий в системах хранения данных позволило существенно (на десятки процентов, а нередко и в разы) повысить производительность бизнес-систем, не внося при этом никаких изменений в их код или архитектуру. Отклик приложений стал гораздо более быстрым. Как следствие, возросла производительность труда сотрудников, ускорились бизнес-процессы, у менеджеров появилась возможность за время, отведенное на принятие решений, обработать больше информации, глубже исследовать ситуацию, смоделировать различные варианты событий и реакции на них и принять более взвешенные решения.
Не секрет, что первые флеш-системы были не очень надежными, однако технологии совершенствуются, и надежность нынешних флеш-массивов не вызывает сомнений. Те, кто внедрил их у себя, особо отмечают их высокую компактность при размещении в ЦОД, а также отличные показатели энергоэффективности. Другими словами, переход на флеш-массивы позволяет хранить и быстро обрабатывать гораздо больше данных, чем это можно было сделать, используя традиционные массивы хранения на жестких дисках, причем расходы на электроэнергию (а это серьезная статья затрат в современных ЦОД) оказываются намного ниже.
У СХД, целиком построенных на базе флеш-технологии (All-Flash Array, AFA), единственным существенным недостатком остается высокая цена. Но в ряде случаев использование таких СХД позволяет добиться реального эффекта и за короткий срок окупить затраты на оборудование. Яркий пример — высоконагруженные системы в организациях, сильно зависящих от ИТ, таких как банки, телекоммуникационные компании, крупные розничные сети и интернет-магазины.
Впрочем, использование флеш-технологий в СХД дает потрясающий эффект и в случаях, когда далеко не все диски сделаны на ее основе. Речь идет, конечно, о гибридных массивах. К ним, в частности, относятся последние модели массивов EMC VNX, VNXe, VMAX, Isilon. Комбинация из одного-двух флеш-дисков в сочетании с HDD позволяет повысить производительность СХД на 20-30% по сравнению с системами на базе исключительно жестких дисков. Более того, во многих случаях именно такая комбинация целесообразна: флеш-диски хранят наиболее востребованные в данный момент данные, тогда как жесткие диски могут хранить данные, доступ к которым прямо сейчас не требуется, а также, например, неструктурированные данные — изображения, видео, аудиозаписи, архивы электронной почты и пр. Для наращивания возможностей существующих массивов хранения путем экономичного увеличения емкости флеш-памяти предназначены пакеты EMC Flash PowerPack — наборы фиксированного количества флеш-накопителей по сниженной цене.
Еще один «гибридный» подход позволяет реализовать продукт EMC ScaleIO — программный инструментарий для создания серверной сети хранения данных на основе локального хранилища сервера приложений, что обеспечивает гибкую и масштабируемую производительность и емкость по требованию. При использовании ScaleIO весь ввод-вывод агрегируется и становится доступным для любого приложения в кластере. В обслуживании запросов ввода-вывода участвуют все серверы, обеспечивая высокий уровень параллельной обработки. В отличие от большинства традиционных систем хранения, рост количества серверов не приводит к уменьшению пропускной способности и количества операций ввода-вывода в секунду — таким образом исключаются узкие места. Система хранения благодаря ScaleIO является просто еще одним приложением, которое выполняется вместе с другими приложениями, а каждый сервер становится строительным блоком глобального кластера ресурсов хранения и вычислительных ресурсов. Ресурсы хранения и вычислительные ресурсы с помощью ScaleIO можно наращивать или сокращать с учетом возникающих потребностей. Система автоматически выполняет балансировку данных «на лету», без отключения систем. Производительность масштабируется линейно и оптимизируется автоматически, а соотношение стоимости и производительности улучшается по мере роста. Для управления производительностью можно настроить ручное распределение данных по уровням, используя пулы хранения данных. Можно создать уровень производительности с малой задержкой, используя флеш-диски с большой полосой пропускания. Недорогие вращающиеся диски можно использовать для создания уровня с большой емкостью.
В последнее время все больше появляется гибридных массивов, спроектированных специально для работы с конкретными приложениями или задачами. В этом случае удается добиться еще большей производительности за счет тщательной «подгонки» всех компонентов массива под особенности конкретной нагрузки. В скором времени ожидается появление массивов, ориентированных, в частности, на работу с СУБД с обработкой данных в оперативной памяти (in-memory).
Итак, основные преимущества и факторы окупаемости флеш-массивов — высокая производительность, компактность при размещении в ЦОД, высокая энергоэффективность и возможность решения задач, практически недоступных прежде для систем хранения на базе жестких дисков, а также создание СХД, ориентированных на конкретные задачи и приложения.
Самые современные флеш-технологии
Чтобы раскрыть всю мощь современных массивов, целиком построенных на базе флеш-технологий, проведем краткий экскурс в историю их появления.
Первые флеш-массивы создавались в эпоху, когда твердотельные диски (Solid State Disk, SSD) стоили весьма дорого, были не очень надежны, тем не менее прирост производительности, который они давали, стоил того, чтобы закрыть глаза на сопутствующие риски. Массовое их появление началось примерно в 2008 году. Это были модели, в которых традиционные жесткие диски заменялись на твердотельные, при этом архитектура управления ими практически не менялась, а потому эти массивы демонстрировали далеко не все возможности, на которые была способна флеш-технология.
Немного позже, в 2011-2012 годах, появились флеш-массивы следующего поколения. Их главной особенностью было то, что архитектура изначально строилась с учетом особенностей флеш-технологии, а система управления дисками была переписана, чтобы оптимизировать скорость доступа, физический износ флеш-дисков и решить другие проблемы.
Примерно в это же время весьма актуальными для бизнес-заказчиков стали новые задачи, такие как мгновенные «снимки», дедупликация данных «на лету», мгновенная репликация данных, их шифрование и пр. Большинство вендоров, в портфелях которых к тому времени уже имелись флеш-массивы, пошли по пути адаптации архитектур своих СХД с учетом новых требований заказчиков. «Проще говоря, они принялись добавлять в системы хранения «шлюзы», обеспечивающие решение новых задач. На деле это выглядит примерно так же, как достраивание речного теплоходика до океанского судна: сделать-то, конечно, можно, но переделанный корабль — это все-таки переделанный корабль, который неизбежно будет уступать по своим возможностям кораблю, изначально рассчитанному на плавание в бурных водах океана», — поясняет Руслан Заединов.
Именно эту идею подхватили разработчики нового поколения СХД: они уже на начальном этапе проектирования архитектуры своих продуктов заложили в них новые возможности, которые требовались заказчикам. В результате появились флеш-массивы, в которых встроенные сервисы управления данными обеспечивают дедупликацию, создание компактных мгновенных «снимков» и шифрование работают органично, так что выполнение этих сервисов практически не оказывает влияния на общий уровень производительности массивов. Яркий пример нового поколения массивов на флеш-дисках — продукт EMC XtremIO, обеспечивающий высокую скорость работы, консолидацию и гибкость приложений в сочетании с горизонтальной масштабируемостью, стабильно малой задержкой и высоким показателем IOPS. Все это позволяет значительно повысить производительность приложений и улучшить условия работы пользователей и системных администраторов, обеспечивая предсказуемую сбалансированную нагрузку, дедупликацию и сжатие данных, тонкое прогнозирование поведения системы, защиту данных, получение компактных мгновенных снимков, шифрование и пр. Массивы XtremIO идеально подходят для виртуализации рабочих мест (Virtual Desktop Infrastructure, VDI), создания виртуальных серверных сред, работы с высоконагруженными базами данных и аналитическими системами.