То, что виртуализация систем хранения данных предлагает целый ряд преимуществ, большинство директоров по информационным технологиям понимают уже давно. К важнейшим плюсам относится улучшение распределения нагрузки на имеющиеся системы хранения, причем в единый пул хранения можно интегрировать дисковые массивы одного производителя. Кроме того, объем выделяемого в качестве резерва свободного места сокращается, поскольку оно предоставляется центральным пулом и уже не должно выделяться каждому серверу.

Все большим спросом пользуются виртуальные ленточные библиотеки (Virtual Tape Library, VTL) — специальное решение для быстрого резервирования и восстановления данных. Речь идет о дисковых массивах, которые при помощи специального программного обеспечения эмулируют все функции ленточной библиотеки. Причина такого успеха заключается прежде всего в высокой скорости обработки информации. Процесс резервного копирования становится заметно короче, поскольку данные пишутся не на ленту, а на дисковую систему. При восстановлении данных преимущество в скорости (по сравнению с традиционными ленточными библиотеками) имеет еще большее значение. Кроме того, виртуальные ленточные библиотеки хорошо интегрируются в имеющуюся инфраструктуру резервного хранения, поскольку они ведут себя как обычные ленточные библиотеки.

Это оборудование выпускают уже многие производители. К таковым, к примеру, относится компания Quantum со своими системами DX, а также приобретенное ею предприятие ADIC, разработавшее семейство продуктов Pathlight-VX. Fujitsu Siemens Computers уже в течение нескольких лет предлагает решение VTL, которое, как и системы Pathlight производства ADIC, интегрирует механизм резервного копирования на ленту (Disk-to-Disk-to-Tape). К ветеранам в области решений резервного копирования на диск относится и IBM. В ее решении IBM Tivoli Storage Manager (TSM) в качестве первичной цели для защиты серверов уже давно используется дисковый пул, откуда лишь через некоторое время данные переписываются на подключенные к серверам TSM ленточные библиотеки. У IBM имеются и выделенные виртуальные библиотеки, как и у Sun, которая предлагает систему Storagetek Virtual Tape Library. Дисковые библиотеки CLARiiON компании ЕМС базируются на программном обеспечении VTL компании FalconStor. В этой области работает также Overland Storage, которая производит системы Reo, а компания Network Appliance представила в прошлом году решение VTL на базе платформы для предприятий среднего размера FAS3000.

УСТРАНЕНИЕ ДУБЛИРОВАНИЯ ЭКОНОМИТ МЕСТО ХРАНЕНИЯ

Последняя тенденция в области виртуальных ленточных библиотек заключается в их комбинировании с так называемыми решениями для устранения дублирования. Эта технология позволяет заметно сократить объем сохраняемых данных благодаря тому, что все файлы проверяются на уровне блоков и идентичные блоки сохраняются лишь один раз. Система определяет, к каким файлам относится блок, при помощи метаданных. В зависимости от типа объем сохраняемых данных сокращается в результате в десять, а то и в пятьдесят раз.

Компания Quantum недавно представила решение VTL нового поколения DXi, где поддерживается технология устранения дублирования. Речь идет о системе поточной обработки, в которой дублирование предотвращается уже при сохранении данных в виртуальной ленточной библиотеке, но скорость резервного копирования оказывается ниже, чем при копировании с дублированием. Чтобы обеспечить высокую производительность, системы DXi проводят дедупликацию не в реальном времени, а с небольшой задержкой. Сохраняемые данные записываются сначала в систему VTL, где делятся на блоки объемом 256 Мбайт. Если блок доступен свыше 30 с, он маркируется как кандидат на дедупликацию и несколько позже обрабатывается системой. Между тем сохранение данных в виртуальной ленточной библиотеке продолжается. Преимущество устранения дублирования с небольшой задержкой заключается в том, что скорость сохранения виртуальной ленточной библиотеки остается относительно постоянной и варьируется не столь значительно, как в случае дедупликации в реальном времени. Уже в этом году Quantum собирается выпустить еще одну систему, благодаря которой администратор сможет выбирать, когда будет устраняться дублирование — в процессе сохранения или после его завершения.

Систему поточной обработки предлагает и компания Data Domain, точно такое же название получила выпускаемая ею система устранения дублирования. На поточном устранении дублирования специализируется Diligent. Продукты семейства Protectier поддерживают эту технологию вместе с высокопроизводительной виртуальной ленточной библиотекой и предназначены главным образом для крупных предприятий. Решение Diligent продает, среди прочих, компания HDS. ЕМС тоже начала осваивать этот рыночный сегмент и приобрела себе необходимое ноу-хау в области устранения дублирования вместе с компанией Avamar.

К производителям решений устранения дублирования с задержкой относится FalconStor. Новая технология представлена на рынке в качестве дополнения к решению VTL и называется Single Instance Repository (SIR). Виртуальную ленточную библиотеку производства FalconStor — под маркой CLARiiON Disk Library — будет продавать компания ЕМС.

В текущем году на рынок устранения дублирования намерен выйти еще один тяжеловес сегмента хранения данных. Network Appliance объявила, что ее собственные системы VTL будут расширяться за счет соответствующих функций. Новые решения устранения дублирования позволяют заметно сократить объем сохраняемых данных. Если техника сможет выполнить обещания производителей, то инвестиции в подобные продукты окупятся довольно быстро.

МНОГОУРОВНЕВОЕ ХРАНЕНИЕ ОПТИМИЗИРУЕТ ЗАТРАТЫ

Снижение затрат является важным движущим фактором для внедрения решений иерархического хранения, реализация которых существенно упрощается благодаря новым последовательным технологиям передачи данных SAS и SATA. По сравнению с параллельной технологией SCSI, достигшей своего предела с точки зрения скорости передачи, они предлагают заметно более высокую гибкость. Значительное преимущество последовательных протоколов заключается в том, что с одним и тем же контроллером хранения можно использовать как диски SAS, так и диски SATA. Некоторые производители поддерживают даже смешанное применение обоих типов жестких дисков (см. Рисунок 1).

Рисунок 1. При помощи решений многоуровневого хранения данных, к примеру, Tiered Storage Manager от HDS, предприятия могут гибко распределять свои данные по недорогим системам SATA и высокопроизводительным корпоративным массивам.

Таким образом, построить иерархию хранения из двух уровней достаточно легко: в системе хранения можно параллельно использовать недорогие диски SATA для данных с невысокими требованиями к производительности и диски SAS для требовательных приложений. Некоторые производители предлагают подобные системы вместе с решением виртуализации. С их помощью, к примеру, без прерывания работы данные с тома SAS будут копироваться в том SATA. Возможен и обратный вариант.

Причина не слишком широкого распространения классической виртуализации хранения заключается в том, что до сих пор в этой области нет единого стандарта. Спецификация инициативы по управлению хранилищами (Storage Management Initiative Specification, SMI-S), утвержденная Отраслевой ассоциацией сетевых систем хранения данных (Storage Networking Industry Association, SNIA), стала важным шагом к тому, чтобы в будущем подобные решения воспринимались более благосклонно.

Наряду с улучшенным распределением нагрузки на имеющиеся ресурсы хранения еще одним преимуществом решений виртуализации является интеграция различных протоколов, в числе которых — Fibre Channel (FC), iSCSI (Internet SCSI по IP) и NAS (NFS или CIFS). Кроме того, благодаря виртуализации поддерживаются такие функции, как создание моментальных снимков, клонирование, зеркалирование, тиражирование, резервное копирование без обращения к локальной сети или серверу, управление иерархическим хранением (Hierarchical Storage Management, HSM), а также инструменты миграции данных различных производителей.

Решения виртуализации могут быть симметричными (In-Band) или асимметричными (Out-of-Band). В первом случае система виртуализации устанавливается непосредственно на маршруте передачи данных между системами хранения и серверами. Преимущество такого подхода заключается в отсутствии необходимости установки агентов на системах хранения и серверах. Однако при очень высоких требованиях к производительности решение виртуализации может стать «бутылочным горлышком», поскольку через них производятся все операции ввода/вывода.

Асимметричные решения отличаются тем, что система виртуализации располагается вне маршрута передачи данных. Они управляют лишь метаданными и операциями ввода/вывода, для чего взаимодействуют с агентами или контролируют трафик ввода/вывода через коммутатор сети хранения данных. Благодаря этому обеспечивается очень хорошая масштабируемость. К наиболее известным представителям этой категории относятся ЕМС с решением виртуализации Invista, которое интегрируется в коммутаторы SAN, а также недавно приобретенное компанией LSI предприятие Storeage со своим продуктом Storage Virtualization Manager (SVM). Invista выпускается для коммутаторов сетей хранения данных производства компаний Brocade/McData и Cisco. Наряду с управлением томами решение поддерживает клонирование для миграции данных и удаленного тиражирования. Computer Associates предлагает разработанное компанией Storeage решение SVM в комбинации со своими продуктами CA BrightStor для управления данными и их хранением. Интегрированное решение имеется и у компании Qlogic, которая продает SVM вместе со специализированным устройством для сетей хранения данных компании Troika, сделка о покупке которой завершилась в конце 2005 г. Особенность решения SVM от Qlogic заключается в том, что агенты на серверы устанавливать не требуется.

Большая часть предприятий, уже применяющих технологии виртуализации хранения, имеют в сво-ем арсенале симметричные решения. Наиболее успешным поставщиком является IBM с решением SAN Volume Controller (SVC). Программное обеспечение для виртуализации работает на кластерной платформе Linux, которая хорошо масштабируется благодаря возможности добавления новый системы. Специализированные производители, к примеру DataCore и FalconStor, уже долгие годы подтверждают пригодность своих симметричных продуктов для виртуализации хранения на практике. Наряду с протоколом Fibre Channel обе компании поддерживают виртуализацию систем хранения iSCSI.

Hitachi Data Systems (HDS) предложила третий вариант виртуализации хранилищ, и он, видимо, будет пользоваться успехом: платформа Unified Storage Platform (USP) интегрирует решение виртуализации непосредственно в систему хранения данных. При помощи USP дисковые массивы других производителей могут подключаться в качестве так называемых внешних логических устройств (Logical Unit Number, LUN). Таким образом, все необходимые функции, в том числе создание моментальных копий, тиражирование и теневое копирование, будут доступны и в системах хранения третьих производителей. В области систем старшего класса USP включает системы Tagmastor от HDS. Те же функции предоставляет NSC 55 и для систем среднего класса.

Чтобы упростить управление крупными сетями хранения данных, многие производители предлагают виртуальные файловые системы. Так, Brocade выпускает систему StorageX, которая предоставляет глобальное пространство имен и может объединять файлы из разных серверных платформ и систем хранения в единый логический пул данных. Для обозначения новых технологий Brocade ввела понятие файловой сети (File Area Network, FAN).

Network Appliance продает решение StorageX под названием Virtual File Manager (VFM). Программное обеспечение будет полезно при миграции крупных массивов данных. ЕМС некоторое время назад приобрела компанию Rainfinity, которая разработала похожее решение для виртуализации файлов в распределенных сетях. Но и новые предприятия, к примеру Acopia, пытаются утвердиться в этом рыночном сегменте. В случае системы виртуализации файлов ARX от Acopia речь идет о симметричном решении, которое предоставляет протоколам NFS и CIFS виртуальное пространство имен. С его помощью можно отделить доступ клиентов к файлам от физического аппаратного обеспечения без применения агентов (см. Рисунок 2).

Рисунок 2. Виртуализация на уровне файловой системы делает файлы независимыми от их физического места хранения, что упрощает управление хранением данных.

Производитель ADIC, вошедший в состав компании Quantum, тоже предлагает файловую метасистему, которая способна объединять различные файловые системы в общее хранилище. Недавно Quantum представила новую версию Stornext с интегрированной системой устранения дублирования. Теперь предприятия смогут использовать дедупликацию не только с виртуальными ленточными библиотеками, но и независимо от них, на уровне файловой системы.

Непрекращающийся рост объемов данных заставляет предприятия постоянно расширять емкость своих систем хранения, поэтому наиболее экономичными являются решения хранения, которые расширяются без значительных издержек. Так, Pillar Data Systems предлагает решение многоуровневого хранения Axiom, которое должно помочь сократить расходы благодаря простому управлению хранилищами. 3PAR в своих решениях хранения делает ставку на систему целевого предоставления необходимой емкости, в основе которой лежит ячеистая архитектура. По данным производителя при помощи этой системы общие издержки на хранение данных можно будет сократить на 50%, а затраты на расширение емкости — на 75%.

РАСПРЕДЕЛЕННЫЕ ВЫЧИСЛЕНИЯ

Еще одним эффективным подходом к предоставлению ресурсов хранения являются так называемые распределенные вычисления (grid computing). Компания HP разработала решение с применением распределенных вычислений RISS, в рамках которого отдельные ячейки могут выполнять различные задачи. К примеру, определенная ячейка в течение некоторого времени работает в качестве сервера файлов, а потом используется как архивный сервер. С серверными решетками уже очень активно работает Sun. В области хранения эта компания разрабатывает ячеистую сеть хранения под названием Honeycomb, которая объединяет большое количество узлов хранения в единую систему. Данные распределяются по разным узлам при помощи так называемой системы распределенного размещения данных, благодаря чему достигается максимальная производительность. Емкость и производительность масштабируются путем добавления дополнительных узлов хранения, распознаваемых системой автоматически. IBM также собирается предлагать сервисы ячеистых сетей хранения, причем это направление развивается в рамках программы вычислений по требованию, предусматривающей предоставление необходимых вычислительных мощностей и ресурсов хранения. Безусловно, это интересное предложение, поскольку компании платят только за то, что они на самом деле используют.

Кристоф Ланге — постоянный внештатный сотрудник LANline.


© AWi Verlag