Технологии массового хранения неудержимо продвигаются в направлении большей емкости и лучшей производительности. Однако улучшение характеристик устройств хранения несет с собой дополнительные требования. В статье рассказывается о достижениях в области систем хранения и даются советы с целью облегчить правильный выбор необходимых компонентов.

«Жесткого диска объемом 640 Кбайт должно хватить каждому». Более далеким от реальности, чем Билл Гейтс с этим достаточно знаменитым высказыванием в 1981 г., быть, наверно, нельзя. Упомянутых 640 Кбайт хватит ныне разве что для дискеты, все остальное давно измеряется в мега- и гигабайтах. Жесткие диски объемом 100—120 Гбайт уже давно стали обыденностью, а серверы теперь располагают емкостью, которой всего несколько лет назад оснащались системы резервного копирования данных. Последние, в свою очередь, как и крупные системы хранения, переступили терабайтные границы.

Однако насыщения потребности в растущих объемах хранения пока не видно. Современный пакет офисных приложений занимает четверть гигабайта, а самые обычные письма — нередко больше мегабайта. Плюс еще новые приложения — организация информационных хранилищ, управление цепочками поставок и прочие программы электронного бизнеса. В результате сети непомерно разрастаются, и крупные компании с большим количеством серверов уже не знают, как и где разместить непрерывно растущие объемы данных. Конца и края этому не видно, и маркетологи компании IDC исходят в своих прогнозах на будущее из удвоения годового ритма.

ТРАДИЦИОННЫЕ И СОВРЕМЕННЫЕ

Наиболее распространенной, универсальной и важной массовой системой хранения является жесткий диск. Один диск можно сегодня встретить лишь на домашнем компьютере — все устройства, служащие для хранения данных в сетях, оснащаются несколькими жесткими дисками. Изначально правилом хорошего тона считалось применение в качестве шины в серверах исключительно интерфейса малых компьютерных систем (Small Computer Systems Interface, SCSI). Протокол развивался многие годы, вплоть до появления SCSI III, новейший вариант которого (Ultra320) обладает пропускной способностью 320 Мбайт/с. Высокая скорость передачи данных, возможность подключения до 15 устройств к одной шине и длина кабеля до 12 м (в зависимости от стандарта) создали предпосылки для использования SCSI во всех серьезных серверных приложениях.

Ответ на вопрос, способны ли разработчики извлечь из шины SCSI еще большую производительность, зависит от степени оптимизма отвечающего. С уверенностью можно лишь сказать, что по мере роста частот производители сталкиваются со все большими сложностями достижения разумной длины кабеля.

Единственный недостаток SCSI — цена. Высококачественные серверные диски приблизительно втрое дороже диска IDE аналогичной емкости. Несмотря на то что до недавних пор они рассматривались в первую очередь как устройства младшего класса, жесткие диски IDE составляют SCSI серьезную конкуренцию. Разработчики далеко продвинулись и в улучшении первоначального стандарта ATA. Самым передовым представителем этой технологии стал ATA/ATAPI с пропускной способностью 133 Мбайт/с. Основным недостатком жестких дисков IDE является управление по схеме «главный-подчиненный» (master slave), из-за чего количество дисков в системе ограничено: на один канал контроллера устанавливается только два диска. В обычном компьютере всего лишь два контроллера, поэтому количество дисков не может быть больше четырех. Этого слишком мало даже для сервера среднего размера, а крупные системы и без того остаются доменами SCSI. Единственное исключение составляют специальные контроллеры с поддержкой большого количества каналов, благодаря чему они позволяют подключать до 12 дисков IDE.

Рисунок 1. Последовательный интерфейс ATA в сравнении с параллельным ATA.
Приблизительно год назад на рынке появилась новая технология — Serial ATA (SATA). Стандарт, в отличие от предыдущих, где использовались 40- или 80-контактные плоские ленточные кабели, предусматривает тонкий семиконтактный последовательный кабель (см. Рисунок 1). SATA поддерживается основными производителями, а технические данные весьма многообещающи. Пропускная способность, равная 150 Мбайт/с в первом поколении, а позднее и 600 Мбайт/с, заметно более тонкие кабели и штекеры меньшего размера, так что корпус не загромождается даже при нескольких установленных жестких дисках — SATA вполне может составить конкуренцию жестким дискам SCSI. При этом цены на продукты не самые высокие, дополнительные издержки на приобретение одного жесткого диска не превысят 3—7 долларов. По мнению аналитиков Gartner, SATA займет 98% рынка уже в 2005 г.

Вследствие последовательной передачи данных, технология SATA должна работать с более высокой тактовой частотой, поэтому для передачи данных и управления применен известный по SCSI метод низковольтного дифференциала (Low Voltage Differential, LVD). Это позволяет использовать кабели длиной до 1 м. Принцип «главный-подчиненный» больше не применяется, с каждым портом SATA связано только одно устройство. В случае возникновения проблем контроллер может намеренно игнорировать какой-либо порт или вовсе его отключать. Рынок пока не предлагает достаточного количества жестких дисков с шиной SATA, но, если объявленные значения производительности будут соответствовать реальности, они действительно смогут конкурировать с контроллерами SCSI, по крайней мере среднего класса.

В области локальных сетей один-единственный диск погоды не сделает, поэтому гибкие системы массового хранения чаще всего группируют. Общепринятая технология — массив недорогих дисков с избыточностью (Redundant Array of Inexpensive Disks, RAID). Изначально были определены пять уровней RAID, но рыночное значение теперь имеют только три: RAID 0, 1 и 5. Ключевое слово, характеризующее технологию RAID, — «готовность». RAID не предназначен для замены резервного копирования, однако предотвращает простои оборудования при необходимости восстановления утерянных данных. Количество отказов, которое способен выдержать один массив, зависит от уровня RAID. Массив первого уровня справляется с потерей до 50% всех носителей данных, в то время как RAID 5, где применяется коррекция данных, способен безболезненно перенести утрату лишь одного жесткого диска из всего массива. Комбинации нескольких уровней RAID обходят это ограничение, но стоят довольно дорого.

Рисунок 2. Такой массив RAID как Starline IFT 6200 может повысить безопасность хранения данных.
Функциональность RAID доступна во многих конструктивных формах и реализациях (см. Рисунок 2). Прежде всего, различают его программные и аппаратные реализации. Впрочем, эта формулировка не вполне корректна — оба варианта при работе используют то или иное программное обеспечение. Но в случае аппаратных реализаций RAID задачу управления жесткими дисками и вычисления контрольных сумм берет на себя специальный контроллер. Наиболее распространенной конструктивной формой контроллеров RAID является плата PCI. В зависимости от производителя для управления используется либо микросхема собственной разработки, либо стандартный процессор с соответствующим встроенным программным обеспечением. Аппаратный RAID разгружает центральный процессор, самостоятельно выполняя все расчеты контрольных сумм. Однако для его работы необходимы соответствующие драйверы для конкретной ОС. Исключение составляют внешние контроллеры, поскольку они воспринимаются системой как плата SCSI, но в действительности объединяют несколько жестких дисков в один массив RAID. В таком случае операционная система никакой роли не играет — достаточно подходящего драйвера для встроенного в компьютер контроллера SCSI.

С началом бума недорогих дисков IDE на рынке стало гораздо больше контроллеров для жестких дисков IDE, чем для систем SCSI.

НУЖНЫ НОВЫЕ КОНЦЕПЦИИ

Несмотря на появление Serial ATA и Ultra 320 SCSI, тот, кто намерен расширить свое хранилище данных путем приобретения жестких дисков большей емкости, не осознает реальных масштабов проблемы. Даже внешние системы хранения данных с подключением к серверу посредством SCSI быстро исчерпывают установленный предел в 15 устройств.

Миграция данных — всегда риск, который не стоит недооценивать: работа сервера может быть парализована на несколько часов, а то и дней. Поэтому у производителей сетевых компонентов довольно скоро возникла идея разместить жесткие диски в отдельно стоящем корпусе и соединить его с сетью при помощи сетевой карты. Эти подключаемые к сети устройства хранения данных (Network Attached Storage, NAS) играют важную роль на многих предприятиях. Серверы NAS легко устанавливаются в любом месте, где есть доступ к сети. Они не привязаны к конкретному серверу, их нетрудно инсталлировать в удобное для специалистов время без выключения системы. Пользователю же все равно, где хранятся его данные — на сервере NAS или на традиционном сервере. Для него месту хранения документов соответствует либо буква, обозначающая конкретный диск, либо название каталога. Большинство серверов NAS предлагает свою емкость различным клиентским операционным системам. Неважно, под управлением какой операционной системы функционирует рабочая станция — Apple, Windows или UNIX, в любом случае она может обращаться непосредственно к серверу и использовать его память.

Поначалу серверы NAS применялись в качестве небольших специализированных устройств для удовлетворения весьма специфических требований. На сегодняшний день доступны системы с самой разной пропускной способностью — от реализаций с одним жестким диском для небольших офисов до избыточных, масштабируемых и мощных в расчете на любые требования. Большинство устройств начального уровня использует в качестве базовой операционной системы либо специальный вариант Windows 2000, либо версию Linux. Серверы же старшего класса имеют собственные операционные системы для обеспечения надлежащей производительности, привязки клиентов и безопасности.

Однако концепция NAS не стала универсальным решением всех проблем, с которыми приходится сталкиваться там, где требуется хранение больших объемов данных. Из-за того, что серверы NAS доступны только через сеть, процесс сохранения информации возлагает значительную нагрузку на сеть. Некоторые продукты обладают собственными интерфейсами для подключения ленточных накопителей для локального сохранения данных. Однако администратору придется управлять всеми этими устройствами. Когда к емкости и управлению предъявляются более высокие требования, нужен другой путь. Всеобщее признание получила архитектура сети хранения (Storage Area Network, SAN). В случае SAN между серверами и устройствами хранения данных создается отдельная высокоскоростная сеть вне сети Ethernet.

В зависимости от типа соединения различают три архитектуры. При соединении «точка—точка» каждый сервер соединяется непосредственно с устройством хранения. Для небольших приложений с предсказуемым ростом это не представляет серьезной проблемы, однако концепция быстро себя исчерпывает. Уровнем выше стоит «петля» Fibre Сhannel с арбитражной логикой (Fibre Сhannel Arbitrated Loop, FCAL), она рассчитана на более крупные сети. Компоненты соединяются посредством концентратора, адреса могут быть заданы для 127 устройств, скорость ограничена 100 Мбайт/с. Крупные системы FCAL вскоре ставят перед администратором те же проблемы, что и SAN «точка—точка».

Лучший вариант SAN называется «фабрика» (Fabric): отдельные устройства соединяются коммутаторами в комплексное высокопроизводительное целое. Современная пропускная способность равна 200 Мбайт/с, «фабрика» может состоять из более чем 100 устройств. Первоначальные проблемы совместимости уже в прошлом; имея общий базис, устройства всех производителей способны работать совместно. Различия остались только в реализации конкретных возможностей: к примеру, в способе логической комбинации определенных устройств «фабрики», или зонировании. Если понадобится использовать расширенные функции помимо банальной передачи файлов, следует с самого начала проверить совместимость всех систем.

НАСЫЩЕННОСТЬ ПАМЯТИ

В области SAN необходимые емкости достаточно велики. Начальный объем равен нескольким терабайтам. В такой ситуации администратору нечего делать с несколькими жесткими дисками, прежде всего потому, что к отказоустойчивости и управляемости предъявляются высокие требования. Поэтому в SAN в качестве системы хранения применяется массовая память. Шкафы оснащаются несколькими блоками питания, собственными операционными системами и интеллектом, чтобы они справлялись с доступом многих хостов. Дополнительно программные особенности позволяют осуществлять оперативное зеркальное копирование данных на вторую систему, резервное копирование открытых файлов и прочие функции, характерные для систем старшего класса.

Существенный недостаток — цена. Стоимость проекта от сотен тысяч до миллионов евро — вовсе не редкость, а даже закономерность. Те, кто хочет сэкономить и ради этого готов отказаться от некоторых функций старшего класса, могут приобрести так называемый головной узел RAID (RAID Head) — комплект специальных внешних контроллеров, они предоставляют вовне функции RAID через быстрый интерфейс Fibre Channel, а управление жестким диском или даже массивом жестких дисков внутри осуществляется посредством другой шины, SCSI или Fibre Channel. Так пользователь добивается гибкости (в зависимости от того, насколько дорога его подсистема хранения данных) и получает самый быстрый на сегодняшний день интерфейс хранения, защищенный посредством RAID.

SAN и NAS дополняют друг друга. Преимущества SAN — в передаче блоков данных, очень хорошей масштабируемости и эффективном управлении. NAS же отличается поддержкой совместного использования файлов множеством клиентов. Но традиционные различия между SAN и NAS сглаживаются на глазах. Устройства NAS все чаще применяются совместно с SAN для решения проблемы роста требований к емкости хранения, резервного копирования данных и их восстановления. С недавнего времени обсуждается возможность применения наряду с Fibre Channel в качестве основной связующей среды технологии iSCSI. Команды и блоки данных из массовой памяти предлагается передавать по обычной сети Ethernet. Это ведет, правда, к высокой нагрузке на сеть, однако инфраструктура Ethernet имеется уже на каждом предприятии, и на ее поддержку не надо тратить много денег. Технология iSCSI находится пока на заре своего развития, но может послужить недорогой альтернативой инсталляции Fibre Channel. С уверенностью можно сказать, что решения SAN и NAS в ближайшие годы станут центральным пунктом при обсуждении стратегии в области ИТ.

Эльмар Терек — независимый автор. С ним можно связаться по адресу: redaktion@lanline.awi.de.