Развитие и перспективы применения интерфейсов и протоколов при проектировании систем хранения.

Эффективная работа современных вычислительных устройств во многом зависит от взаимодействия различных компонентов не только друг с другом, но и со средой ИТ. Важную роль в обеспечении такого рода взаимодействия играют аппаратные интерфейсы, отличающиеся скоростью и расстоянием, на которое передаются данные, а также удобством использования.

По сути, интерфейс есть не что иное, как средство связи двух устройств между собой. Говоря об интерфейсе, как правило, имеют в виду кабели или разъемы, а также параметры напряжения, частоты, сигналов и проч. Иногда под термином «интерфейс» подразумевают не только физические характеристики линии связи, но и набор команд, с помощью которых устройства взаимодействуют друг с другом, что на самом деле является протоколом. На практике возможны различные комбинации протоколов и интерфейсов, благодаря чему удается добиться оптимальных параметров работы вычислительной системы.

Использование в корпоративной инфраструктуре ИТ современных дисковых подсистем хранения информации требует, чтобы интерфейсы могли обеспечить такие характеристики, как высокая скорость передачи данных, надежность, простота обслуживания и применения, передача информации на большие расстояния. Для их создания и совершенствования создаются группы разработчиков, куда входят, как правило, те, кто использует эти интерфейсы для своих задач (производители систем хранения, жестких дисков, наборов интерфейсных микросхем и т. д.). К числу таких групп относятся Storage Networking Industry Association (SNIA), Serial ATA Working Group, SCSI Trade Association и др.

При создании нового интерфейса учитывается возможность его совместимости с существующей периферией, дабы обеспечить плавную миграцию оборудования на новые технологии и защитить инвестиции в уже выпущенные устройства. От разработки интерфейса до его коммерческого применения проходит достаточно большой промежуток времени, в течение которого специалисты производят отладку и занимаются утверждением спецификации. Заключительной стадией процесса является утверждение Американским национальным институтом по стандартизации (ANSI).

ИНТЕРФЕЙС SCSI

При всем разнообразии имеющихся интерфейсов наиболее широкое применение в области систем хранения данных (СХД) получили SCSI, Fibre Channel и SATA.

Параллельный интерфейс Small Computer Systems Interface (SCSI) является стандартом для высокопроизводительных и надежных систем хранения уже около 20 лет. Разработанный в середине 80-х гг. прошлого столетия, он совершил настоящую революцию в области технологии подключения и взаимодействия различного оборудования — стал первой интеллектуальной системной шиной, позволяющей обеспечивать совместное функционирование разнообразных периферийных устройств, включая жесткие диски, приводы CD-ROM, принтеры, сканеры, ленточные накопители и т. д. Одновременно с созданием его аппаратной части был разработан одноименный протокол, т. е. набор команд, с помощью которых различное оборудование может взаимодействовать друг с другом.

В настоящее время SCSI позволяет подключать до 16 устройств к аппаратным платформам серверов и рабочих станций, причем работающих под управлением различных операционных систем (ОС). Одна из причин широкого распространения интерфейса SCSI заключается в том, что он не накладывает каких-либо ограничений на связь между контроллером и периферийным устройством. По шине SCSI к серверу могут подключаться как внешние, так и внутренние устройства. Более того, при необходимости одно периферийное устройство способно предоставлять свои ресурсы сразу нескольким серверам, если они подключены к общему интерфейсу SCSI.

Благодаря своим характеристикам интерфейс SCSI широко применяется при проектировании систем хранения и обработки информации. Так, например, высокая пропускная способность шины обеспечивает хорошую скорость передачи данных, а возможность подключения к контроллеру до 15 периферийных устройств позволяет создавать масштабируемые СХД. В то же время протокол SCSI реализует функцию мониторинга состояния подключенного к шине оборудования, что весьма важно для поддержания бесперебойной работы СХД.

Непрерывный рост объемов обрабатываемой информации побуждает производителей выпускать на рынок все более эффективные и надежные системы хранения, а разработчиков интерфейсов — создавать шины для удовлетворения технических требований к этим устройствам. В результате за время своего существования интерфейс SCSI претерпел довольно много изменений и усовершенствований, целью которых было увеличение производительности, масштабируемости и управляемости систем хранения данных (см. Таблицу 1). Тем не менее оборудование на базе последних версий SCSI обладает совместимостью с предыдущими поколениями как интерфейса, так и набора команд SCSI. Современные устройства успешно работают на «устаревших» контроллерах SCSI, что позволяет значительно упростить внедрение нового оборудования и защитить инвестиции в уже существующие системы.

ИНТЕРФЕЙС АТА

Спецификация интерфейса IDE/ ATA (AT Attachment) была разработана в качестве недорогой альтернативы SCSI для поддержки функционирования только дисковых накопителей в персональных компьютерах, где нет необходимости в реализации всех возможностей шины SCSI (подключение большого количества устройств разного типа к одной шине и обеспечение их одновременной работы, универсальный набор команд протокола SCSI и т. д.). Первые промышленные устройства на базе IDE/ATA появились в 1986 г., однако сам интерфейс был стандартизован только в 1990 г.

Основной характеристикой интерфейса АТА является реализация большинства функций контроллера непосредственно в самом дисковом накопителе. Такой подход позволяет существенно упростить хост-адаптеры, применяемые для подключения жестких дисков к компьютерам, и обеспечить хороший уровень совместимости оборудования разных производителей.

Благодаря относительно невысокой цене оборудования, простоте установки и эксплуатации, а также высокому уровню совместимости, интерфейс ATA получил широкое распространение. Чаще всего он применяется в персональных компьютерах, но, кроме того, используется при проектировании недорогих систем хранения данных начального уровня, включая простые ленточные накопители для индивидуального резервного копирования информации, оптические и магнитооптические приводы, небольшие массивы RAID для серверов и рабочих станций и т. д. Устройства идеально подходят организациям, где скорость и надежность доступа к данным оказывается менее критическим фактором, чем стоимость оборудования и простота его обслуживания.

ИНТЕРФЕЙС FIBRE CHANNEL

В конце 80-х гг. прошлого столетия была начата работа по созданию интерфейса, призванного обеспечить функционирование высокоскоростных устройств и поддержку передачи информации на большие расстояния. В результате в 1994 г. ANSI утвердил интерфейс, получивший название Fibre Channel (FC).

Рисунок 1. Топология «точка—точка».

В проектировании Fibre Channel принимали участие специалисты, обладавшие опытом разработки как канальных, так и сетевых интерфейсов. В итоге они создали открытый промышленный стандарт высокоскоростного последовательного интерфейса, современный вариант которого поддерживает соединение серверов и систем хранения на расстоянии до 100 км при скорости передачи данных до 2 Гбит/с.

Наряду со скоростными характеристиками и возможностью работы на столь большом удалении, одним из ключевых преимуществ Fibre Channel является гибкость топологии подключения устройств, которую он позаимствовал у сетевых технологий. Интерфейс Fibre Channel позволяет реализовать различные топологии соединения: «точка—точка» (Point-to-Point), «петля» (FC-AL), «коммутируемое подключение» (Fabric). Подключение «точка—точка» (см. Рисунок 1) применяется для организации взаимодействия двух устройств. Эту схему можно считать частным случаем топологии «петля» (см. Рисунок 2), предусматривающей последовательную передачу данных от одного устройства к другому по замкнутому каналу. В свою очередь, «коммутируемое подключение» (см. Рисунок 3) предназначено для передачи данных непосредственно от источника информации к любому потребителю.

Рисунок 2. Подключение в виде петли.

ОТ ИНТЕРФЕЙСА К СЕТИ ХРАНЕНИЯ

Топологии подключения FC-AL и Fabric помогают создавать выделенную высокоскоростную сеть хранения данных (SAN), в рамках которой обеспечивается соединение устройств хранения различных типов с серверами и серверов между собой. Использование при построении сетей хранения интерфейса Fibre Channel делает возможным обмен информацией не только между любым сервером и системой хранения, но и между разными устройствами хранения без участия серверов (serverless backup). Таким образом, Fibre Channel позволяет уменьшить нагрузку на локальную сеть предприятия (lanfree backup), а резервное копирование и восстановление информации осуществляются гораздо быстрее, чем в случае применения традиционных методов.

Рисунок 3. Коммутируемая структура.

Благодаря достигаемой гибкости вследствие использования интерфейса Fibre Channel, сети хранения позволяют реализовать еще одну очень важную возможность, а именно построение отказоустойчивых систем. Бесперебойное функционирование сети хранения данных на базе FC обеспечивается резервированием каналов передачи информации и коммуникационного оборудования, а также построением географически распределенных систем.

Свидетельством зрелости технологии Fibre Channel стала разработка протоколов Fibre Channel поверх IP (FCIP) и Internet Fibre Channel Protocol (iFCP). FCIP осуществляет инкапсуляцию Fibre Channel и туннелирование по сетям IP, что обеспечивает возможность соединения различных сетей хранения данных через глобальные сети (см. Рисунок 4). В свою очередь, протокол iFCP предназначен для передачи данных между мостами FCIP.

Рисунок 4. Применение протокола FCIP в сетях хранения.

По мнению аналитиков, в обозримом будущем Fibre Channel сохранит свое доминирующее положение как интерфейс для построения сетей хранения данных. Однако уже сейчас группы разработчиков заняты процессом создания новых, альтернативных Fibre Channel, технологий, где предусматривается использование инфраструктуры IP, вследствие чего должна снизиться стоимость решений SAN и, как ожидается, упроститься их обслуживание.

ПРОТОКОЛ iSCSI

Одним из примеров технологий, которые уже в самом ближайшем времени будут востребованы при проектировании систем и сетей хранения данных, является протокол Internet SCSI (iSCSI). iSCSI, в основе которого лежит протокол IP, позволяет значительно упростить обмен информацией через глобальные сети и Intranet и обеспечить удаленное управление устройствами хранения данных. Благодаря широкому распространению сетей IP, iSCSI подходит для передачи информации через Intranet или через локальные и глобальные сети, а также для создания территориально распределенных систем хранения данных.

В организациях, где достаточно развиты сети SAN на базе Fibre Channel, применение iSCSI поможет консолидировать удаленные ресурсы и подключить к централизованной инфраструктуре хранения данных серверы начального уровня. С точки зрения организации совместной работы сетевого хранилища и серверов, iSCSI выполняет ту же функцию, что и Fibre Channel, однако пропускная способность канала передачи оказывается меньше (на сегодняшний день — 1 Гбит/с у iSCSI против 2 Гбит/с у FC). Тем не менее, по сравнению с Fibre Channel, iSCSI имеет одно существенное преимущество — возможность передачи данных между серверами и удаленными вычислительными центрами по стандартным сетям IP.

Устройства, работающие на базе протокола iSCSI, уже появились у Intel, Qlogic, Adaptec, IBM, Cisco и других компаний. В будущем технологии iSCSI помогут воспользоваться преимуществами, предоставляемыми сетями хранения данных SAN предприятиям среднего размера, отделам и удаленным филиалам крупных корпораций. Внедрение iSCSI позволит снизить затраты на эксплуатацию систем хранения данных, упростить управление ими за счет консолидации и сделать процесс резервного копирования таким же простым и быстрым, как в сетях хранения данных.

ИНТЕРФЕЙСЫ SATA И SAS

Радикальные изменения в технологии создания интерфейсов для систем и сетей хранения данных нашли отражение не только в разработке протокола iSCSI, но затронули и широко распространенные интерфейсы SCSI и ATA. Последние имеют одну общую особенность: основной принцип их действия состоит в параллельной передаче информации между устройствами хранения и контроллером. На протяжении 20 лет параллельные интерфейсы успешно использовались для соединения различных устройств, однако теперь параллельный способ передачи информации уже не в состоянии удовлетворять всем требованиям, предъявляемым к системам хранения данных.

Несмотря на высокую производительность и относительно низкую стоимость устройств на базе параллельного интерфейса АТА, данная шина имеет ряд недостатков, в числе которых — неудобные плоские кабели (шлейфы) с большим количеством проводников, ограниченная пропускная способность и др. Созданный в 2003 г. последовательный интерфейс Serial ATA (SATA) позволил снять эти ограничения и значительно сократить количество проводников в кабеле, в результате он стал более компактным и удобным. Кроме того, применяемый в нем метод последовательной передачи информации снижает влияние помех на передаваемый сигнал, увеличивая тем самым пропускную способность шины.

На сегодняшний день скорость передачи данных по интерфейсу SATA достигает 1,5 Гбит/с. В ближайшее время появятся устройства со скоростью 3 Гбит/с (спецификация SATA II). Однако уже сейчас ведутся разработки следующего поколения интерфейса SATA, который будет обеспечивать скорость до 6 Гбит/с. Заметим, что в отличие от АТА последовательный интерфейс SATA изначально поддерживает функцию «горячей» замены, а контроллеры RAID на базе SATA составляют достойную конкуренцию недорогим массивам SCSI.

Сочетание таких характеристик интерфейса SATA, как производительность, функциональность и относительно невысокая стоимость устройств, часто противопоставляется возможностям SCSI. В результате разработчики были вынуждены приступить к созданию интерфейса, использующего способ последовательной передачи данных и призванного заменить шину SCSI.

Новый интерфейс, получивший название Serial Attached SCSI (SAS), отличается высокими показателями надежности, производительности и масштабируемости, как это и требуется для работы современных серверов и систем хранения данных любого уровня. По сравнению с параллельным интерфейсом SCSI, у SAS целый ряд преимуществ. В частности, соединительные кабели и разъемы стали более компактными, что должно позволить использовать диски меньшего форм-фактора. Кроме того, количество устройств, которое можно подключить к одному порту контроллера, увеличилось до 128. Новый интерфейс поддерживает подключение оборудования по двум каналам, что повышает пропускную способность шины и увеличивает ее надежность. Применение систем хранения данных на базе SAS наиболее выгодно для организаций, где ставится задача упростить структуру вычислительного центра, создать высокопроизводительную многофункциональную систему, снизить стоимость владения системами хранения, осуществить переход к использованию сети хранения данных.

По мнению экспертов, устройства на базе интерфейса SAS появятся на рынке во втором полугодии 2005 г. Ожидается, что SAS станет наиболее востребованной технологией, применяемой при проектировании непосредственно подключаемых к серверам систем хранения данных (DAS).

Как уже отмечалось, наибольшим спросом при создании СХД пользуются интерфейсы SCSI, SATA и Fibre Channel. Особенности их архитектуры требуют, чтобы жесткие диски различных типов подключались к соответствующему контроллеру, что не всегда удобно для систем хранения, в состав которых входят накопители с отличающимися интерфейсами (например, иерархические системы хранения информации). Выходом из сложившейся ситуации может стать использование интерфейса SAS, который по своей производительности и масштабируемости близок к показателям Fibre Channel. Его совместимость с SATA на физическом уровне позволит производителям СХД создавать устройства, сочетающие в себе преимущества обоих интерфейсов. В будущем можно ожидать появления систем хранения данных, где станут одновременно применяться диски SAS и SATA с внешним интерфейсом SAS или Fibre Channel.

Итак, очевидно, что рост объема критически важной информации и требований, предъявляемых к системам хранения данных, неизбежно ведет к необходимости перехода на последовательные интерфейсы, поскольку они обеспечивают высокую скорость передачи информации, хорошую масштабируемость, простоту и гибкость инфраструктуры. Несмотря на столь радикальные изменения, устройства хранения данных на базе новых интерфейсов будут по-прежнему совместимы с уже имеющимся программным обеспечением, что позволит защищать инвестиции в ИТ и осуществлять последовательное обновление вычислительных ресурсов.

Андрей Тюшкин — технический директор МКСК. Яна Малькевич — менеджер по маркетингу МКСК. С ними можно связаться по адресу: malkevitch@mcsc.ru.