Любой опытный администратор хранилища подтвердит, что его область деятельности славится обилием профессиональных терминов. Многие из них малопонятны, но есть такие, которые просто необходимо знать. В этой статье объясняются наиболее распространенные термины, относящиеся к системам хранения данных.
Блочное хранилище. Блоки — это одинаковые по размеру порции данных на диске. При записи файла на диск файловая система сохраняет данные в виде последовательности блоков. Блокам присваиваются номера, по которым файловая система отслеживает их принадлежность файлам.
Дедупликация. Файловые данные хранятся в виде блоков. В зависимости от типа данных существует вероятность, что некоторые блоки на диске содержат одинаковые данные. В процессе дедупликации удаляются блоки-дубликаты, что сокращает объем потребляемой памяти. Обычно дедупликация не очень эффективна для данных с нерегулярным расположением или файлов на сжатых носителях, но для прочих типов данных она позволит значительно сократить объем пространства, необходимого для хранения данных.
Fibre Channel. Fibre Channel — технология, широко используемая для высокоскоростной передачи данных в сетевых системах хранения. Название Fibre Channel указывает на использование оптоволоконного кабеля. Сегодня, однако, существуют стандарты, позволяющие реализовать коммуникации Fibre Channel и по кабелю Ethernet. Поэтому термин Fibre Channel, некогда указывавший на соответствующий тип кабельных соединений и необходимого оборудования, теперь означает сетевой стандарт.
Флеш-массив. Массивы существовали всегда и, по сути, представляют собой комбинацию жестких дисков, подготавливаемых к работе различными способами. Флеш-массив — это система хранения данных, состоящая из нескольких флеш-накопителей (как правило, твердотельных (SSD) дисков) вместо вращающихся жестких дисков.
Хост-адаптер шины. Хост-адаптер шины — это аппаратный компонент, позволяющий физически подключить оптоволоконный кабель к серверу. По сути, хост-адаптер шины подобен сетевому адаптеру, который, однако, используется для подключения оптоволоконного кабеля, а не кабеля Ethernet.
NAS. NAS, или «запоминающее устройство, подключаемое к сети», представляет собой массив хранения данных, который можно подключать напрямую к сети Ethernet. Доступ к хранилищу NAS обычно осуществляется по SMB или аналогичному протоколу. Устройства NAS, как правило, дешевле и проще, чем файловые серверы. Практически для каждого сценария использования существуют устройства NAS, от оборудования корпоративного класса до небольших устройств потребительского уровня.
Объектное хранилище. Объектное хранилище — это высокомасштабируемая архитектура хранения, которая давно популярна у поставщиков общедоступных «облачных» решений, а сегодня находит применение и в корпоративных средах. В отличие от блочного хранилища, объектное хранилище не использует ни файловую систему, ни блоки данных. Вместо этого файлы (и их метаданные) сохраняются в плоском адресном пространстве.
RAID. Термин RAID, или «избыточный массив независимых дисков», в обобщенном смысле применим к различным архитектурам хранения, где требуемая логическая структура реализуется путем комбинирования нескольких жестких дисков, физических или виртуальных. Например, комбинация дисков может решать задачу достижения дополнительного объема памяти, сохранения работоспособности в случае отказа одного или нескольких дисков либо повышения производительности. В названии массива RAID обычно присутствует цифра, указывающая на его уровень. Например, в массиве RAID5 блоки четности равномерно распределяются между всеми дисками, что обеспечивает функционирование дисковой структуры даже при отказе любого из дисков.
SAN. SAN, или «сеть хранения данных», — это особый тип высокопроизводительной сети, используемой исключительно для хранения данных. Хотя SAN обязательно требует подключения к основным сетевым ресурсам, в частности серверам, эта сеть обычно не используется для общего сетевого трафика, но лишь для трафика, относящегося к хранению данных. Вместо универсальных сетевых протоколов для трафика SAN часто применяются транспортные протоколы, как в системах хранения (например, SCSI).
SSD. SSD, или «твердотельный накопитель», — это жесткий диск (часто именуемый SSD-диском), не имеющий подвижных элементов. SSD-диски используют флеш-память, и их производительность значительно превышает производительность вращающихся дисков. Однако емкость SSD обычно ниже, чем у обычных жестких дисков (хотя этот показатель постоянно улучшается), поэтому такой вариант может оказаться не самым лучшим для приложений, требующих большого количества операций записи.
Безусловно, этот список включает не все термины, которые должен знать администратор хранилища. Кроме того, по мере развития технологий и изменения характера бизнеса будут появляться новые термины, но все же, надеюсь, эта статья поможет начинающему специалисту успешно освоить новый вид деятельности.