Широкое распространение виртуальных серверов обусловливает особые требования к решениям для резервного копирования. Большие объемы резервируемых данных в виртуальной среде нуждаются в специальных механизмах защиты и администрирования. Главная цель при резервном копировании в среде VMware — снизить влияние этого процесса на физические машины и обеспечить устранение дубликатов в пределах виртуальных машин, а также вне их. Базы данных в виртуальных средах должны быть защищены надежно и согласованно. Предприятия используют среды VMware по-разному, поэтому в каждом случае необходимо определить наиболее оптимальный подход к резервному копированию.
Решение резервного копирования для виртуализованных сред должно включать в себя дедупликацию данных. Эффективность этого процесса может быть весьма высокой, поскольку такие решения, разделяя поток данных на части, выискивают многочисленные избыточные данные. Система не записывает уже имеющиеся сегменты, а лишь создает ссылку на первоначально сохраненные. Таким образом значительно экономится место на физических дисках.
В настоящее время существует множество решений для дедупликации, различающихся по технической реализации. Так, некоторые системы осуществляют дедупликацию «на лету» (On the Fly), непосредственно во время записи. Другие, использующие механизм «постобработки» (PostProcessing), вначале записывают данные на диск, а дедупликация осуществляется позднее. Для последнего варианта требуется больше свободного места на дисках, но при определенных обстоятельствах запись осуществляется быстрее.
Однако этот эффект практически незаметен, если система, обрабатывающая данные «на лету», располагает высокой процессорной мощностью и быстрыми механизмами дедупликации. Тогда скорость дедупликации практически такая же, а пользователю требуется значительно меньше места на диске, что, в свою очередь, положительно сказывается на счетах за электричество.
Одним из производителей таких решений является компания Data Domain. Она использует технологию поточной дедупликации (Inline Deduplication), в то время как EMC Avamar или Symantec NetBackup Pure Disk работают с распределенными клиентскими агентами. У обоих схожий подход: они осуществляют дедупликацию на распределенных устройствах, к примеру, в филиалах, поэтому передаются только новые резервируемые данные и нагрузка на соединения по локальным и глобальным сетям оказывается незначительной. Помимо этого, серверными компонентами осуществляется централизованная дедупликация данных тех же решений.
NetApp интегрировала механизм «постобработки» в операционную систему своих устройств хранения с подключением к связной архитектуре (Fabric Attached Storage, FAS). В результате его можно использовать для первичных, резервных и архивных данных.
Особенно гибкое решение — EMC Disk Library с дедупликацией данных (DL3D). Эта система функционирует в поточном режиме (Inline), и при дедупликации данных выбирается либо режим «на лету», либо «постобработка». Наиболее адекватный механизм задействуется в зависимости от структуры данных и возможностей инфраструктуры.
В качестве примеров мы представим три популярных и различных по технологиям решения и расскажем о них в контексте использования в среде VMware (см. также врезку «Основы резервного копирования в средах VMware»).
EMC AVAMAR И NETWORKER
Первый сценарий: дедупликация данных с помощью клиентов EMC Avamar, когда применяется решение VMware Consolidated Backup (VCB) и программное обеспечение для резервного копирования NetWorker от EMC (см. Рисунок 1). При этом клиенты NetWorker располагают интегрированными функциями Avamar для дедупликации данных и резервного копирования файловых систем. Администратор управляет решением централизованно. Дедупликация осуществляется на распределенных клиентах и на сервере Avamar. Система Avamar состоит из архитектуры избыточного массива независимых узлов (Redundant Array of Independent Nodes, RAIN) с функциями аварийного восстановления (Failover) серверных узлов, отказоустойчивости и масштабируемости в реальном времени. Физически система может включать до 16 узлов, 14 из которых — узлы хранения, один служебный узел (Utility Node) для связи и один запасной узел. Каждый узел хранения обладает емкостью в 2 Тбайта.
Ежедневно система подвергается двум проверкам целостности. В сочетании с VCB система Avamar позволяет выполнять резервное копирование множества виртуальных машин, чьи виртуальные диски (VMFS) располагаются, к примеру, на системах RAID с подключениями по iSCSI или SAN. VCB берет на себя контроль и обеспечение согласованности виртуальных машин (ВМ) на сервере ESX. Поток резервных данных идет только через сервер Proxy VCB. За управление резервным копированием отвечает сервер NetWorker, который осуществляет централизованную дедупликацию с помощью технологии Avamar.
Это решение особенно интересно, если предприятие уже использует Avamar для защиты своих филиалов, а теперь планирует включить в эту концепцию и ландшафт VMware. Оно предпочтительно и в случае малой пропускной способности каналов и преобладания резервного копирования файлов, но плохо подходит для сред VMware с большими базами данных и жесткими соглашениями SLA для быстрого аварийного восстановления.
AMAVAR VIRTUAL EDITION
Решение резервного копирования EMC Avamar Virtual Edition для VMware само по себе является виртуальным решением и предоставляет серверное программное обеспечение Avamar на ВМ (см. Рисунок 2). В масштабах отрасли это первый виртуальный сервер дедупликации данных для резервного копирования и аварийного восстановления. Решение использует общую инфраструктуру серверов и систем хранения и не привязано к традиционной аппаратной топологии от Avamar, поскольку она отображается виртуально. Кроме того, решение подходит для сетей хранения (Storage Area Network, SAN), сетевых устройств хранения (Network Attached Storage, NAS) и устройств хранения с прямым подключением (Direct Attached Storage, DAS).
В результате тиражирования приложений и ресурсов хранения транспорт лент не требуется. Тиражирование возможно также между виртуальными машинами Avamar, с ВМ Avamar на Avamar Data Store или на стандартные серверы Avamar. Однако в случае применения этого подхода администратору следует обращать особое внимание на чистоту установки, чтобы рабочие данные и резервные копии не смешивались на одной физической системе, иначе безопасность резервных данных может оказаться под угрозой.
DATA DOMAIN И NETWORKER
Дедупликация данных с помощью решения Data Domain в сочетании с VMware VCB и классическим программным обеспечением для резервного копирования, к примеру, NetWorker, — самый быстрый из трех представленных вариантов (см. Рисунок 3). Он подходит для создания резервных копий множества виртуальных машин, чьи виртуальные диски (VMFS) находятся, к примеру, на системе RAID с подключением по FC SAN или iSCSI. VCB берет на себя контроль и обеспечение согласованности ВМ на сервере ESX. Нагрузки на сервер ESX не возникают, поскольку поток резервируемых данных идет только через сервер Proxy VCB. Управление резервным копированием осуществляет специализированное программное обеспечение: NetWorker, NetBackup или CommVault. Оборудование Data Domain дедуплицирует и сохраняет резервные копии больших файлов с образами ВМ на жестких дисках.
Решение легко интегрируется в существующую среду резервного копирования: ему требуется лишь модуль резервного копирования на диск (Backup to Disk Module). Кроме того, этот вариант позволяет экономить электроэнергию: за трехлетний период при требуемой логической емкости в 100 Тбайт расходы сократятся на 75% по сравнению с традиционной дисковой системой.
Предложение идеально для сред с высокими требованиями в области SLA, где необходимо быстрое восстановление после катастроф (Disaster Recovery). Тот же вариант рекомендуется и для критически важных и очень объемных баз данных, когда требуется высокая скорость аварийного восстановления. Однако для обеспечения целостности базы данных предприятиям следует позаботиться об их дополнительной защите с помощью модуля приложения реального времени для ПО резервного копирования. VCB Proxy такой гарантии не дает.
ЗАКЛЮЧЕНИЕ
При выборе подходящей стратегии резервного копирования в среде VMware сначала следует определиться с конкретными требованиями. Как и в каком порядке должны интегрироваться базы данных? Сколько ВМ необходимо защитить? Высоки ли требования к аварийному восстановлению? Такая оценка ситуации исключительно важна для принятия правильного решения.
Андреас Мейер — руководитель отдела развития бизнеса в компании Orchestra Service SE, специализирующейся на системах хранения.
© AWi Verlag
Рисунок 1. Резервное копирование в среде VMware с NetWorker и Avamar.
Рисунок 3. Резервное копирование среды VMware с Data Domain и программным обеспечением для резервного копирования с поддержкой VCB.
Рисунок 4. Протекание процессов в случае VMware Consolidated Backup.
Основы резервного копирования в средах VMware
Структуру виртуальных машин (ВМ) не всегда можно защитить с помощью традиционных методов резервного копирования и аварийного восстановления. Ведь при полном или инкрементальном резервном копировании все ВМ должны использовать один и тот же набор распределенных ресурсов: процессор, сетевые интерфейсы, оперативную память и место на диске. Если одной из ВМ понадобится большая часть ресурсов для активного процесса резервного копирования, то всем остальным ничего не достанется. Чтобы разрешить эту проблему, администратор может прибегнуть к миграции ВМ между физическими ресурсами. Однако во время миграции могут появиться ошибки в процессе резервного копирования.
В виртуализованных средах возникают огромные объемы данных. Причем многие из них избыточны: это касается как операционных систем и приложений, так и пользовательских данных. Иногда их количество оказывается в три раза больше, чем объем первичной информации. К тому же, администратору приходится учитывать необходимость защиты уровня виртуализации, где располагаются конфигурационные файлы ВМ. Эти файлы VMDK содержат все пользовательские данные и сведения о конфигурации виртуального сервера и могут занимать до 2 Тбайт. Некоторые производители рекомендуют создавать резервную копию самого слоя, чтобы облегчить работу в случае полного восстановления системы после катастроф (Disaster Recovery). Тогда резервное копирование будет охватывать физические системные данные хоста, а также виртуальные настройки сети и памяти каждого физического хоста; типичный размер файлов будет измеряться в терабайтах. При такой высокой нагрузке на ввод/вывод и процессор могут возникать «узкие места» в контроллерах систем хранения или сетях. В зависимости от выбранной концепции виртуализации существуют различные способы решения проблемы.
Традиционный вариант на базе агентов предусматривает сохранение на каждой ВМ агентов резервного копирования для выполнения операции на файловом уровне. Резервные копии передаются через локальную сеть на медиасервер или через сеть хранения данных (SAN) и быстрый интерфейс FC напрямую на устройство резервного копирования. Этот вариант значительно загружает ввод/вывод и процессор защищаемого виртуального сервера. Если несколько ВМ совместно используют оперативную память, процессор и ресурсы сети, то могут возникать «узкие места». Когда потребуется защита сразу многих ВМ, сервер-хост ESX с несколькими активными агентами окажется слишком перегружен. Такой вариант резервного копирования подходит для серверов UNIX и систем Linux.
Альтернативный вариант — установить агент на сервисной консоли ESX. Тем самым обеспечивается даже восстановление после катастроф, поскольку защищается весь набор ВМ, файлов защиты от изменений (Redo), сервисных консолей и состояний хоста, но восстановление на уровне файлов невозможно. Это решение пригодно для почтовых приложений или баз данных, которым требуется особый агент резервного копирования.
Решение для резервного восстановления VMware Consolidated Backup (VCB) под управлением Windows с помощью снимка ВМ (VM Snapshot) полностью инкапсулирует весь статус ВМ в аппаратно-независимых файлах и сохраняет их как снимки, что повышает безопасность при установке обновлений или изменений. Создаваемые крупные файлы попадают в систему резервного копирования. Копируя их, можно перемещать или запускать виртуальные машины, и, таким образом, осуществлять централизованное резервное копирование на уровне файлов без агентов на гостевых ВМ.
VCB активирует процесс резервного копирования из ВМ и вводит его в инфраструктуру. Это резервное копирование длится лишь несколько секунд, дополнительные затраты (Overhead) физических ресурсов минимальны. Кроме того, можно создавать полные, инкрементные или дифференцированные резервные копии ВМ Windows. В сочетании с сервером резервного копирования сервер Proxy VCB берет на себя задачи резервирования и устраняет накладные расходы при создании индивидуальных резервных копий ВМ.
Однако в системах, ориентированных на осуществление транзакций, такой подход может привести к большим проблемам. К примеру, если создание снимка длится три секунды и за это время происходит множество транзакций, то не исключается утрата данных. Кроме того, VCB поддерживает резервное копирование на уровне файлов не для всех гостевых операционных систем ВМ. Минимум контроля вне среды Windows может стать серьезной проблемой.
Чаще всего предприятия прибегают к адаптированной для их среды комбинации нескольких подходов.
Контрольный список для выбора решения резервного копирования:
-
для каждой ВМ следует заранее определить целевое время восстановления (Recovery Time Objective) и целевой момент восстановления (Recovery Point Objective);
-
cоединения FC и IP, а также поддержка резервного копирования на базе VCB и агентов с временем накопления не более 30 минут;
-
устройство резервного копирования должно предоставлять возможность консолидации и максимально полного использования ресурсов;
-
централизованное администрирование всей среды хранения данных со всеми уровнями резервного копирования.
-
дедупликация.
Франк Херольд, Quantum