Восстановление — не новое, но все еще единственное основание для выполнения резервного копирования данных. Если информацию невозможно восстановить с высокой точностью за определенный промежуток времени, то само понятие резервного копирования теряет смысл, а организация может серьезно пострадать.

Нарушение целостности информации, оборудование, погибшее под ударами стихии, разрушение носителей и несоблюдение установленных правил модификации данных — это лишь немногие из причин, заставляющих предприятия постоянно совершенствовать средства защиты информации. Предприятие может застраховать от природных бедствий свои материальные активы, но потерю данных не возместит ни одна страховка.

Как может организация одновременно решать проблемы восстановления данных, оптимизации затрат и повышения эффективности бизнеса при нынешней запутанности инструкций и регламентов, при необходимости быстрого восстановления информации, в обстановке неопределенности, опасений и нерешительности поставщиков? Какие правила, инструкции, процедуры регистрации и учета должна устанавливать у себя организация, чтобы обеспечить возможность восстановления? Нивелировать эти вопросы может тщательно составленный и регулярно тестируемый план действий в чрезвычайных ситуациях.

Требования к резервному копированию и восстановлению меняются в соответствии с изменениями технических условий, ростом объемов накопленной информации, проблемами, возникающими в процессе эксплуатации и обеспечения безопасности сложных систем хранения большой емкости при ограниченных вычислительных и человеческих ресурсах. Развитие и конвергенция программных средств резервного копирования и репликации данных наряду с интеграцией приложений и технологий, таких как устройства длительного хранения или архивирование данных в сети, создают среду, благоприятствующую ускорению процессов резервного копирования и восстановления. Однако копирование информации на альтернативные носители не означает, что ее можно будет восстановить или что она достоверна.

В организациях должны рассматриваться все возможные сценарии восстановления. Восстановление данных — это лишь один из элементов эффективного плана возобновления бизнеса в чрезвычайной ситуации. Важно не путать понятия собственно «восстановление» (restore) и «возвращение в исходное состояние» (recover). Восстановление (restore) — это копирование данных с резервных накопителей на основные, а возвращение в исходное состояние (recovery) — это совокупность процедур, обеспечивающих в дальнейшем возможность полноценного использования данных. Здесь важно соблюдать точку и время восстановления в сочетании с достоверностью данных. Эти понятия, в свою очередь, основываются на детальном осмыслении природы данных, их отношения к приложениям и всем элементам, связанным с их использованием. Резервное копирование, восстановление и возвращение к исходному состоянию — это стратегические организационно скоординированные события, а не просто тактические функции системного администратора. Но сложность в том, что эти три термина понимаются по-разному администратором базы данных, системным администратором, владельцем приложения и конечным пользователем. Поэтому тестирование полнофункционального процесса восстановления должно учитывать меры, метрики и контроль целостности восстановленных данных, а также их соответствие ожидаемому состоянию. Необходимо выяснить, какие статистические характеристики или контрольные точки следует фиксировать перед началом резервного копирования, чтобы после восстановления информации убедиться по ним в успешном выполнении процедуры.

Стратегия остается проблемой для многих организаций. Краткие и понятные рекомендации особенно пригодятся в условиях, когда возможны двусмысленные толкования. В конфликтных ситуациях преимущества у организаций с активной стратегией, детальной отчетностью, хорошим документированием процессов. Следует проработать требования по готовности, аутентичности, доступности, целостности, безопасности, документированию и контролю процессов, гарантирующих выполнение процедур для обеспечения всех вышеперечисленных характеристик. Эти показатели зависят от возможностей предприятия в плане восстановления данных.

Постоянной проблемой для организаций является коэффициент готовности. Многие организации в качестве универсального средства выбирают создание полных страховых копий на диске. Между тем предпочтительным оказывается выбор разумной стратегии репликации данных с сохранением одной части информации на локальных узлах, а другой — на удаленных, с отвечающим потребностям конкретной организации распределением резервных копий между более быстрыми и более медленными носителями. Репликация дает возможность получения множества моментальных копий информации, к которым можно обратиться напрямую или быстро восстановить. По крайней мере, использование накопителей вторичных хранилищ данных в качестве промежуточной памяти перед записью на ленту выглядит логичным.

Во многих организациях системные администраторы размышляют о полном или инкрементном резервном копировании. Надо ли ежедневно выполнять полное резервное копирование или следует положить полную копию в основу, а дальше выполнять поэтапное копирование? Приемлемы оба варианта, каждый из них имеет и достоинства, и недостатки. В любом случае организация должна обеспечивать надежность обоих процессов. Зачастую нужны легкодоступные полные резервные копии, а оправдывается такое решение простотой эксплуатации и небольшой стоимостью. Распределенное дистанционное копирование упрощается за счет удаленного хранения лент и смешанного резервного копирования и восстановления. Многие организации рассматривают комплексные варианты, потому что хранение только одной копии данных на ленте довольно рискованно, именно по этой причине многие организации дублируют ленты. Не стоит забывать о том, что может случиться, если сама резервная копия окажется плохой? Для резервного копирования все еще используются ленты, однако некоторые дисковые варианты уже сравнимы с ними по ценам, как и варианты архивирования во внешних хранилищах.

Современные компьютерные системы заимствуют у мэйнфреймов 70-х идею виртуальных магнитных лент. Виртуальные ленты — это почти аналоги дисковых вторичных хранилищ данных, поскольку могут использоваться в качестве промежуточного носителя перед копированием на ленту.

При разработке в организации любого процесса, независимо от технологии, стоит рассмотреть некоторые рекомендации.

  • Разработать комплексный план, учитывающий все аспекты резервного копирования и восстановления. Определить основных участников и их роли. Составить документацию, описывающую процессы и процедуры, назначить ответственных и постоянно контролировать их работу.
  • Рассмотреть возможные последствия чрезвычайных ситуаций.
  • Определить, какие данные требуют частого создания резервных копий.
  • Определить RPO (Recovery Point Objective — «целевая точка восстановления») и RTO (Recovery Time Objective — «целевое время восстановления») для каждого класса данных.
  • Определить, какие данные требуют репликации (удаленной или локальной) для обеспечения непрерывности бизнеса при чрезвычайных ситуациях или быстрого восстановления.
  • Планируя архитектуру, определить расстояние до альтернативных узлов и учесть факторы, влияющие на восстановление (извлечение данных с использованием сети или транспортировка лент с резервными копиями).
  • Определить основных участников процесса восстановления. Каковы планы взаимодействия, внутренней и внешней связи?
  • При создании архивов на ленте, во вторичном хранилище или ассоциативных хранилищах данных позаботиться о защите пула. Выявить отличия проблем резервного копирования и восстановления от производственных проблем.
  • Решить вопросы архитектуры и обслуживания техники, которая должна обеспечить долговременную работу и возможность расширения. Проверенные технологии и даже включение в существующую архитектуру технических новинок помогут снизить суммарные затраты за длительный период эксплуатации и повысить эффективность работы.
  • Выяснить соотношение затрат на быстрое восстановление данных с диска с потерями рабочего времени и дохода за время ожидания восстановления информации с ленты.

Эффективный план резервного копирования невозможен без тестирования процесса восстановления и возобновления информации. Обычно процедуры восстановления выполняются на уровне отдельного устройства, а полномасштабное восстановление на уровне приложения — это включающая ряд процедур оперативная обработка, в которой принимают участие многие сотрудники и используются различные инструменты. Все это необходимо для восстановления информации в том виде, который требуется для возобновления производственного процесса. Многим организациям не приходилось выполнять крупномасштабное восстановление, и они надеются, что эта ситуация не изменится. Однако такая беспечность может обойтись гораздо дороже, чем приобретение необходимой техники и технологии.

Стоимость вторичных хранилищ данных, совмещающих процедуры резервного копирования и репликации, становится все более приемлемой. Развиваются инструменты архивирования. Интегрируя эти элементы в свою ИТ-стратегию, организации могут успешно решить проблемы восстановления информации после чрезвычайных ситуаций.

Джеймс Гейз — директор по решениям в области хранения данных в компании Forsythe. Гейз разработал уникальную структуру управления потоками данных, на которую компания ориентируется, оказывая консалтинговые услуги по обработке и хранению данных.


Стратегия в отношении резервного копирования и восстановления данных должна включать директивы по следующим пунктам (однако не ограничиваться ими):
  • организация внесения изменений;
  • соглашения об уровне обслуживания в части бесперебойного доступа к информации;
  • периодичность резервного копирования, графики и автономный/оперативный доступ ко всем типам информации, классифицированным по значимости;
  • определение целевой точки и целевого времени восстановления в совокупности с планом сохранения непрерывности бизнеса и восстановления в аварийной ситуации;
  • графики сохранения данных на ленте, рецикла, на удаленной площадке и чередования процессов;
  • репликация данных на диске и ленте, определение необходимого количества копий;
  • поддержка данных о создании, тестировании и развертывании информации для резервного копирования, восстановления и порядок возобновления исходного состояния в чрезвычайных ситуациях;
  • инструкции относительно контрольных точек, графиков и интерпретации всех видов информации — критически важной, разовой, электронных сообщений, пользовательских данных, личных каталогов и т. д.
  • инструкции, определяющие, какая информация сохраняется и зачем — данные в форматах .mp3 или .wmv могут быть важными для компании, работающей в сфере массовых коммуникаций, но не для финансовой организации;
  • безопасность копий данных (физическая и логическая);
  • правила для процедур сохранения и архивирования данных — как долго и на каких носителях хранится информация, каково время доступа и какие данные переносятся из первичной памяти во вторичную или третичную и почему;
  • как защищается первичная, вторичная и третичная память, на каких носителях и с какой периодичностью;
  • кто распоряжается процессами и устанавливает правила резервного копирования и восстановления (в число распоряжающихся должны входить не только системный администратор, но и владельцы приложений или информации);
  • контрольные записи, подтверждающие надлежащее выполнение правил и процедур, следование стратегии.

James Geis. Recovery: The Only Reason for Backup. http://www2.cio.com/consultant/report3305.html