При хранении и архивировании данных нужны как правильная концепция, так и адекватное оборудование. Однако даже если в данный момент все функционирует идеально, при формировании стратегии на несколько десятилетий вперед могут возникнуть дополнительные вопросы, касающиеся обеспечения непрерывности бизнеса. Ввиду длительности рассматриваемого промежутка времени этой задаче отводится приоритетное значение.
В области хранения данных резервное копирование всего лишь путь к главной цели — быстрому восстановлению информации. То же можно сказать об архивировании: хранение является необходимым злом, быстрое нахождение в случае необходимости — собственно целью. Минимальное окно резервного копирования, оперативное восстановление и возможность доступа к архивным данным — таковы сегодняшние требования к ИТ. Все они объединяются понятием «непрерывность бизнеса», означающим бесперебойную работу предприятия и заслуживающим самого высокого приоритета.
В области резервного копирования и архивирования наблюдается множество тенденций, часть из которых имеет столь огромное значение, что их едва ли можно игнорировать. К примеру, продолжающийся рост объема данных можно назвать настоящим взрывом. Сегодня стало привычным обращение с гигабайтами информации, а в профессиональной области — с терабайтами, в известной мере и до петабайт уже недалеко. В результате при резервном копировании данные больше не записываются непосредственно на ленту. Так называемое резервное копирование на диск просто и недорого реализуется при помощи стандартных дисков SATA. Общедоступным рыночным стандартом стали сетевые компоненты емкостью в несколько десятков гигабайт. Системы iSCSI также могут быть легко приспособлены для резервного копирования и архивирования в существующих сетях.
Многие уже оценили преимущества резервного копирования на диски, и соответствующая тенденция проявляется все явственнее. При продуманном подходе эта технология не только эффективнее использует ежедневное окно, предназначенное для резервного копирования, но и сокращает время восстановления, что очень важно в чрезвычайных ситуациях. Если она дополняется уже испытанным хранением на лентах, то предприятие получает большой выигрыш в гибкости и достаточную защищенность данных. Каждый администратор, которому хоть раз не удалось прочитать ленту во время восстановления, будет лучше спать ночью, зная, что быстро отыщет свои данные в промежуточном дисковом хранилище.
Вместе с тем, важные для жизнедеятельности предприятия данные профессионалы предпочитают хранить на надежной ленте в сейфе, где ей не страшны ни вирусы, ни отказ диска, ни потеря питания, пока лента хранится автономно. Ни один вращающийся носитель данных не предлагает этих важных преимуществ при столь низкой цене. Стоимость в расчете на 1 Гбайт в случае нового VXA-3 равна приблизительно 0,30 евро при общей емкости 240 Гбайт сжатых данных. Для LTO 3 (Ultrium 3) цена снижается до 0,11 евро за 1 Гбайт при емкости в 800 Гбайт сжатых данных.
При правильном хранении ленты исправно служат гораздо дольше десяти лет. По данным производителя, ленточные носители VXA-2 и VXA-3, к примеру, выдерживают 20 тыс. «проходов» (источник Exabyte), что соответствует примерно 1000 полных резервных копирований. Таким образом, можно удобно хранить и управлять многими поколениями данных. Кроме того, для некоторых пользователей подобный образ действий обеспечивает своего рода «эффект бумаги»: лент или картриджей можно касаться и делать на них пометки, к тому же они сравнительно не чувствительны к грубым воздействиям.
Рисунок 1. При долгосрочном хранении приходится учитывать многие опасности. |
Однако при обращении с лентами следует обращать внимание на детали, подтверждение тому — несколько примеров из жизни. В одном из банков Австрии затопило вычислительный центр. Под водой оказались и ленты с резервными копиями. После просушки ленты VXA читались без проблем, и работу можно было продолжать на новом оборудовании. В другом банке — английском — пришла пора менять старую систему на базе RS/6000: данные переписали на ленты, а прежнюю систему продали. Годами позже, когда учреждению предстояло пройти очередную проверку, пришлось за большую сумму брать напрокат машину и ленточный накопитель, способный читать старые ленты. Еще один случай. Предприятию понадобились давно заархивированные данные. Доступ к системе резервного копирования был защищен паролем. Поскольку найти прежнего оператора или взломать пароль не удалось, получить доступ к информации оказалось невозможным.
Впрочем, в большинстве своем проблемы намного проще: частой причиной неправильно выполненного резервного копирования является вовремя не замененная или неправильно установленная лента. В век автоматических устройств замены ленты (автозагрузчиков), способных сохранять до 1,6 Тбайт, это более чем удивительно. Особенно если учесть, что загрузчик на десять кассет можно приобрести менее чем за 2500 евро.
Для того чтобы, к примеру, передать данные в резервный вычислительный центр, в передовых концепциях уже сегодня делается ставка на подход, который специалисты называют «резервное копирование на диск и далее куда угодно». Неважно, как попадают данные в резервный вычислительный центр — в форме записей на CD или DVD либо через надежное соединение сразу же на оперативно доступную дисковую систему. Принципиальное значение имеет лишь то, что процесс должен быть прозрачным, контролируемым, воспроизводимым и — самое главное! — автоматизированным. Программное обеспечение некоторых производителей такие возможности предлагает.
Сохраняются ли архивные или резервные копии в конечном итоге на жестких дисках, однокассетных ленточных накопителях, ленточных библиотеках, CD или DVD, определяется, конечно, конкретной концепцией. Оптимальная комбинация дисков и других носителей с учетом соотношения стоимости и пользы представляется в данный момент наилучшим решением. Избыточные носители и аппаратное обеспечение доказали свою практическую пользу.
Еще одна тенденция касается так называемых «специализированных устройств резервного копирования». Речь идет об объединении в одном устройстве массива жестких дисков (Direct Attached, NAS или iSCSI), ленточной библиотеки и хорошего современного программного обеспечения для резервного копирования. Это решение обладает всеми преимуществами для быстрого восстановления данных в вычислительных центрах и просто и прозрачно в использовании.
Централизованные решения для резервного копирования применяются в корпоративной сети на протяжении многих лет. Очевидно, прошло то время, когда для каждой отдельной операционной системы и базы данных использовалось собственное — иногда поставляемое в комплекте — программное обеспечение, но по-прежнему при кадровых изменениях восстановление нередко оказывается под угрозой из-за потери накопленных ноу-хау.
Современные решения предусматривают централизованный подход. Это существенно экономит ресурсы: персонал и аппаратное обеспечение обеспечивают работу сразу нескольких систем. Возможно все — от собственного резервного копирования Windows, собственного TAR в UNIX, сохранения дампа базы данных при помощи специально написанного сценария до надежных, простых в обслуживании приложений для резервного копирования. Последние нередко представляют собой решения с независимыми от операционной системы интерфейсами и концепциями и уже поэтому обеспечивают лучшие возможности для их поддержки.
Для ускорения процесса резервного копирования и восстановления данных производители программного обеспечения внедряют все новые технологии. Хранению и восстановлению избыточных данных объявлена война. Ключевым стало словосочетание «уникальность копии». Полностью идентичные файлы в будущем должны сохраняться лишь один раз — тенденция, которая скоро может проникнуть и в операционные системы. В программном обеспечении коллективного пользования это реализовано уже достаточно давно.
ЧРЕЗВЫЧАЙНОЕ ПРОИСШЕСТВИЕ
В случае катастрофы вся концепция подвергается испытанию, и она со всей очевидностью показывает, принесли ли плоды планирование, организация, ежедневные работы и обучение. Причем не важно, что произошло: случайное удаление файла Excel или полный отказ сервера базы данных. Потеря всей инфраструктуры ИТ или даже целого здания может произойти с каждым, в любой момент времени. Как гласит закон Мерфи, катастрофы происходят именно тогда, когда их никто не ждет. Тогда и выясняется, насколько хороши были подготовка и предусмотренные процедуры, правильно ли выбрано программное и аппаратное обеспечение.
Даже потеря внештатным сотрудником ноутбука или кража нескольких компьютеров из филиала показывают, насколько действительно сложна тема хранения данных и, прежде всего, их восстановления. Дело не в том, как именно произойдет потеря данных и кто виновник, главный вопрос: когда? «Ну, уж с намито этого не случится» — такая мысль не должна приходить в голову ни одному администратору. «Глобальный» перебор всех возможных рисков вместе с анализом стоимости и пользы сегодня обязателен — от этого может зависеть существование целого предприятия.
При планировании полезно учитывать ряд цифр из статистических сводок, даже если они и варьируются в зависимости от ситуации. Как показывает практика, потеря данных происходит в следующих случаях: ошибка в обслуживании — 12%, ошибка аппаратного обеспечения (к примеру, отказ жесткого диска) — 35%, логическая ошибка — 29%, физическое разрушение (огонь, вода и т. д.) — 15%, ущерб от сбоев в электропитании (повышенное напряжение) — 10%. Итак, несложно сделать вывод, что ленты с данными следует хранить в другом здании. Очень разумным представляется хранение данных во внутреннем или внешнем (к примеру, в банковском) сейфе. Однако издержки должны соотноситься с рисками. При планировании или ежегодной проверке стратегии резервного копирования неплохой исходной точкой может стать «Контрольный список для сохранения и восстановления данных».
КОНТРОЛЬ НЕОБХОДИМ
Только регулярные учебные проверки, как это делает любая пожарная команда, позволят выработать необходимые навыки действий при возможном серьезном происшествии. Опыт показывает, что подобные испытания проводятся на многих предприятиях слишком редко. Лишь после потери данных люди начинают прислушиваться к рекомендациям, по крайней мере, на некоторое время.
Безразлично, используются ли ленты или иные носители, в какой-то момент становится важен еще один аспект: когда заканчивается срок хранения или предстоит замена носителей? В определенный момент приходит пора предписанного уничтожения или утилизации носителей. Стирание, измельчение или так называемое размагничивание обязан выполнять специально обученный персонал и/или надежный сертифицированный провайдер. Мусорная свалка — ни в коем случае не место для захоронения чувствительных данных. Уверяя клиентов в том, что все данные удалены, предприятия должны проделать ту же процедуру и с архивами. Следует выяснить, что конкретно можно и нужно ликвидировать с учетом предусмотренного законом срока хранения, а что уничтожить в рамках персональной защиты данных.
При транспортировке данных также необходимо действовать профессионально и осторожно. Передаются ли они защищенным образом через Internet или доставляются транспортно-экспедиторским агентством, на каждый случай должны быть предусмотрены инструкции, как этого требует корпоративная осторожность.
В декабре 2004 г. «просто так» были утеряны сведения о кредитных картах 1,2 млн людей. Пакет, видимо, исчез при транспортировке. Лишь через несколько суток банк заметил, что недостает «небольшого количества» лент. Не стоит забывать, что почтовые службы и службы доставки теряют пакеты каждый день.
Законодательные требования вкупе с экономией от использования цифровых архивных систем гарантируют продолжительное и бурное развитие технологии управления жизненным циклом информации (Information Lifecycle Management, ILM). Если необходимо хранить данные десять лет или более, то в соответствии с принципами построения бухгалтерских систем, они должны храниться на носителях с однократной записью. Специальные ленты LTO3 (Ultrium 3) с недавнего времени доступны в виде носителя с однократной записью и многократным чтением (Write Once, Read Many, WORM).
Тема долгосрочного хранения данных является частью правильной стратегии всего предприятия, а не только специалистов одного из отделов ИТ. В 2006 г. в силу вступит Basel II, и тогда очень большое количество организаций должны будут исчерпывающе документировать свой статус в плане архивирования и резервного хранения данных, в том числе по отношению к банкам, с которыми они работают. Подробный обзор можно найти, к примеру, на http://CP.Base-I.info/.
Хаген Вольфштеттер — член правления LSK Storage. С ним можно связаться по адресу: hwollfstetter@lskstorage.de.
? AWi Verlag
Контрольный список для сохранения и восстановления данных
- Кто проводит сохранение данных?
- Кто отвечает за сохранение данных (в случае необходимости за оповещение по электронной почте)?
- Кто управляет паролями (на протяжении всего времени хранения)?
- Как в случае катастрофы можно восстановить работоспособную систему (аппаратное обеспечение, данные, операционную систему)?
- Проверить соглашения об уровне сервиса (Service Level Agreements, SLA)!
- Как долго нужно хранить данные?
- Как часто следует сохранять данные?
- Надо ли шифровать данные?
- Насколько быстрым должен быть доступ к хранимым данным?
- Когда происходит полное копирование?
- Когда нужно проводить инкрементальное копирование?
- Какие данные сохранять не нужно?
- Как организовано обслуживание (включая ленты для чистки)?
- Где хранятся данные?
- Есть ли возможность хранения всех копий данных в другом здании (разный профиль опасности в случае катастрофы)?
- Когда нужно менять ленты (при их изнашивании)?
- Составлен ли график?
- Когда проходит обучение?
- Проверена ли система восстановления?