Сегодня уже нельзя найти область в ИТ, которая обходила бы стороной облачную парадигму. Не исключение и два смежных направления BC/DR (Business Continuity/Disaster Recovery), распространяемые на планирование мероприятий и технологий обеспечения непрерывности бизнеса и восстановления после аварийных ситуаций.
Как бы замысловато ни формулировался предмет BC/DR, по гамбургскому счету он довольно точно описывается тремя на первый взгляд несерьезными законами Мерфи: неизбежности катастроф, необходимости подготовки к ним, оптимистичного выхода из положения. Законы эти были сформулированы еще в семидесятые годы в приложении к пилотируемым космическим полетам, но оказались справедливы для любых систем, требующих учета возможности возникновения нештатных ситуаций, в том числе и для информационных систем. Первый закон — «Если что-то может случиться, оно случится» — постулирует «риск есть всегда». Второй — «Невозможное тоже возможно» — подчеркивает, что при всем желании неприятностей не избежать. Третий — «Случается, что наши домашние любимцы покидают нас, но жизнь продолжается» — рекомендует набираться оптимизма справляться со случившимся.
По всей видимости, мысль о том, что события могут пойти по непредвиденному сценарию, была одной из первых, посетивших homo sapiens, иначе бы он как вид не выжил. Много позже систематические действия, связанные с подготовкой к нештатным ситуациям, описал Сунь Цзы в книге «Искусство войны». Европейцам же потребовались века, чтобы понять суть китайской мудрости. Ярчайший пример непонимания основ BC/DR продемонстрировал Наполеон в ходе Отечественной войны 1812 года, тем же страдали и другие крупные политики XIX и XX веков. Только после Второй мировой войны начались систематические работы в области, получившей название «сценарное планирование», ее методы основываются на теории игр в сочетании с фактами и знаниями из социальных наук, техники, экономики, политики и т. д. Первой успешной попыткой переноса методов сценарного планирования в бизнес оказалось на редкость удачное прогнозирование экспертами Royal Dutch/Shell поведения стран ОПЕК во время войны Судного дня в октябре 1973 года. Благодаря верному прогнозу, именно этой нефтяной компании удалось понести существенно меньший ущерб, чем всем остальным. Примерно в то же время нефтяной бизнес попал в зависимость от используемых им компьютерных систем, и тогда компания SunGard, специализирующаяся в том числе и на ПО для нефтяников, разработала решение Sun Information Services (SIS), где впервые реализовала обязательную процедуру ежедневного резервного копирования, ввела планирование восстановления после аварий и многое другое. Эти работы стали точкой старта направления BC/DR, которое в качестве самостоятельной области со всеми сопутствующими атрибутами существует уже несколько десятилетий. В последующем BC/DR в приложении к информационным системам выделилось в отдельное направление, а период с 1980 по 2000 год был отмечен активностью в области методических работ и создания множества технологий для обеспечения BC/DR.
Известные методологии BC/DR в приложении к ИТ служат для оценки рисков, выработки различного рода рекомендаций, встав в один ряд, например, с ITIL. Но, как и все остальные подобные полезные и мудрые наставления, методологии BC/DR занимают совершенно специфическое и ограниченное место, и нет ничего удивительного в том, что нередко практика BC/DR игнорирует методики, а то, что делается реально, сводится к созданию отказоустойчивых систем, различного рода технологий резервного копирования и резервных центров, работающих в холодном, теплом или горячем режиме, попросту исходя из разумных предположений. Тем не менее в США сформировался отдельный сегмент рынка услуг в области обеспечения непрерывности бизнеса, где сегодня доминируют две компании — IBM и SunGard, на которые приходится до 80% услуг этого типа. В области восстановления после аварий монополия принадлежит им же плюс еще и третьей — Comdisco, по совокупности им принадлежит 70% этого рынка.
После катастрофы 11 сентября 2001 года проблемы BC/DR оказались в центре внимания, но до последнего времени изменения носили количественный характер, и только появление динамических инфраструктур, которые стали образно называть облаками, открыло возможность для качественных изменений.
Для решений нового качества несколько лет назад было предложено новое название — Business Resilience, которое можно перевести как «устойчивость бизнеса» или «жизнеспособность бизнеса». Переход BC/DR в новое качество отражает факт достижения информационными системами такого уровня развития, который позволяет изменить основную парадигму обеспечения непрерывности бизнеса, а именно — перейти от оборонительной стратегии к наступательной. Дабы пояснить суть смены парадигмы, вернемся опять к законам Мерфи, признающим неизбежность катастроф и сбоев и необходимость выработки совокупности приемов, позволяющих минимизировать их последствия. Эта парадигма имеет право на существование лишь до тех пор, пока защищаемые системы остаются достаточно простыми и иного способа, нежели оборона, для них не существует. Однако, как только системная сложность повышается до некоторого порогового уровня, открывается возможность для перехода от оборонительной стратегии к активной, или наступательной. Суть ее в том, что не следует пассивно ждать наступления катастрофы, а разумнее создавать системы, способные справляться с внешними и внутренними возмущениями, переживать их без потери устойчивости.
За время своего существования BC/DR заметно эволюционировало, и теперь помимо традиционных методик и технологий включает подготовку к незапланированным ситуациям, управление в условиях критических и спасательных ситуаций и др. Созданный в 1994 году институт Business Continuity Institute дает следующее определение BC/DR: «Непрерывность бизнеса — это целостный процесс менеджмента, который определяет факторы, угрожающие предприятию, и формирует структуру, обеспечивающую жизнеспособность и эффективное реагирование на внешние воздействия». Ключевым в этом определении является «обеспечение жизнеспособности». Жизнеспособность, или устойчивость бизнеса, определяется как «способность организации к быстрой адаптации и реагированию на внешние и внутренние динамические изменения (такие как новые возможности, новые запросы, нарушения и угрозы) при сохранении функционирования с минимальным влиянием на бизнес». Жизнеспособность данных, приложений и аппаратного обеспечения — это лишь часть общей системы организации устойчивости предприятия перед воздействиями, поддержанной общей стратегией, организацией процессов, технологиями, условиями работы и методами физической безопасности.
Наметившийся переход от статических инфраструктур к облакам открывает возможности для создания жизнеспособных систем, гарантирующих устойчивость бизнеса по отношению к разного рода воздействиям. Однако сам по себе динамизм в виде виртуализации серверного парка предприятия, не приводит к повышению устойчивости информационных систем, более того, в таких системах при выходе из строя одного физического сервера нарушается работа всех работающих на нем виртуальных машин и, следовательно, более чем одного приложения. В итоге возрастают такие показатели, как время восстановления RTO (Recovery Time Objectives) и объем данных, необходимых для восстановления RPO (Recovery Point Objectives).
Существует два альтернативных подхода к обеспечению устойчивости динамических инфраструктур — разделение облачных решений на публичные и частные. Решения на основе публичных облачных сервисов предоставляются провайдерами и обеспечивают жизнеспособность поддерживаемой системы. Частное облако должно быть способно к самолечению, то есть к сохранению работоспособности в аварийных ситуациях. В качестве примера того и другого можно привести услуги, которые предлагают IBM и Symantec.
Сервисы IBM Information Protection Services предоставляются по обычной схеме «оплата по мере использования» (pay-as-you-use). Они поддерживаются сервисной платформой от IBM, доступ к которой осуществляется через публичные или частные сети. Обычно предполагается, что на стороне заказчика находится виртуализированная с помощью технологий VMware среда и имеется аналогичная среда в ЦОД. Все процедуры выполняются в автоматизированном режиме, и это позволяет утверждать, что сервисы повышают устойчивость бизнеса.
IBM Information Protection Services можно разделить на три группы.
- Удаленная защита данных. Чтобы защитить свои данные, можно использовать те или иные технологии архивирования собственными силами, но можно перейти на сервисную модель, при которой IBM берет на себя резервное копирование и восстановление данных, где и на каких устройствах они бы ни находились. Такие сервисы осуществляют постоянный мониторинг защищаемых данных, в невидимом для пользователя режиме сохраняют файлы и базы данных, а в случае необходимости восстанавливают их.
- Защита электронной почты. Выделение этого типа данных в отдельную категорию связано с несколькими обстоятельствами. С одной стороны, электронная переписка превратилась в основную форму документооборота в бизнесе, ее сохранность и доступность для проверки строго регламентируются нормативами. С другой, используется множество разных технологий для переписки, в том числе классические почтовые агенты Microsoft Outlook или Thunderbird, различного рода Web-порталы, смартфоны и другие мобильные устройства.
- Онлайн-защита данных. Обычно предприятия уделяют основное внимание важным данным, расположенным внутри корпоративных защитных экранов, а удаленные данные на мобильных компьютерах остаются «сиротами». Этот тип сервисов распространится именно на них и здесь будут использоваться IBM Business Continuity Resiliency Services в сочетании с IBM Tivoli Continuous DataProtection for Files для обеспечения защиты десктопов и ноутбуков за пределами защитных экранов.
Компания Symantec обеспечивает создание «жизнестойкого частного облака» (Resilient Private Cloud) путем механизмов оркестровки и автоматизации взаимодействия между серверами и системами хранения данных. Создание отказоустойчивого облака складывается из трех составных частей: масштабируемая архитектура; высокая готовность на всех уровнях; автоматизация. Реализация облака осуществляется средствами продукта Symantec ApplicationHA, созданного в результате партнерства Symantec и VMware. Сочетание Symantec ApplicationHA и VMware HA позволяет обеспечить непрерывность функционирования во внутреннем частном облаке приложений, критически важных для предприятия. Необходимо отметить, что Symantec ApplicationHA поддерживает многопотоковые приложения и обеспечивает согласованность в работе виртуализированных серверов и систем хранения данных. Подход Symantec не ограничивается средой, основанной на технология VMware, а распространяется и на гетерогенные облака с Unix-серверами, и здесь отказоустойчивость обеспечивает продукт Veritas Cluster Server.