Облачная устойчивость бизнеса

Сегодня уже нельзя найти область в ИТ, которая обходила бы стороной облачную парадигму. Не исключение и два смежных направления BC/DR (Business Continuity/Disaster Recovery), распространяемые на планирование мероприятий и технологий обеспечения непрерывности бизнеса и восстановления после аварийных ситуаций.

Как бы замысловато ни формулировался предмет BC/DR, по гамбургскому счету он довольно точно описывается тремя на первый взгляд несерьезными законами Мерфи: неизбежности катастроф, необходимости подготовки к ним, оптимистичного выхода из положения. Законы эти были сформулированы еще в семидесятые годы в приложении к пилотируемым космическим полетам, но оказались справедливы для любых систем, требующих учета возможности возникновения нештатных ситуаций, в том числе и для информационных систем. Первый закон — «Если что-то может случиться, оно случится» — постулирует «риск есть всегда». Второй — «Невозможное тоже возможно» — подчеркивает, что при всем желании неприятностей не избежать. Третий — «Случается, что наши домашние любимцы покидают нас, но жизнь продолжается» — рекомендует набираться оптимизма справляться со случившимся.

По всей видимости, мысль о том, что события могут пойти по непредвиденному сценарию, была одной из первых, посетивших homo sapiens, иначе бы он как вид не выжил. Много позже систематические действия, связанные с подготовкой к нештатным ситуациям, описал Сунь Цзы в книге «Искусство войны». Европейцам же потребовались века, чтобы понять суть китайской мудрости. Ярчайший пример непонимания основ BC/DR продемонстрировал Наполеон в ходе Отечественной войны 1812 года, тем же страдали и другие крупные политики XIX и XX веков. Только после Второй мировой войны начались систематические работы в области, получившей название «сценарное планирование», ее методы основываются на теории игр в сочетании с фактами и знаниями из социальных наук, техники, экономики, политики и т. д. Первой успешной попыткой переноса методов сценарного планирования в бизнес оказалось на редкость удачное прогнозирование экспертами Royal Dutch/Shell поведения стран ОПЕК во время войны Судного дня в октябре 1973 года. Благодаря верному прогнозу, именно этой нефтяной компании удалось понести существенно меньший ущерб, чем всем остальным. Примерно в то же время нефтяной бизнес попал в зависимость от используемых им компьютерных систем, и тогда компания SunGard, специализирующаяся в том числе и на ПО для нефтяников, разработала решение Sun Information Services (SIS), где впервые реализовала обязательную процедуру ежедневного резервного копирования, ввела планирование восстановления после аварий и многое другое. Эти работы стали точкой старта направления BC/DR, которое в качестве самостоятельной области со всеми сопутствующими атрибутами существует уже несколько десятилетий. В последующем BC/DR в приложении к информационным системам выделилось в отдельное направление, а период с 1980 по 2000 год был отмечен активностью в области методических работ и создания множества технологий для обеспечения BC/DR.

Известные методологии BC/DR в приложении к ИТ служат для оценки рисков, выработки различного рода рекомендаций, встав в один ряд, например, с ITIL. Но, как и все остальные подобные полезные и мудрые наставления, методологии BC/DR занимают совершенно специфическое и ограниченное место, и нет ничего удивительного в том, что нередко практика BC/DR игнорирует методики, а то, что делается реально, сводится к созданию отказоустойчивых систем, различного рода технологий резервного копирования и резервных центров, работающих в холодном, теплом или горячем режиме, попросту исходя из разумных предположений. Тем не менее в США сформировался отдельный сегмент рынка услуг в области обеспечения непрерывности бизнеса, где сегодня доминируют две компании — IBM и SunGard, на которые приходится до 80% услуг этого типа. В области восстановления после аварий монополия принадлежит им же плюс еще и третьей — Comdisco, по совокупности им принадлежит 70% этого рынка.

После катастрофы 11 сентября 2001 года проблемы BC/DR оказались в центре внимания, но до последнего времени изменения носили количественный характер, и только появление динамических инфраструктур, которые стали образно называть облаками, открыло возможность для качественных изменений.

Для решений нового качества несколько лет назад было предложено новое название — Business Resilience, которое можно перевести как «устойчивость бизнеса» или «жизнеспособность бизнеса». Переход BC/DR в новое качество отражает факт достижения информационными системами такого уровня развития, который позволяет изменить основную парадигму обеспечения непрерывности бизнеса, а именно — перейти от оборонительной стратегии к наступательной. Дабы пояснить суть смены парадигмы, вернемся опять к законам Мерфи, признающим неизбежность катастроф и сбоев и необходимость выработки совокупности приемов, позволяющих минимизировать их последствия. Эта парадигма имеет право на существование лишь до тех пор, пока защищаемые системы остаются достаточно простыми и иного способа, нежели оборона, для них не существует. Однако, как только системная сложность повышается до некоторого порогового уровня, открывается возможность для перехода от оборонительной стратегии к активной, или наступательной. Суть ее в том, что не следует пассивно ждать наступления катастрофы, а разумнее создавать системы, способные справляться с внешними и внутренними возмущениями, переживать их без потери устойчивости.

За время своего существования BC/DR заметно эволюционировало, и теперь помимо традиционных методик и технологий включает подготовку к незапланированным ситуациям, управление в условиях критических и спасательных ситуаций и др. Созданный в 1994 году институт Business Continuity Institute дает следующее определение BC/DR: «Непрерывность бизнеса — это целостный процесс менеджмента, который определяет факторы, угрожающие предприятию, и формирует структуру, обеспечивающую жизнеспособность и эффективное реагирование на внешние воздействия». Ключевым в этом определении является «обеспечение жизнеспособности». Жизнеспособность, или устойчивость бизнеса, определяется как «способность организации к быстрой адаптации и реагированию на внешние и внутренние динамические изменения (такие как новые возможности, новые запросы, нарушения и угрозы) при сохранении функционирования с минимальным влиянием на бизнес». Жизнеспособность данных, приложений и аппаратного обеспечения — это лишь часть общей системы организации устойчивости предприятия перед воздействиями, поддержанной общей стратегией, организацией процессов, технологиями, условиями работы и методами физической безопасности.

Наметившийся переход от статических инфраструктур к облакам открывает возможности для создания жизнеспособных систем, гарантирующих устойчивость бизнеса по отношению к разного рода воздействиям. Однако сам по себе динамизм в виде виртуализации серверного парка предприятия, не приводит к повышению устойчивости информационных систем, более того, в таких системах при выходе из строя одного физического сервера нарушается работа всех работающих на нем виртуальных машин и, следовательно, более чем одного приложения. В итоге возрастают такие показатели, как время восстановления RTO (Recovery Time Objectives) и объем данных, необходимых для восстановления RPO (Recovery Point Objectives).

Существует два альтернативных подхода к обеспечению устойчивости динамических инфраструктур — разделение облачных решений на публичные и частные. Решения на основе публичных облачных сервисов предоставляются провайдерами и обеспечивают жизнеспособность поддерживаемой системы. Частное облако должно быть способно к самолечению, то есть к сохранению работоспособности в аварийных ситуациях. В качестве примера того и другого можно привести услуги, которые предлагают IBM и Symantec.

Сервисы IBM Information Protection Services предоставляются по обычной схеме «оплата по мере использования» (pay-as-you-use). Они поддерживаются сервисной платформой от IBM, доступ к которой осуществляется через публичные или частные сети. Обычно предполагается, что на стороне заказчика находится виртуализированная с помощью технологий VMware среда и имеется аналогичная среда в ЦОД. Все процедуры выполняются в автоматизированном режиме, и это позволяет утверждать, что сервисы повышают устойчивость бизнеса.

IBM Information Protection Services можно разделить на три группы.

Удаленная защита данных. Чтобы защитить свои данные, можно использовать те или иные технологии архивирования собственными силами, но можно перейти на сервисную модель, при которой IBM берет на себя резервное копирование и восстановление данных, где и на каких устройствах они бы ни находились. Такие сервисы осуществляют постоянный мониторинг защищаемых данных, в невидимом для пользователя режиме сохраняют файлы и базы данных, а в случае необходимости восстанавливают их.
Защита электронной почты. Выделение этого типа данных в отдельную категорию связано с несколькими обстоятельствами. С одной стороны, электронная переписка превратилась в основную форму документооборота в бизнесе, ее сохранность и доступность для проверки строго регламентируются нормативами. С другой, используется множество разных технологий для переписки, в том числе классические почтовые агенты Microsoft Outlook или Thunderbird, различного рода Web-порталы, смартфоны и другие мобильные устройства.
Онлайн-защита данных. Обычно предприятия уделяют основное внимание важным данным, расположенным внутри корпоративных защитных экранов, а удаленные данные на мобильных компьютерах остаются «сиротами». Этот тип сервисов распространится именно на них и здесь будут использоваться IBM Business Continuity Resiliency Services в сочетании с IBM Tivoli Continuous DataProtection for Files для обеспечения защиты десктопов и ноутбуков за пределами защитных экранов.

Компания Symantec обеспечивает создание «жизнестойкого частного облака» (Resilient Private Cloud) путем механизмов оркестровки и автоматизации взаимодействия между серверами и системами хранения данных. Создание отказоустойчивого облака складывается из трех составных частей: масштабируемая архитектура; высокая готовность на всех уровнях; автоматизация. Реализация облака осуществляется средствами продукта Symantec ApplicationHA, созданного в результате партнерства Symantec и VMware. Сочетание Symantec ApplicationHA и VMware HA позволяет обеспечить непрерывность функционирования во внутреннем частном облаке приложений, критически важных для предприятия. Необходимо отметить, что Symantec ApplicationHA поддерживает многопотоковые приложения и обеспечивает согласованность в работе виртуализированных серверов и систем хранения данных. Подход Symantec не ограничивается средой, основанной на технология VMware, а распространяется и на гетерогенные облака с Unix-серверами, и здесь отказоустойчивость обеспечивает продукт Veritas Cluster Server.