В результате шансы на продолжение ведения бизнеса во время и после бедствий существенно выросли.
Определенные меры к этому были приняты властями, издавшими соответствующие нормативные акты, однако прежде всего сами компании укрепляли и расширяли свои возможности в области восстановления бизнеса после бедствий.
Самые разные организации до сих пор продолжают решать колоссальные по объему задачи, которые были выявлены в результате трагедии 11 сентября 2001 года. Фото: Derek Jensen (Tysto) |
Благодаря виртуализации и внутренним облачным архитектурам, а также возможности содержать несколько активных ЦОД, быстро обменивающихся рабочей нагрузкой при сбоях, сократилось время полного восстановления работоспособности после системных сбоев.
Но возможно самой важной переменой, происшедшей после 11 сентября 2001 года и дальнейших стихийных бедствий, таких как ураган Катрина, стало появление у компаний заботы о сохранении работоспособности самих сотрудников вопреки сбоям корпоративных ИТ-систем.
Устойчивость рабочей силы
В годы, прошедшие с трагедии 11 сентября, предприятия волей-неволей переходили на более гибкие рабочие среды, которые позволяют сотрудникам работать дистанционно с помощью виртуальных частных сетей и иных технических средств вроде карманных устройств и смартфонов.
Роберта Уитти, аналитик Gartner, уверена, что самым важным уроком 9/11 для компаний стала необходимость заботиться о своих работниках. В Gartner даже выделяют особую категорию оптимальных методов — «устойчивость рабочей силы», относя к ней меры оповещения сотрудников о нештатной ситуации и обеспечение их Интернет-доступом, электропитанием для мобильных устройств, VPN-сетями и т. д.
Компании, оповещающие о чрезвычайных ситуациях, такие как Everbridge, SunGard, Omnilert и Federal Signal, сообщают о грандиозном росте заказов на услугу по организации «телефонного дерева» (call tree — принцип передачи сообщения по телефону, когда один служащий организации обзванивает небольшую группу коллег, а те, в свою очередь, — другие группы и т. д. — Прим. ред.).
Муниципальные службы тоже расширяют помощь, направленную на сохранение работоспособности компаний и их сотрудников во время бедствий. Когда в августе 2011 года миллионы людей на Северо-Западе США остались без электричества во время урагана Айрин, муниципальные управления, в которых сохранилось электроснабжение, организовали интернет-кафе и передвижные зарядные станции, работавшие на общественных началах. Связавшись с местным управлением по чрезвычайным ситуациям, компании теперь могут быстро получить всю информацию о том, как с последствиями бедствия борются власти.
Государственные службы и корпоративные отделы по аварийному восстановлению стали шире использовать социальные СМИ вроде Facebook и Twitter, чтобы оповещать персонал и поддерживать связь с руководством. Во многих компаниях даже появился специальный пост — директор по социальным СМИ, в обязанности которого входит управление онлайн-коммуникациями.
«Одна из забот директора по социальным СМИ — отслеживание слухов о компании в Интернете», — уточняет Уитти.
В некоторых организациях теперь даже держат запасы раскладушек, фонариков, еды и воды, чтобы сотрудники, оказавшиеся в офисе во время бедствия, могли там временно укрыться. Создаются географически удаленные резервные ЦОД, с помощью которых можно было бы быстро восстановить работу критически важных систем.
Управление рисками
ИТ-менеджеры жалуются, что даже после событий сентября 2001 года им приходится буквально отвоевывать деньги на внедрение технологий и планов восстановления после бедствий (Disaster Recovery). После трагедии 11 сентября, а также последующих громких дел о корпоративных мошенничествах большое развитие получила концепция управления рисками, включающая планирование мер восстановления.
«Директоры по управлению рисками, которые раньше вообще не принимали в расчет ИТ, сейчас считают технические сбои обязательной составляющей в рамках общекорпоративной стратегии управления рисками», — говорит Родни Нелзестьюэн, директор по исследованиям консалтинговой компании Tower Group.
Правительство США позаботилось о том, чтобы финансовые структуры вложили миллионы долларов в модернизацию внутренних ИТ-систем с целью обеспечения соответствия принятому в октябре 2001 года Патриотическому акту. Этот закон, в частности, требует от финансистов расширения возможностей по выявлению подозрительных транзакций и клиентов.
«11 сентября научило людей бдительности, — считает Нелзестьюэн. — Мне кажется, раньше мы были более беззаботными».
Компания Merryl Lynch, чья штаб-квартира размещалась рядом с эпицентром трагедии, на шесть недель лишилась своего головного центра обработки данных. Впоследствии специалисты компании провели анализ пробелов, чтобы определить, чего не хватало и что может понадобиться на случай новых бедствий. По мнению экспертов, регулярное проведение такого анализа — важнейший элемент подготовки к аварийным сбоям.
Офис компании Cantor Fitzgerald располагался прямо в здании Всемирного торгового центра. Она потеряла 658 сотрудников и основной ЦОД.
«Cantor Fitzgerald была одним из крупнейших мировых трейдеров по облигациям, — сообщает Нелзестьюэн. — Никто и вообразить не мог, что такая трагедия может случиться».
Примечательно, что после катастрофы руку помощи Cantor Fitzgerald протянули ее же конкуренты, они взяли на себя торги облигациями от имени компании на период, пока она восстанавливалась после теракта.
«Естественно, эту подстраховку заранее никто не планировал, — отмечает Нелзестьюен. — Но подобное — не единичный случай, происшедший в то страшное время. Затем компании вынуждены были задуматься о предупредительных мерах, чтобы сохранить жизни людей в случае катастроф».
RPO и RTO
Специалисты Tower Group делят катастрофы бизнеса на три категории: природные — ураганы и землетрясения, техногенные и вызванные человеком, преднамеренно или по случайности. Но принципы оптимальных способов восстановления после любых бедствий постоянно пересматриваются, подчеркнул Нелзестьюэн.
Компании стремятся изменить свою технологическую инфраструктуру таким образом, чтобы в случае катастрофы как можно быстрее вернуться к работе. Для этого необходимо, чтобы все данные, накопленные до момента аварии, остались в сохранности.
Способность к восстановлению после бедствий и обеспечение непрерывности бизнеса сегодня нередко оценивается с помощью двух показателей: целевая точка восстановления (Recovery Point Objective, RPO) и целевой срок восстановления (Recovery Time Objective, RTO). Можно сказать, что эти факторы определяют, какой объем данных компания готова потерять в случае отказа систем.
Например, о компании, которая синхронно с созданием резервных копий тиражирует их в удаленные ЦОД, круглосуточно функционирующие в активном режиме, говорят, что она создала архитектуру, отличающуюся малыми RPO и RTO. Если же данные тиражируются в асинхронном режиме или резервная копия создается только на ленте, это значит, что компания согласна на потерю части данных, передаваемых в момент аварии, или на более длительное восстанавление систем после сбоя.
«Раньше общепринятой практикой было иметь основной ЦОД, а на случай аварийных сбоев — резервный, на ввод которого в действие уходило от 24 до 72 часов, — объясняет Нелзестьюэн. — Теперь оба ЦОД постоянно активны и выполняют резервное копирование, а у многих организаций параллельно работает сразу несколько ЦОД, между которыми непрерывно тиражируются данные».
«Теперь восстанавливаться можно гораздо оперативнее, поскольку появилась возможность откатывать системы до предыдущего состояния на любой момент времени, — отмечает Нелзестьюэн. — В некоторых организациях даже подумывают о том, чтобы в дополнение ко всему еще и вести бумажные журналы операций и использовать их как последнее средство, если все остальное не сработает».
Перенос данных на большие расстояния до 11 сентября 2001 года практически никем не осуществлялся. Большинству компаний хватало тиражирования данных на внутренние системы или в здание в нескольких километрах от головного ЦОД. Лишь отдельные организации, например биржа NASDAQ, тиражировали данные в другой штат. В некоторых компаниях тиражирование до сих пор организовано неверно, — считает Нелзестьюэн: «Я знаю компанию, у которой один ЦОД расположен во Флориде, а другой в Техасе, то если случится ураган, он может разрушить сразу оба центра».
Облака
В концепции облачных сервисов, дистанционной аренды приложений или ресурсов хранения данных, нет ничего нового. Даже еще до трагедии 11 сентября компании наподобие Storage Networks предлагали корпоративным заказчикам возможность хранить их данные в географически удаленном ЦОД, к которому можно было получить дистанционный доступ в случае катастрофы.
Сегодня общедоступные и частные облачные сервисы обеспечивают надежную защиту критически важных для бизнеса данных, то есть тех, которые приносят компании ее доход. Эти данные тиражируются на системы сервис-провайдера или хранятся в частном корпоративном облаке, доступ к которому можно получить откуда угодно.
Общедоступные облака особенно выгодны для малых и средних предприятий, поскольку облачные сервисы обеспечивают восстановительные возможности корпоративного уровня по доступной цене. Однако эксперты предостерегают от злоупотребления такими сервисами, чтобы резервное копирование не влетело в копейку. Стоит сохранять лишь те данные, которые необходимы для восстановления бизнеса, не обязательно в полном объеме.
Еще одна рекомендация: при выборе провайдера облачных сервисов следует убедиться, что его системы подключены не к той электросети, к которой подключены ваши.
«В компании могут ошибочно полагать, что ее тылы надежно прикрыты благодаря тиражированию данных в ЦОД, находящийся за много километров, однако может оказаться, что он подключен к той же энергосети, что и ее собственный офис, — предупреждает Эл Берман, исполнительный директор Международного института по восстановлению после бедствий. — Если электросеть выйдет из строя, то одновременно могут пострадать и компания, и ее облачный провадер».
По мнению Нелзестьюэна, достоинства облачных сервисов перехваливают, особенно их преимущества для индустрии финансовых услуг. По прогнозу аналитиков Tower Group, годовые расходы финансовой отрасли на облачные сервисы к 2015 году вырастут до 27 млрд долл., но составят лишь 5-6% общего объема ИТ-затрат в данном секторе.
«Пока еще остается слишком много проблем, связанных с безопасностью и операционными аспектами облачных вычислений, — полагает Нелзестьюэн. — Сейчас организации буквально ринулись создавать частные облака. Они виртуализируют платформы, оборудование и сети, чтобы обеспечить непрерывное резервное копирование данных. Но это касается лишь внутренних ресурсов».
По мнению Уитти, компании до сих пор продолжают решать тот колоссальный объем задач, который был выявлен в результате уроков, преподанных трагедией 11 сентября 2001 года: «Прежде в готовности компаний к восстановлению зияли огромные пробелы. Лишь после трагедии стала очевидной необходимость обеспечить непрерывность бизнеса. Катастрофа показала, насколько важны забота о людях, возможность поддерживать связь с ними и наличие в компаниях средств помощи служащим, попавшим в беду. Чрезвычайную значимость также приобрело сотрудничество с государственными службами».