Обеспечение непрерывности бизнеса касается трех важных областей: надежного финансирования, бесперебойного функционирования информационной техники и сохранения критично важных для предприятия данных. К нему относится также отказоустойчивость и повышенная готовность ИТ. Наряду с избыточными элементами ИТ система управления непрерывностью бизнеса играет существенную роль в деле ограничения ущерба и восстановления деятельности предприятия в случае нарушения работы сети благодаря предусматриваемому ею индивидуальному плану необходимых мероприятий.
В таком случае серверы, соединения и системы энергоснабжения имеются в двух экземплярах и при необходимости оперативно вводятся в строй. Что касается серверов, то обычно в качестве резервного решения для защиты данных в условиях непрерывной работы используются по меньшей мере два различных устройства. Нарушения деятельности предприятия могут иметь разные причины и значимость: отказ питания, неправильные действия персонала по отношению к ИТ, природная катастрофа, сопровождающаяся затоплением, потеря важного поставщика или даже — как редкое исключение — целенаправленный саботаж.
Работа предприятия может быть прервана на длительный срок или его деятельность может вовсе прекратиться, если причиненный ущерб слишком велик. Последствия могут состоять в значительной потере данных, а также нанесении ущерба репутации предприятия. При наличии обстоятельств, усугубляющих воздействие отказа, вводится профессиональное кризисное управление. В качестве упреждающей меры может служить разработка плана восстановительных работ, в котором содержатся заранее составленные сценарии действий на случай возникновения аварийной ситуации и четкие предписания в отношении маршрутов коммуникации и последовательности восстановления, а также перечисляются ответственные лица. Эта функция характеризует управление непрерывностью бизнеса (Business Continuity Management, BCM) как исчерпывающий метод обеспечения надежной работы и защиты предприятия от рисков.
Описанная концепция включает и стратегические соображения. При этом в отношении процесса управления учитываются рекомендации, содержащиеся, к примеру, в библиотеке инфраструктуры ИТ (IT Infrastructure Library, ITIL), и некоторые правовые требования (директива Basel II). В соответствии с определением, данным в Википедии, наука об организации производства предполагает, что управление непрерывностью работы есть не что иное как идеи, планирование и меры, необходимые для поддержания непрерывности производственной деятельности. Чтобы соответствовать этим высоким требованиям, в рамках управления рисками следует проанализировать критически важные деловые процессы, а также их связи — как между собой, так и с компонентами ИТ. Для проверки бесперебойности функционирования резервной инфраструктуры надлежит провести начальное тестирование и регулярно повторять выполнение тестов, что дополнительно будет способствовать приобретению практических навыков специалистов аварийной команды.
СТРАТЕГИЯ НЕПРЕРЫВНОСТИ БИЗНЕСА И ЕЕ РЕАЛИЗАЦИЯ
В основе управления непрерывностью бизнеса лежит анализ общих условий производства и конкретных потребностей предприятия. Чтобы разработать как стратегию непрерывности бизнеса, так и политику ее реализации, необходимо выявить и четко определить цели проекта и критичные для успеха факторы.
В фокусе внимания должны быть процессы и системы, существенные для выживания предприятия. Нужно правильно распределять зачастую скудные финансовые и людские ресурсы, чтобы поддержать действительно важные деловые процессы. Составными частями стратегии являются как специализированные оперативные планы и указания относительно процесса координации работ, так и планы восстановления бизнеса и инфраструктуры. Речь идет о том, чтобы спланировать решение по переходу на резервную технологию и предусмотреть другие возможности для успешного функционирования базирующихся на ИТ процессов (сохранение и передача данных или коммуникации по электронной почте).
Для четкого взаимодействия в аварийной ситуации следует создать структуру отчетности, которая, помимо прочего, включала бы этапы восстановительных работ и используемые средства коммуникации. Важно зафиксировать минимальные требования, априори определяющие максимально допустимое время отказа и максимально приемлемую потерю данных. Чтобы правильно расставить приоритеты, необходимо провести экономические оценки: к примеру, определить возможный размер ущерба, возмещаемого третьим лицам, или затраты на восстановление данных. В рамках операционного управления на основе тестовых сценариев проводится аудит и определяется потенциал для оптимизации расходов, причем фактические величины отклонений рекомендуется сопоставлять с желаемыми показателями. Это развивающийся процесс, и для него нельзя зафиксировать какое-либо статическое состояние, поскольку информационные технологии совершенствуются очень быстро, и резервные структуры приходится адаптировать заново для каждого отдельного случая.
При возникновении аварийной ситуации необходимо обеспечить профессиональную кризисную коммуникацию, она должна быть направлена на внутренние нужды предприятия, а также адресована клиентам и общественности, если этого требуют масштабы бедствия. Персоналу следует разъяснить, как вести себя в подобных ситуациях, и принять меры по обучению тех, кто в соответствии со своими должностными обязанностями принимает участие в процессе поддержания непрерывности бизнеса.
Организация внешних аварийных рабочих мест — основа управления непрерывностью бизнеса. Если повседневная деятельность предприятия прерывается на неопределенный период, то с целью ограничения ущерба выполнение основных деловых процессов должно быть возобновлено на одном или нескольких аварийных рабочих площадках с небольшой задержкой по времени. Избыточная инфраструктура, т. е. важное аппаратное и программное обеспечение, параллельно установленное в другом месте, позволяет продолжить деятельность за пределами производственной территории. В зависимости от потребности, решения могут различаться уровнями резервирования. Критерием для этого является временной промежуток («холодный», «теплый» или «горячий» резерв), в течение которого инфраструктура ИТ будет приведена в рабочее состояние.
Например, компания IXEurope предлагает три пакета ВСМ: базовый продукт («холодный» резерв) представляет собой самый дешевый вариант и обеспечивает минимальную инфраструктуру, позволяющую приступить к работе через два дня. Удаленная площадка функционирует без специального аппаратного оснащения и используется несколькими клиентами в качестве разделяемого ресурса. На ней установлен всего один базовый сервер, зато связь с вычислительными центрами поддерживается несколькими операторами. В случае необходимости аппаратное обеспечение приобретается заново или перевозится в вычислительный центр из основного здания. Рабочее место для восстановления операций после катастрофы оснащается проводкой локальной сети, персональным компьютером, письменным столом и телефоном (см. Рисунок 1). Восстановление возможно вплоть до последнего набора данных, сохраненного при резервном копировании.
При выборе более требовательного пакета продуктов («теплый» резерв) удаленная система заранее оснащается идентичным аппаратным обеспечением. Восстановление происходит начиная с последнего набора данных, сохраненного при резервном копировании. Помимо внутреннего вычислительного центра в качестве резервного решения имеется готовый к работе и немедленно конфигурируемый внешний вычислительный центр для восстановления деятельности после катастрофы. Задержка на ввод в эксплуатацию аварийных рабочих мест, при указанном варианте решения, составляет от 4 до 24 ч. В случае полностью избыточного пакета продуктов («горячий» резерв) к выполнению производственных задач можно приступить немедленно благодаря наличию на вторичном сай-те дублирующей инфраструктуры (см. Рисунок 2).
Заранее сконфигурированный «горячий» резерв предпочитают, в частности, поставщики финансовых услуг в торговле. У компании IXEurope, по ее собственным данным, в одной только Германии имеются 32 клиента из этого сектора, пользующихся услугами обеспечения непрерывности бизнеса (Business Continuity Services, IXBCS). В указанные услуги наряду с наличием внешней площадки входят подключение к одной или нескольким сетям, проведение мониторинга, предоставление специально обученного персонала и балансировка нагрузки.
Способ сохранения данных в процессе резервного копирования может варьироваться в зависимости от их объема. При полном резервном копировании все данные или совокупное содержимое жесткого диска сервера дублируются. При дифференциальном резервном копировании может создаваться копия изменений после последней полной процедуры копирования или же — в качестве третьего варианта — только изменений по сравнению с последней резервной копией. Основу решений резервного копирования составляет превентивное сохранение данных с использованием различных методов и уровней обеспечения безопасности, что позволяет быстро восстановить информацию. Если сохранение данных или приложений производится путем параллельного зеркалирования во второй вычислительный центр, то при восстановлении система будет функционировать без задержки по времени.
ЗАКЛЮЧЕНИЕ
Профессиональное управление непрерывностью бизнеса охватывает соблюдение всех условий для ИТ и предусматривает наличие аварийного плана, в котором будут учтены любые возможные отрицательные факторы и различные обстоятельства, имеющие отношение к производственным процессам. Предварительно определяются стратегические, организационные и технические меры. В качестве резервного решения, как правило, создается внешняя аварийная инфраструктура, оснащенная всем необходимым, вплоть до заранее сконфигурированных резервных рабочих мест. Операционное управление и управление рисками, связанными с ИТ, требуют наличия избыточной инфраструктуры, всеобъемлющих планов восстановительных работ, задания приоритетов и документирования тактической реализации процесса обеспечения
непрерывности бизнеса.
Йорг Розенгарт — коммерческий директор компании IXEurope.
© AWi Verlag