Финансовая группа «Лайф» создала катастрофоустойчивый распределенный ЦОД. В штатном режиме ИТ-комплекс из двух площадок, удаленных друг от друга на 40 км, функционирует как единый ЦОД и обеспечивает работу 10 ключевых банковских систем. В случае полной потери одного узла восстановление сервисов во втором происходит в течение 2,5 часов. При единичных аппаратных сбоях перемещение вычислительных задач на свободные мощности занимает до пяти минут.
Данный проект стал частью масштабной программы развития ИТ группы «Лайф». Ранее компания «Инфосистемы Джет» создала динамическую инфраструктуру в рамках одного ЦОД для четырех банковских систем. Следующей задачей стало построение резервной площадки для защиты сервисов и данных от чрезвычайных ситуаций. При этом важно было обеспечить возможность одновременной загрузки обоих ЦОД в штатном режиме. Все это обусловило построение не классического резервного, а распределенного ЦОД.
На арендуемой площадке создана ИТ-платформа, аналогичная основной: виртуализованы и консолидированы вычислительные ресурсы и СХД, построена вторая система резервного копирования. Между площадками по разным маршрутам проложены две равнозначные оптические линии, между системами хранения настроено зеркалирование данных.
Комплекс защищает сервисы как от локальных аппаратных сбоев, так и от полного разрушения любого из центров. При штатном функционировании приложения пользуются ресурсами обеих площадок. Избыточные мощности могут применяться для текущих нужд: создания тестовых сред, временного размещения систем при проведении сервисных работ или проблемах с электропитанием, увеличения производительности в периоды создания отчетности.