В этом центре управляют работой ЦОД DataLine |
«Работу над созданием катастрофоустойчивых вычислительных комплексов мы начали после того, как к нашему центру обработки данных на Боровой в 2010 году добавился ЦОД на Коровинском шоссе», — отметил Сергей Мищук, технический директор DataLine.
В компании первоначально использовалась программная система Double-Take Software, которая позволяет осуществлять асинхронную репликацию файлов физических и виртуальных серверов приложений, автоматизирует процедуры определения нештатных ситуаций и восстановления, способна работать со «слабыми» каналами передачи данных. Как утверждают в DataLine, ее высокая цена существенным образом влияла на стоимость соответствующих услуг для конечных заказчиков и, как следствие, являлась главным фактором низкого спроса.
Поэтому для сервиса CloudLine Metrocluster были использованы продукты NetApp, программное обеспечение VMware vSphere, vCenter Site Recovery Manager и ряд других решений VMware. Сервис основан на дублировании систем хранения данных в двух территориально разнесенных площадках ЦОД.
В NetApp разработан ряд конфигураций систем хранения, сертифицированных VMware и предназначенных для построения катастрофоустойчивых вычислительных систем. NetApp Fabric-Attached MetroCluster используется в тех случаях, когда ЦОД удалены друг от друга на расстояния от полукилометра до 160 км.
Компонентами этой конфигурации являются контроллеры дисковых массивов, работающие в режиме Active-Active, которые при отказах осуществляют переключение между устройствами как на локальной площадке, так и между локальной площадкой и удаленным ЦОД. Технология SyncMirror обеспечивает непрерывное копирование данных на удаленные сайты, а Cluster Remote позволяет администратору определить возникновение отказов и инициировать в случае необходимости переход на работоспособный ЦОД. Обязательное требование — резервирование коммуникаций Fibre Channel, применяющихся для взаимодействия ЦОД на удаленных площадках.
Длина канала связи между местами размещения центров обработки данных DataLine — 33 км. «ЦОД соединяют наши собственные кабели. В них вполне достаточно оптических волокон, чтобы резервировать и четырехгигабитные каналы Fibre Channel, и коммуникации 10 Gigabit Ethernet», — подчеркнул Мищук.
В DataLine утверждают, что благодаря синхронной репликации данных работа приложений в облаке будет продолжаться даже при отказе одного из узлов метрокластера. Однако, по словам Эдуарда Бавижева, руководителя отдела виртуализации, следует придерживаться определенных правил — к ним, например, относится требование отсутствия так называемых растянутых машин, при формировании которых виртуальные серверы и их данные размещаются на различных площадках. Дополнительным преимуществом CloudLine Metrocluster специалисты компании считают возможность балансировки нагрузки на уровне сети ЦОД.
Бавижев пояснил, что при отказе физической машины восстановление работоспособности размещенного на ней виртуального сервера, который перемещается на один из соседних или удаленных хостов, занимает не менее двух минут (это время определяется возможностями операционной системы). Процесс полного перехода на другой ЦОД, который осуществляется администратором и позволяет избежать рассогласованности данных, потребует не менее 15 минут.
В каждом ЦОД предусмотрен 30-процентный резерв вычислительных ресурсов по отношению к их пиковой загрузке.
Первыми пользователями сервиса CloudLine Metrocluster, применявшими его для создания частных облаков, стали несколько розничных сетй. Теперь он будет предоставляться также в рамках публичного облака DataLine. Цена нового сервиса, по данным компании, приблизительно вдвое выше стоимости услуг с использованием ресурсов отказоустойчивого кластера, размещенного в одном ЦОД.
В прошлом году на сервисы, базирующиеся на виртуализации, приходилось 12% выручки DataLine. В текущем финансовом году, который завершается в апреле 2014-го, планируется выйти на показатель 14%; ожидается, что на долю катострофоустойчивых облачных сервисов придется примерно 30% из них.