Алексей Соловьев, системный инженер, подразделение IT Business компании Schneider Electric |
При переходе от традиционных принципов построения ИТ-систем в центре обработки данных к облачным вычислениям происходит частичная или полная замена серверного оборудования. Новое оборудование компактнее стандартных серверов, но с другой стороны, энергетическая плотность ИТ-оборудования повышается. Инженерная инфраструктура ЦОДа, спроектированная для классического серверного оборудования с низкой плотностью мощности, может оказаться не готова к переходу к виртуализированному ЦОДу. Поэтому при рассмотрении проектов виртуализации необходимо учитывать необходимость внесения изменений в инженерную инфраструктуру вычислительного центра.
Виртуализация ИТ-оборудования влияет на три основных ресурса инженерной инфраструктуры ЦОДа: электропитание, охлаждение и физическое размещение оборудования, то есть полезную площадь машинного зала. Результаты такого влияния изучены, и на сегодняшний день существует несколько стратегий для приведения инженерной инфраструктуры ЦОДа в соответствие с новыми требованиями нагрузки.
При внедрении проекта виртуализации необходимо убедиться, что проектная мощность системы электропитания и охлаждения на уровне каждой стойки достаточна для работы нового оборудования. Традиционная схема охлаждения в вычислительном центре с использованием периметральных кондиционеров, подающих воздух под фальшпол, имеет ограничения по плотности мощности оборудования в стойках, для большинства случаев это 5-6 кВт на стойку. Размещение в ряду стойки с высокой плотностью мощности может привести к возникновению зоны локального перегрева, даже если среднее значение по энергопотреблению в ряду не будет превышено. Самым простым решением проблемы повышенного энергопотребления оборудованием является равномерное распределение хост-серверов по стойкам в машинном зале. Такой способ не требует дополнительных изменений в инженерной инфраструктуре. Однако в этом случае в стойках останется много свободного места, которое нельзя использовать, т.к. предел по охлаждению для конкретной стойки уже достигнут. В ситуации, когда необходимо экономить пространство машинного зала, например, для сдачи его в аренду, уместно рассмотреть создание локальной зоны для виртуализированного оборудования. В этом случае применение внутрирядных кондиционеров совместно с изоляцией горячего коридора позволит гарантированно отвести тепло от стоек с высокой энергетической плотностью. Дополнительный эффект от изоляции горячего коридора наблюдается в повышении скорости реакции на динамическое изменение потребления в стойках, характерное для виртуализированных нагрузок. Минимизация перемешивания воздушных потоков и максимальное приближение источника тепла к источнику холода позволяет оперативно реагировать на увеличение или снижение тепловыделения в стойке.
Благодаря собственной отказоустойчивости сильно виртуализированных сред на сегодняшний день сокращение избыточности инфраструктуры является вполне реальной задачей. Виртуализированная среда похожа на RAID-массив в том плане, что она является отказоустойчивой и может легко восстанавливаться в случае сбоев. При возникновении проблем можно быстро и в автоматическом режиме перемещать рабочие нагрузки, целые виртуальные машины и виртуализированные ресурсы хранения в более безопасные части сети, и в сильно виртуализированных средах можно поддерживать уровни обслуживания, даже когда некоторые серверы или стойки недоступны. Благодаря такой отказоустойчивости в сильно виртуализированных центрах обработки данных потребность в избыточных системах электропитания и охлаждения (например, 2N или 2N+1) значительно снижается.
Дополнительного повышения надежности работы виртуализированных серверов можно добиться с помощью оптимизации системы управления и организации взаимосвязанной работы систем управления виртуальными машинами и системы управления инженерной инфраструктурой ЦОДа. Современные системы управления инженерной инфраструктурой ЦОДа способны отслеживать нештатные ситуации в работе инженерного оборудования, например, потерю уровня резервирования или переход ИБП на питание от батарей и передавать аварийные сигналы в систему управления виртуальными машинами для перевода виртуальных машин на безопасные хост-серверы.