Компания Databurg на протяжении десяти лет содержит ЦОД, оборудованная и эксплуатируемая площадь которого на данный момент составляет около 15 тыс. м2. Главная задача — максимально соответствовать постоянно изменяющимся потребностям клиентов — привела к формированию многоступенчатой модели обеспечения надежности, позволяющей предоставлять необходимые инфраструктурные услуги в соответствии с потребностями заказчиков и на выгодных условиях.
Достижение максимально возможной готовности инженерного оборудования и доступности ЦОД — именно такую задачу решали е владельцы крупных коммерческих ЦОД на протяжении многих лет. Кроме прочего, это служило важным признаком качества и производительности. Такой подход связан с высокими вложениями во всю обслуживающую инфраструктуру с избыточными установками для обеспечения электропитания и охлаждения, а также в создание дублирующей инфраструктуры для задействованных путей снабжения и сетевых соединений.
В современных условиях уже не требуется проектировать и обеспечивать столь высокий уровень надежности во всем ЦОД, поскольку не все предприятия нуждаются в максимальной защите инфраструктуры от сбоев. В соответствии с потребностями приложений и пожеланиями заказчиков различные требования к доступности систем можно реализовать более эффективным образом с помощью варьирования избыточности инженерных инфраструктур и путей снабжения. Клиенты, которые считают, что для функционирования их систем ИТ не нужна избыточная реализация обслуживающих систем, будут платить меньшую арендную плату.
В зависимости от вида деятельности и размера предприятия, а также типа приложений и данных, к функциональности и доступности систем ИТ предъявляются различные требования. В модели деловых отношений многих организаций отказоустойчивость систем ИТ имеет ключевое значение для ведения бизнеса. В случае дифференцированной оценки рисков должны быть известны все угрозы. Необходимо также оценить, в какой степени допустима каждая из них. Если риск слишком велик, необходимо предусмотреть меры по его компенсации. Так, банки и поставщики финансовых услуг, которые в рамках мер по обеспечению непрерывности бизнеса (Business Continuity Management) реализуют резервные решения, ожидают, что для их избыточных систем ИТ во внешнем центре обработки данных будет обеспечиваться такая же высокая доступность, как и в собственных помещениях.
А вот малые и средние предприятия, которые способны пережить временный простой приложений (Downtime) или краткосрочное отсутствие доступа к данным без риска для предприятия и выплат компенсации убытков третьим лицам, могут разместить свои серверы в менее требовательной среде ЦОД. Поэтому и платить за аутсорсинг им придется меньше, чем тем, которые стремятся к максимальной доступности. Таким образом, масштабируемая инфраструктура ЦОД для различных категорий клиентов представляет собой справедливую модель услуг аутсорсинга. Клиенты могут сами определить индивидуальные требования и нужный уровень доступности. Владелец ЦОД должен обеспечить экономически выгодное предоставление среды в рамках желаемого класса доступности и реализовать ее, не выходя за пределы общего управления проектом для используемой площадки ЦОД.
КЛАССИФИКАЦИЯ ДОСТУПНОСТИ
Рынок аутсорсинга находится под сильным влиянием процесса слияния информационных технологий и управления основными фондами (Facility Management, FM) с целью обеспечения высокой доступности в ЦОД. Планирование инфраструктуры и текущая эксплуатация инженерного оборудования должны осуществляться с учетом экономических и экологических последствий. При проектировании и расширении площадей в ЦОД используется традиционная классификация компонентов по уровням Tier — с 1-го по 4-й. Самое низкое значение для каждой категории — сюда входят энергоснабжение, охлаждение, техническое обеспечение и мониторинг — определяет итоговый результат. Эта классификация относится к избыточному оснащению устройств и путей снабжения.
Управление рисками в ЦОД включает в себя следующие этапы:
- определить, какие компоненты важны для каждого уровня Tier (с 1-го по 4-й);
- оценить, требуется ли в рамках одного уровня Tier одна и та же степень надежности и избыточности для всех компонентов;
- сформулировать возможные источники опасности;
- внедрить превентивные или защитные меры для действий в чрезвычайной ситуации.
С точки зрения компании Databurg, уровни Tier 1 и Tier 3 являются наиболее оправданными для обеспечения дифференцированной работы центра обработки данных. Минимальное оснащение ЦОД в соответствии со стандартом Tier 1 подходит небольшим и недавно созданным предприятиям, чьи ИТ ориентированы преимущественно на поддержку внутренних процессов. Используемые ими приложения не имеют критической важности для обеспечения деловой деятельности, а их интернет-сайты выполняют сугубо репрезентативную функцию, способствуют формированию имиджа компании и служат информационным целям. В эту категорию попадают и те малые предприятия, которым для взаимодействия с клиентами (Customer Relationship Management) не требуется обязательная компьютерная поддержка.
При таком уровне отказоустойчивости в число основных задач входят функции сохранения данных, когда их сохранение или считывание происходит, к примеру, раз в день, а также поддержка электронной почты и печати. Предприятия, чьи системы ИТ в течение рабочей недели активно используются лишь 5,5 дней, обходятся инфраструктурой с топологией уровня Tier 1.
Концепция «облачных» вычислений (Cloud Computing) в настоящее время представляет собой широко распространенную структуру, при которой приложения и их доступность обеспечиваются с использованием нескольких площадок. В результате объединения кластерных решений высокая доступность отдельных площадок отходит на второй план. Эта модель сейчас очень привлекательна, поскольку цены на аппаратное обеспечение и аренду ресурсов мощности значительно снизились. При этом необходимо рассмотреть целесообразность затрат на аренду площадей в ЦОД. Обеспечение стандартного уровня Tier 3 и вовлечение в процесс нескольких площадок обходится слишком дорого, а вот инфраструктурная среда уровня Tier 1 позволяет создать экономически привлекательную модель. При отказе одного из серверов или целой площадки функции сразу может взять на себя другая.
Рисунок 1. Международные нормы и директивы для ЦОД. |
КЛАССЫ TIER
Специалисты Uptime Institute (www.uptimeinstitute.org) разработали общую классификацию уровней Tier 1–4. Концепция Tier 1 состоит из одной системы и одиночных, не избыточных, путей снабжения, ведущих к компьютерному оборудованию данной площадки. В этом случае нет пространственного разграничения с другими системами. Классификация Tier 1 от Uptime Institute не предусматривает наличия избыточных компонентов, поэтому устанавливается единственная система ИБП. Для питания оборудования во время проведения технических работ существует внутренний обходной путь (Bypass) в ИБП, так как ежегодное техническое обслуживание обычно не может осуществляться без переключения на незащищенную электросеть и связанных с этим рисков.
Для компенсации возможных неполадок линии снабжения, ведущей к ИБП, требуется второй источник питания, к примеру дизельный генератор, который будет автоматически запускаться в случае прерывания подачи электроэнергии. Следует отметить, что в этой концепции сбой одного из компонентов снабжения или снижение доступности пути снабжения приводят к помехам в работе компьютерных систем. По данным Uptime Institute, максимальный уровень доступности, на который в этом случае можно надеяться, составляет 99,67%.
Рисунок 2. Европейские нормы и директивы для ЦОД. |
ИНФРАСТРУКТУРНАЯ СРЕДА ДЛЯ ВЫСОКИХ ТРЕБОВАНИЙ
Оснащение ЦОД в соответствии с Tier 3 и Tier 4 обеспечивает максимальную защиту от сбоев критически важных для деятельности предприятия приложений — таких как услуги на базе SAP, резервные решения или даже среды разработки. Гарантированный уровень безопасности, превышающий, согласно данным Uptime Institute, 99,98%, требуется предприятиям, для которых данные имеют высокую ценность и где работа приложений критически важна. В число таких предприятий входят поставщики услуг, круглосуточно востребованных внешними клиентами. При сбое одного из компьютеров резервное решение позволит сохранить доступность и работоспособность другим путем.
Системы ИТ используются для электронных деловых процессов. При проведении технических работ или в случае других событий, которые влекут за собой простой систем, это не оказывает влияния на качество предоставления услуг. В конфигурации Tier 3 используется два сервера, к каждому из которых ведут два маршрута. При обслуживании одного из серверов второй продолжает работу, а в качестве дополнительной меры обеспечения надежности он оснащен требуемыми подключениями в двойном исполнении.
Для компенсации сбоев электросети применяются различные решения. Если речь идет о нескольких секундах или минутах, для резервного электропитания можно использовать батареи или конденсатор, который накапливает электроэнергию и при необходимости отдает ее. Альтернативным вариантом может быть применение специального программного обеспечения для отключения серверов, защищаемых к ИБП. На случай отказа ИБП предусматривается альтернативный путь снабжения, наличие которого позволяет за короткое время восстановить работоспособное состояние техники (Mean Time to Repair, MTTR), поскольку влияния на работу систем не оказывается. Разные пути снабжения подключаются к потребителям посредством статичных трансферных переключателей, так что в любой момент можно переключиться с одного на другой для проведения технического обслуживания. Оснащение в соответствии с уровнем Tier 3 — наиболее распространенная форма обеспечения избыточности в коммерческих ЦОД.
Рисунок 3. Предварительный обзор первой части стандарта prEN 50600. |
ПРЕИМУЩЕСТВА ДИФФЕРЕНЦИРОВАННЫХ УРОВНЕЙ TIER В ЦОД
На многих предприятиях периодически принимаются стратегические решения о централизации ИТ, а через некоторое время они отменяются.
Как сообщает компания Databurg, она одной из первых стала предлагать своим клиентам, готовым мириться с меньшей доступностью своих систем, ЦОД с многоуровневой архитектурой, что позволяет сэкономить на оплате аутсорсинга. Такая мера повышает эффективность от эксплуатации ЦОД не только для заказчиков, но и для владельцев центра обработки данных, а кроме того, ценовое преимущество помогает удерживать постоянных клиентов. В этом случае не возникает конфликта между избыточностью и энергоэффективностью, поскольку инфраструктура адаптируется к требованиям заказчиков, которые знают, какой максимальной доступности следует ожидать от конкретных систем и приложений. В целом это положительно сказывается на вложениях в подходящую инфраструктуру и способствует сокращению потребления электроэнергии.
Рисунок 4. Предварительный обзор частей 2–5 стандарта prEN 50600. |
ДЛЯ ДИФФЕРЕНЦИРОВАННЫХ ЦОД НУЖНО ПЕРЕСТРАИВАТЬ МЫШЛЕНИЕ
Еще на этапе планирования необходимо определить для всех типов программного обеспечения и приложений, будь то Windows, Unix или Linux, какие системы и приложения следует наделить высокой степенью доступности, а какие могут обойтись и меньшей. В любом случае специалистам ИТ необходимо перестраивать свое мышление и отходить от концепции аутсорсинга, когда в одну стойку или один «блок» (Cage, Suite) помещается весь ландшафт ИТ. Опыт показывает, что благодаря квалифицированным консультациям и убедительной аргументации удается убедить руководство предприятия задуматься о возможности использования классифицированного и дифференцированного подхода к аутсорсингу ландшафта ИТ. Поставщики услуг помогают клиентам успешно провести процесс классификации их систем в соответствии со степенью чувствительности к сбоям и требуемым для них уровнем доступности. Еще на ранней стадии планирования представители заказчика вступают в диалог с менеджерами проектов провайдеров с целью конкретного анализа ландшафта ИТ и отнесения его элементов к соответствующему классу ЦОД.
На деле это означает, что в пределах ЦОД приложения со схожими требованиями могут в зависимости от них размещаться в зонах с инженерным обеспечением на уровне Tier 1 или Tier 3 и соответствующим образом избыточно оснащенной инфраструктурой. К примеру, сетевой узел для общеевропейского трафика данных располагается в секторе с поддержкой Tier 3 или Tier 4, а подключенный к нему сервер заказчика — в отдельном помещении. При необходимости выполняется разделение на отдельные блоки по Tier 1–3.
Клаус Коморовиц — технический директор компании Databurg.