В 2009 году из всего того, что в ИТ называют облаками, наибольшее внимание было уделено частным, или внутренним облакам, о чем свидетельствует то, что за последние месяцы несколько компаний вывели на рынок продукты, предназначенные для создания именно этого класса облаков, которые, строго говоря, облачной идее почти не соответствуют. Почему так произошло?

В чистом виде идея представления компьютерных ресурсов в виде облака далеко не нова. В 1961 году математик Джон Маккарти, один из отцов искусственного интеллекта, предположил, что когда-нибудь вычисления смогут быть организованы примерно так, как обычные коммунальные услуги (public utility). Это был первый случай применения слова utility в приложении к вычислениям. В 1997 году экономист Рамна Челлаппа со своей позиции назвал облачные вычисления (cloud computing) такой парадигмой, в которой границы между вычислительными ресурсами станут не столько техническими, сколько экономическими. На практике движение в сторону облаков началось в конце прошлого десятилетия, когда Марк Андриссен и Джим Кларк, создатели Netscape, образовали компанию с характерным названием Loudcloud («громкое облако»). Они первыми осознали перспективность оказания услуг по сети, но с материализацией своего замысла они явно поторопились, и спроса их услуги не получили, отчасти и по причине кризиса доткомов 2000 года. В итоге они оставили в стороне облачную идею, и Loudcloud была преобразована в «обычную» технологическую компанию Opsware, которую впоследствии купила HP. Но идея на этом не умерла, а время от времени всплывала в многочисленных рассуждениях вокруг autonomic, utility и других разновидностей компьютинга. Параллельно совершенствовались сервисные технологии. А далее события стали стремительно развиваться, и на границе 2002-2003 годов пришло осознание того, что наступило время серьезных перемен, а еще через два-три года заговорили о гигантских, глобальных облаках, которые могут вобрать в себя все мировые вычислительные мощности, что больше походило на фантастику. Еще через пару лет стало ясно – нужны разные типы облаков, а многообразное видение облачных вычислений получило отражение в классификации Национального института по стандартам и технологиям США (NIST), которая выделяет:

  • частные облака (private), обслуживающие одну организацию, которые поддерживаются ею самой или сторонней компанией и располагаются на территории организации или вне нее;
  • групповые облака (community), распределенные между несколькими организациями, объединенными общими интересами (по обслуживанию и расположению не отличаются от частных облаков);
  • общедоступные облака (public), предоставляемые организациям или частным лицам на базе инфраструктуры провайдера облаков;
  • гибридные облака, совмещающие перечисленные в любых сочетаниях.

Общим для всех четырех вариантов инфраструктур является способность предоставлять сервисы трех основных типов: программы (Software as a Service, SaaS), платформу (Platform as a Service, PaaS) и инфраструктуру (Infrastructure as a Service, IaaS). Все они предоставляются по запросу, объем предоставленных сервисов может быть измерен, а сами облака – это объединенные в общий динамический пул ресурсы. Важно подчеркнуть, что один из важнейших признаков облачного решения, независимо от того, на каком уровне оно реализовано, состоит в отсутствии необходимости для пользователя что-то знать об инфраструктуре и ее управлении.

В 2009 году продукты для создания частных облаков выпустили HP, Fujitsu, Sun Microsystems, Dell, IBM и ряд других производителей. Использование слова «облако» чаще всего является маркетинговым приемом, примерно таким же, как использование корпорацией Oracle слова «грид» вместо «кластер», – большинство динамических ЦОД облаками не являются. Дело в том, что среди предложений, рекомендованных производителями как технологии для частных облаков, подавляющая часть не соответствует уже упомянутому признаку. Аппаратура и программное обеспечение, установленные на территории предприятия, нуждаются в обслуживании и управлении точно так же, как обычные ЦОД, и они работают практически по той же экономической модели, что и обычные ЦОД.

Но эти технологии все же являются облачными, хотя и частично, а создаваемые с их помощью инфраструктуры представляют собой уже не неупорядоченный конгломерат устройств, а четкую иерархию из четырех пулов виртуализованных ресурсов: процессоров, памяти, систем хранения и межсоединений (рис. 1). На такой инфраструктуре могут выполняться любые приложения, она поддерживает доступ к ним с использованием произвольных типов терминалов – толстых и тонких, стационарных и мобильных.

Рис. 1. Четыре пула ресурсов частного облака

Три верхних уровня этой модели более или менее универсальны, они реализуются разными производителями с минимальными различиями, в них используются близкие по характеристикам или вообще одинаковые процессоры, память, диски. Что же касается межсоединений, то здесь общей является только структурная схема (рис. 2) – серверы, системы хранения данных и сети подключаются к интеллектуальным коммутаторам, а вот устройство этих коммутаторов может сильно различаться. Близость конкретного решения к определению NIST напрямую зависит от того, как устроены коммутирующие межсоединения.

Разнообразие в подходах к коммутаторам вызвано тем, что данные передаются из разных источников с использованием разных стандартов и технологий: IP, Fibre Channel, Ethernet, InfiniBand, Attachment Packet Interface (ATA/ATAPI), iSCSI, Fibre Channel over Ethernet (FcoE), Asynchronous transfer mode (ATM), Internet Wide Area RDMA Protocol (iWARP) over Ethernet, Converged Enhanced Ethernet (CEE) и Fibre Channel over Convergence Enhanced Ethernet (FcoCEE) и др. Обычно каждый производитель отдает предпочтение какому-то подмножеству из этого перечня и использует коммутаторы, уменьшающие количество кабельных соединений.

Все известные конструкции коммутаторов можно разделить на три типа: конвертирующие (Converged Fabric), динамические (Dynamic Fabric) и управляемые (Managed Fabric).

Конвертирующий коммутатор «самый умный», он совмещает в себе все необходимые для поддержания работы ЦОД функции. Такие коммутаторы проектируют компании Cisco и Egenera, а Dell и Fujitsu делают их по лицензии Egenera. Коммутатор этого типа принимает на входе данные в различных форматах и конвертирует их в один для передачи по сети. Этот формат является носителем для других, и вполне логично использовать в этом качестве Ethernet, так, как сделано в системе Cisco UCS, где пакеты данных в стандартах IP и Fiber Channel преобразуются в пакеты Ethernet. Аналогичным образом устроен коммутатор компании Egenera, но он имеет две разные верcии исполнения. В версии Dell PAN System в роли носителя, как и в UCS, используется Ethernet, а в собственных решениях Egenera BladeFrame и в семействе Fujitsu Primergy BladeFrame BF 200/400 роль протокола-носителя выполняет асинхронный ATM. И в продукте Cisco, и в продукте Egenera на стороне получателя данных требуется контроллер, который выполняет обратное преобразование данных (очевидная аналогия с модуляцией/демодуляцией). Достоинство такого решения в уменьшении кабельного хозяйства, снижении сложности и стоимости, а недостаток – в увеличении задержки, вызванной необходимостью упаковки и распаковки отправляемых и принимаемых пакетов.

Первый конвертирующий коммутатор создала Egenera, по-своему уникальная компания: ее взгляды на технологии во многом определяются тем, что ее основатель Верн Броуэлл пришел к идее создания отказоустойчивого кластера из объединенных в сеть серверов-лезвий, руководствуясь своим опытом работы в крупной финансовой компании. Нет ничего удивительного в том, что решение, предложенное Броуэллом, напоминает компьютер NonStop Himalaya, выпущенный в конце 90-х компанией Tandem и получивший широкое распространение в финансовой индустрии. Himalaya представляет собой набор вычислительных модулей, объединенных в сеть Systinet класса System Area Network (SAN). Отличие Egenera лишь в том, что вместо уникальных модулей Tamdem используются стандартные лезвия, а вместо сети ServerNet – собственная сеть Processing Area Network (PAN). Кластер, собранный на сети PAN, отличается встроенной высокой готовностью (N+1 Failover and Disaster Recovery).

Динамическая коммутация предполагает наличие нескольких «менее умных», но все же специализированных коммутаторов, по одному на каждый используемый прокол. Например, в системе HP BladeSystem Matrix их должно быть два (для Fibre Channel и для Ethernet), а в системе Primergy BX900 Dynamic Cube – четыре (два для Ethernet, один для Fibre Channel и еще один для InfiniBand). Этот тип коммутации назван динамическим потому, что в нем используется метод виртуализации N_Port ID Virtualization (NPIV). Технология NPIV виртуализует HBA и исключает необходимость подключения типа «точка-точка». В случае применения таких коммутаторов топология сети может изменяться динамически. Использование виртуальных портов уменьшает количество физических, но при этом каждый сервер должен иметь в своем составе все карты – и Ethernet, и Fibre Channel, а в случае необходимости – еще и InfiniBand.

Управляемой коммутацией сегодня занимается только компания Scalent, предлагая, по существу, ту же самую динамическую коммутацию, но допускающую использование обычных коммутаторов, и дополнительный сервер для управления ими и придания динамичности коммутирующей среде.

Как бы ни были современны эти подходы, ни один из них нельзя признать облачным: они не избавляют пользователя от необходимости знать инфраструктуру и уметь ее собирать. Иначе говоря, они позволяют создавать ЦОД с большей или иной динамикой, близкие к частным облакам, но никак не полноценные облака. В отчете Forrester Research «Преимущества облаков, расположенных внутри корпоративных стен» (Deliver Cloud Benefits Inside Your Walls) после доказательства преимущества частных облаков предлагается три способа их создания: построить самим, воспользоваться услугами системных интеграторов или подождать, когда крупные поставщики предложат свои решения. Наиболее близкой к идеалу облака может быть коммутация, построенная на основе InfiniBand, реализуемая сегодня двумя небольшими компаниями Intalio и A-Server. Оба их решения стали возможны с появлением технологии внутристоечной коммутации от компании Mellanox, известного производителя InfiniBand-оборудования.

До сих пор технология InfiniBand чаще всего ассоциировалась с высокопроизводительными вычислениями, например, 182 системы из последней редакции списка Top500 построены на Infiniband, а из 100, стоящих в верхней части, – 63 системы. Первенство пока принадлежит Gigabit Ethernet, на котором построено 258 кластеров, но следует учесть, что еще совсем недавно на InfiniBand приходилось всего несколько процентов из этого списка. По мнению экспертов, преимущества InfiniBand перед Gigabit Ethernet начинают проявляться, когда число узлов в кластере превышает 100.

Сегодня InfiniBand может претендовать на роль универсальной коммутирующей среды (Unified Fabric), которая позволяет до минимума сократить количество кабелей, не имеет существенных ограничений на число подключаемых серверов, обладает большой пропускной способностью и низкой задержкой и исключает потерю данных при передаче. InfiniBand позволяет ограничиться использованием одного коммутатора, обеспечить взаимодействие между процессами и обмен данными с системами хранения посредством протокола iSCSI Extensions for RDMA (iSER), более совершенного, чем обычная модель iSCSI, поскольку он предоставляет прямой доступ в память.

Эффективность InfiniBand в качестве межсоединения продемонстрировал кластер Exadata первого поколения. Замена им 128-ядерного сервера HP Superdome/Oracle 10g в одной из телекоммуникационных компаний повысила скорость межпроцессорного обмена в 20 раз. Хваля InfiniBand, следует учитывать, что любые утверждения о каких-то преимуществах одних стандартов над другими носят временный характер, область быстро развивается, разрабатываются новые версии, такие как Low-Latency Ethernet, IboE (InfiniBand over Ethernet) и др.

Преимуществами InfiniBand в приложении к частным облакам, как уже говорилось, воспользовались компании Intalio и A-Server. Первая выпустила законченную аппаратно-программную платформу Intalio|Cloud Appliance, комбинирующую технологии HP и Mellanox. Шаг, прямо скажем, для этой, никогда не выпускавшей собственную аппаратуру, компании неожиданный – прежде она специализировалась на продуктах для управления бизнесом, поставляемых в открытых кодах. Впрочем, для частной компании, одним из совладельцев которой является известный в мире Open Source Тим О'Рейли, вполне возможный.

Использование системы лезвий HP BladeSystem, твердотельных накопителей для работы со всеми базами данных и коммутатора для межсоединения по 40-гигабитной технологии Mellanox InfiniBand позволило Intalio упаковать в одну стойку всю аппаратуру и программное обеспечение, необходимые для создания облака. Физически эта стойка может быть установлена в ЦОД самого производителя или его локальных партнеров (Intalio|Cloud On-Demand) или же на площадке заказчика (Intalio|Cloud On-Premise), но в любом случае обслуживание и администрирование выполняется специалистами Intalio, а оплата производится помесячно. Здесь облачное условие соблюдается – пользователь действительно может не знать об инфраструктуре, а лишь обращаться к сервисам облака. В создании этого специализированного устройства (appliance) решающую роль сыграло сквозное использование технологии InfiniBand, позволяющей унифицировать сетевое решение, отказаться от Ethernet и Fibre Channel, заметно повысив производительность и снизив стоимость. Кроме того, обеспечивается хорошая масштабируемость и высокая надежность. В состав стандартной 19-дюймовой стойки входят: 16 вычислительных лезвий на процессорах Quad Core Intel Xeon X5570; 2,3 Тбайт оперативной памяти DDR3; 24,5 Тбайт на SSD; 560 Тбайт на обычных жестких дисках и коммутатор InfiniBand QDR Networking Fabric плюс вспомогательное оборудование. Из устройств Intalio|Cloud Appliance можно комплектовать облако произвольного размера, 22 стойки могут быть установлены в стандартный контейнер.

Еще более неожиданным оказался старт бельгийской компании A-Server, недавно удостоенной награды TechWorld 2009 Awards по категории Cloud/SaaS Service за продукт Datacenter-As-A-Service. Если сравнивать с Intalio, то общность решений обнаружится только в том, что обе компании для межсоединений используют коммутатор Infiniband Mеlanox, что делает DAAS в полном смысле облачным, но по всем остальным показателям деятельности они расходятся. Во-первых, A-Server сама не поставляет свои продукты, она обладает технологией проектирования, а ее клиентами являются главным образом компании-интеграторы, которые предоставляют услуги по созданию частных облаков, или же небольшие поставщики услуг. Во-вторых, технологической базой для DAAS служит продукция Sun Microsystems.

Решение DAAS («ЦОД по заказу») использует методику Virtual Private Datacenter, рассматривающую вычислительные ресурсы, ресурсы систем хранения и межсоединения как некий «сырой материал», из которого собирается облако с необходимыми свойствами. Используя графический интерфейс и соответствующее ПО, провайдер или интегратор создают диаграммы, отражающие их видение будущего облака, затем это описание транслируется в спецификации реального оборудования и ПО, по которым за считанные часы может быть собран физический ЦОД. Используя VPDC, можно не только проектировать и внедрять, но в последующем модернизировать и даже «архивировать». Последнее означает, что при необходимости можно сделать информационную архивную копию ЦОД, а когда возникнет необходимость, развернуть его снова.

***

Несложно предположить, что последующие годы будут богаты на обновления в области частных облаков, технологии которых постепенно выйдут на уровень зрелости. По оценкам аналитиков, уже к 2012 году по меньшей мере половина североамериканских компаний будет пользоваться сервисами частных облаков.

Четвертая эпоха ИТ 
В ИТ наступает время серьезных перемен, причем на всех уровнях, начиная с процессоров и кончая глобальными Web-приложениями, однако до сих пор нет концептуального видения прошлого, настоящего и будущего.