Джон Фостер из Sun Microsystems отвечает за продвижение grid-систем компании в странах юго-восточной части региона EMEA (Европа, Африка и Ближний Восток) и руководит рядом важных проектов, в том числе крупнейшей инсталляцией grid в нефтяной компании Aramco в Саудовской Аравии, вошедшей в рейтинг Top500. О подходах Sun к построению корпоративных grid-сред с ним побеседовала редактор журнала «Открытые системы» Наталья Дубова.
Термин grid ассоциируется, как правило, с глобальными сетями распределенных вычислений для научных целей. Что представляют собой технологии grid для корпоративных сред от Sun?
Есть глобальные исследовательские сети grid. Есть так называемые кампусные grid-среды, которые охватывают несколько отделов одной организации. В коммерческой области есть различные возможности реализовать grid-среду. Например, в компании Ford установлено 500 рабочих станций, каждая из которых имеет два процессора, один процессор выделен для инженерных работ, а другой для обслуживания grid-приложений. В течение дня инженеры дают задания, а когда вечером они уходят домой, то вычислительная работа продолжается.
Большинство реализаций grid, с которыми мне приходится работать, — это выделенные системы для определенного типа приложений, как правило кластеры. Многие коммерческие компании в моем регионе постепенно отказываются от систем архитектуры SMP и заменяют их такими кластерами, как правило, на базе х86-процессоров. Так, в одной нефтегазовой компании реализован кластер из 128 систем с быстрыми каналами связи между узлами. Инженер передает задание на мастер-систему, которая распределяет задание по кластеру. Для систем подобного рода Sun предоставляет целый ряд компонентов, начиная с аппаратных узлов на базе процессоров Opteron, которые, по нашему мнению, по производительности превосходят любые другие системы. С точки зрения программного обеспечения вклад Sun — это прежде всего система Grid Engine, в задачи которой входит составление графика исполнения работ в grid-среде и выделение для них доступных ресурсов. Базовый вариант Grid Engine является бесплатным продуктом, но у нас есть и расширенная, платная версия системы. Далее, важнейшим компонентом grid-среды является управляющий программный инструментарий. В системе с несколькими сотнями узлов управлять каждым в отдельности невозможно. Процессами их установки, модернизации, развертыванием нового программного обеспечения и заплат необходимо управлять централизованно. У нас есть большой опыт в области создания программных средств управления кластерами. Только что Sun анонсировала Control Station 2.2 для управления такими средами. Очень много высокопроизводительных кластеров работают сейчас под управлением ОС Linux.
А что побуждает пользователей выбирать именно grid-конфигурацию ИТ-инфраструктуры, а не какие-либо другие решения?
Если быть до конца честным, то, безусловно, большинство заказчиков в первую очередь интересует соотношение цена/производительность. Обычно в результате реализации grid они получают производительность системы в четыре раза большую по цене одной SMP-системы. При этом наличие множества узлов повышает доступность вычислительной среды. Важна также возможность использования готовых компонентов для построения таких сред. Заказчик тем самым получает гораздо большую свободу выбора, и, что очень существенно, реализовав такую среду, он сможет в будущем легко наращивать ее производительность. В SMP-системе всякая модернизация обходится дорого, а технологии неизбежно устаревают.
Вы руководили крупнейшим проектом реализации grid в компании Aramco в Саудовской Аравии. Какие задачи решал этот проект, в чем его особенности?
Aramco — уникальный клиент. Это крупнейшая нефтяная компания в мире, которой принадлежит множество месторождений. Они ведут активную разведку и накапливают огромные объемы данных. Aramco давно поняла преимущества grid-систем. Кластер, реализованный в этой компании, состоит из 7 подкластеров по 128 узлов каждый, работающих параллельно. Часть из них используются для моделирования нефтяных месторождений, часть — для обработки иных данных. В задаче моделирования необходим обмен трафиком очень большого объема между узлами, поэтому требуются самые совершенные соединения. В связи с этим не только в Aramco, но и в других компаниях на Ближнем Востоке в обработке данных сейсмической разведки для обмена данными используются в основном каналы Gigabit Ethernet, а в моделировании месторождений — стандарт Myrinet.
В проекте для Aramco была выполнена предварительная инсталляция и полная интеграция системы в Шотландии, в непосредственной близости от нашего собственного производства, после чего мы пригласили туда заказчика на первый запуск системы. Тем самым мы предоставили заказчику еще до поставки решений гарантии его работоспособности и смогли резко сократить сроки внедрения системы.
Самая большая проблема в этом проекте состояла в том, чтобы реализовать всю функциональность, связанную с управлением. В этом отношении компании обычно предъявляют очень строгие требования: сохранять исторические данные, обеспечивать оперативные отчеты по производительности и т.д. Сложность состоит в том, чтобы удовлетворить все эти разнородные требования, при этом реализовав удобную пользовательскую среду.
Раньше мы устанавливали на кластеры общедоступные версии Linux. Но целый ряд независимых разработчиков программного обеспечения сейчас сертифицирует свои продукты на соответствие определенным коммерческим дистрибутивам этой операционной системы, поэтому многие заказчики предпочитают приобретать коммерческие варианты Linux. Кроме того, как правило, мы используем продукты Oracle и намерены активно продвигать в таких проектах Solaris 10 для платформы x86.
Как Sun реализует подобные проекты — самостоятельно или с помощью локальных партнеров? Что вы можете сказать о состоянии дел в этой области в России?
На юго-востоке региона ЕМЕА, где я работаю, Sun реализует все эти проекты только через партнеров. В их задачи входит, например, интеграция с системой LSF, реализация сетевых соединений Myrinet, а также техническая поддержка первого уровня. Специалисты Sun осуществляют общее руководство проектом. Мы планируем добавить к нашему портфелю grid-решений продукты Infiniband, для которых будем также обеспечивать поддержку силами компании.
Насколько мне известно, в России существует большой интерес к grid-вычислениям. Хотя некоторые местные компании по-прежнему сильно связаны с SMP-архитектурами и им трудно переключиться на новые технологии. Думаю, российским компаниям еще предстоит оценить реальные преимущества, которые дают технологии grid.
Каков объем рынка grid-решений Sun в регионе ЕМЕА?
В портфеле продуктов для платформы x86 доля реализаций grid обычно составляет до 40%, что немало. Реализуется много grid-проектов как национального масштаба, так и на уровне коммерческих организаций. У меня, например, сейчас идет шесть довольно масштабных реализаций grid. Прежде усилия Sun были сосредоточены в основном на продвижении систем SMP, но в последние полтора года мы стали значительно активнее работать на рынке grid-решений. Это очень конкурентный рынок, иногда в определенных областях у заказчика есть достаточно своего собственного опыта, и тогда цена проекта опускается до цены аппаратных средств. Заказчик обычно оценивает со всех сторон техническое решение и пытается заплатить не больше его стоимости. Поэтому, чтобы победить на этом рынке, компания должна предложить более прогрессивное решение, что-то такое, чего нет у конкурентов. И это очень важно, потому что поощряет такие компании, как Sun, к новаторству, к проведению интенсивных научных исследований, конструкторских разработок. С другой стороны, при таком подходе и заказчики начинают рассматривать архитектуру в комплексе, а не просто аппаратные средства.
А что стимулировало активность Sun в данной области в последние полтора года?
Прежде всего требования заказчика. Раньше в Sun концентрировали все свое внимание на Solaris и процессорах SPARC, не воспринимая интересы и пожелания заказчиков так, как следовало. В Sun поняли: для того чтобы сохранить конкурентоспособность, необходимо анализировать требования заказчиков и ситуацию на рынке и оперативно на них реагировать. Поэтому мы стали поддерживать Linux и начали предлагать grid-решения. За последние полтора года Sun серьезно расширила свой портфель продуктов для grid.
Какие тенденции в развитии технологий корпоративных grid-сред Вы можете выделить?
Мы понимаем grid как совокупность x86-систем начального уровня. Я думаю, что развитие технологий grid в ближайшее время будет происходить прежде всего в области программного обеспечения. Нам предстоит перейти от предоставления серверных мощностей к предоставлению сервисов. Конечная цель состоит в том, чтобы заказчик не видел всей сложности аппаратной конфигурации центра данных, а получал те сервисы, которые реализованы на базе этой конфигурации. Достичь этого можно только посредством программного обеспечения, которое реализует распределение заданий, виртуализацию ресурсов, вывод информации о сервисах, динамическое выделение ресурсов в виртуальном пуле в зависимости от требований работающих приложений. В 2005 году Sun выпустит средства управления нового поколения для разнородной среды. Появление контейнеров в Solaris 10 — это первый этап реализации такой технологии; она будет развиваться в направлении создания единой операционной системы для центра данных.
В области аппаратных средств наиболее интересным событием станет появление нового поколения «лезвийных» серверов. Сейчас об этих системах много разговоров на рынке: заказчики проявляют к ним интерес, компании предлагают свои решения. Но все это «лезвия» первого поколения. Я думаю, где-то к середине 2006 года мы будем наблюдать очень интересные перемены в этой области, когда появятся многоядерные, многопоточные «лезвийные» серверы с возможностью взаимозаменяемости компонентов от разных производителей. Если, например, в двухъядерном процессоре на одном ядре можно будет запускать два потока, то кластер на 128 узлов сократится по физическому размеру наполовину. А когда мы придем к четырех-, восьмиядерным процессорам с поддержкой 16, 32 потоков, типичный центр данных можно будет реализовать фактически на программном уровне, взяв в качестве аппаратной базы несколько «лезвий» высокой плотности.
Могут ли, по вашему мнению, появиться в перспективе глобальные промышленные grid-сети, аналогичные научным?
Это не утопия, но есть несколько серьезных проблем, мешающих реализации такой среды. Не последние из них — проблема безопасности данных, а также наличие доступной полосы пропускания. Если вернуться лет на восемь назад, то тогда мы работали в архитектуре «клиент-сервер», все процессоры использовались локально, потому что крупные центры данных были дорогими, а полоса пропускания слишком узкая. Теперь маятник качнулся в обратном направлении, мы все, что угодно, пытаемся перенести в центр данных. Полоса пропускания становится достаточно широкой, появляется возможность использовать тонких клиентов даже в домашних условиях. В конце концов мы придем к тому, что в распределенной кластерной среде с высокопроизводительными процессорами каждый узел будет обрабатывать свой массив данных, но при этом он должен сверяться с другими узлами, чтобы обеспечить непротиворечивость данных. А для этого необходима очень большая полоса пропускания, типа Myrinet. Без этого невозможна реализация глобальной grid-среды. В США у нас был один проект, в ходе которого был построен огромный кластер для поддержки ряда приложений, и затем заказчик через Web-сайт определял, какое приложение ему нужно, сколько процессоров, и передавал данные на обработку. При этом он должен был заплатить 1 долл. на процессор в час. Если в стране есть хорошая сетевая инфраструктура, то мы можем предоставлять даже такой тип услуг. Рано или поздно большинство наших заказчиков будут не покупать grid-системы, а пользоваться ими и платить за использование. Поэтому, кстати, в создаваемых сейчас операционных системах центра данных крайне важно обеспечивать учетные функции, чтобы каждый пользователь получал счет за предоставленные ему ресурсы.
Какие типы коммерческих приложений являются основными кандидатами на применение в grid-среде?
В нефтегазовой отрасли приложения компаний Landmark, Schlumberger и другие уже используются в grid-среде. В фармацевтике, где ведется моделирование перспективных лекарств, есть целый ряд приложений, готовых к переходу в grid. Начинают использовать grid финансовые институты. Хороший кандидат — САПР, некоторый интерес к этим технологиям заметен в телекоммуникационной отрасли. Вообще, если у вас есть приложения с пакетной обработкой, то вам будет легко перенести их в grid-среду.
Grid в поисках нефти
компания Adco, расположенная в Абу-Даби, использует вычислительный grid на платформе Linux для приложений гидродинамического моделирования, которые применяются в геофизике для выбора оптимальной точки бурения. Adco контролирует половину нефтедобычи Объединенных Арабских Эмиратов. Такой большой объем добычи порождает и большой объем информации, что, в свою очередь, предъявляет дополнительные требования к процессорным мощностям.
Традиционно геофизические приложения в Adco работали на серверах SMP-архитектуры , а также на рабочих станциях на платформе Unix. Основным критерием выбора новой системы было трехкратное ускорение обработки данных для моделирования. Кроме того, компания хотела снизить издержки на лицензирование за счет использования программного обеспечения с открытым кодом, а также получить систему на базе стандартных компонентов, которые можно приобрести у различных вендоров.
Предложенная Sun система состоит из 32 вычислительных узлов в одной стойке; узлы работают под управлением ОС Red Hat Linux 7.2. Вычислительными узлами являются двухпроцессорные системы Sun Fire V60x с процессором Xeon/3,06 ГГц, 4 Гбайт памяти и жестким диском на 36 Гбайт. В качестве управляющих узлов используются серверы Sun Fire V65x с процессором Xeon/3,06 ГГц и тремя дисками в RAID-конфигурации. Для создания сети данных используются коммутатор и сетевые соединения Myrinet компании Myricom. В качестве файлового сервера для сети хранения в конфигурацию добавлены Sun Fire V440 на платформе SPARC/Solaris. Полученная система показала производительность в 551 GFLOPS на тесте Linpack и значительно ускорила общее время обработки данных. Как результат, сократились затраты времени на процесс добычи в целом. В дальнейшем Adco планирует перейти на 64-разрядную платформу AMD Opteron под управлением ОС Solaris x86.
По данным российского представительства Sun, в нефтегазовой отрасли нашей страны в настоящее время ведется сразу несколько проектов по реализации grid-систем на 10-12 узлов. Один из заказчиков — ОАО «Хантымансийскгеофизика», где развертывается кластер из 12 узлов для выполнения геофизической программной системы CGG.