Среди производителей ведется напряженное состязание за создание мощных суперкомпьютеров, позволяющих решать важнейшие мировые проблемы, в том числе изучать изменение климата, управлять плазменными реакторами и разрабатывать биотопливо из сорняковСреди производителей крупных вычислительных систем ведется своего рода состязание за создание самого мощного суперкомпьютера, позволяющего решать важнейшие мировые проблемы, в том числе изучать изменение климата, управлять плазменными реакторами, температура в которых достигает 150 млн °C, и разрабатывать биотопливо из сорняков, а не из зерновых культур.

Суперкомпьютеры позволяют исследователям создавать трехмерные визуализации для бесконечных сценариев по типу «что, если» (отчасти это напоминает компьютерные игры) с высочайшим уровнем детализации. Но какими бы мощными ни были современные суперкомпьютеры, их быстродействия все еще недостаточно. Это стало предметом обсуждения для примерно 11 тыс. специалистов, собравшихся в середине ноября в Портленде (Орегон) на 22-ю ежегодную конференцию по суперкомпьютерам SC09. Приоритетная задача на сегодня — создание экзафлопного компьютера (один экзафлоп равняется 1018 плавающих операций в секунду. — Прим. ред.).

Сейчас до такого уровня еще далеко. Jaguar, самая мощная в мире система, установленная в Национальной лаборатории в Окридже, обладает проектной пиковой производительностью 2,3 PFLOPS. Система, собранная на платформе Cray XT5, работает на базе 224 256 ядер в шестиядерных процессорах AMD Opteron.

Однако рекорд Jaguar, безусловно, продержится недолго. Как заметил Бадди Блэнд, директор проекта в Окридже, Министерство энергетики США уже начало проводить рабочие встречи по созданию в тысячу раз более мощного суперкомпьютера. Система с производительностью экзафлопного уровня потребуется для создания климатических моделей с высоким разрешением, разработки биоэнергетических продуктов и поддержки интеллектуальной grid-сети, а также для проектирования термоядерных реакторов (такой проект сейчас ведется, например, во Франции — это Международный экспериментальный термоядерный реактор).

Какими бы поразительными ни казались суперкомпьютерные системы, они остаются — на своем уровне — примитивными. Существующие сейчас архитектуры требуют слишком много энергии, места и денег. Барьер в 1 TFLOPS впервые преодолела система ASCI Red из Национальной лаборатории в Сандии в 1997 году. В 2008 году IBM Roadrunner в Национальной лаборатории в Лос-Аламосе достиг скорости 1 PFLOPS.

По словам Блэнда, Министерство энергетики США, которое финансировало создание многих выдающихся вычислительных систем, хотело бы иметь в своем распоряжении пару машин с производительностью около 10 PFLOPS.

Следующий этап — это система, способная выполнять в тысячу раз больше вычислительных операций по сравнению с существующими сейчас.

По всей вероятности, такие машины появятся примерно в 2018 году, если исходить из того, что выход на новый рубеж производительности происходит каждые десять лет или около того. Такую периодичность в определенном смысле объясняет закон Мура, согласно которому число транзисторов на микросхеме удваивается примерно каждые полтора года. Однако проблемы, которые возникнут в связи с созданием систем экзафлопного уровня, выходят за рамки этого закона.

Энергопотребление Jaguar составляет 7 МВт. Как заметил вице-президент IBM Дейв Турек, экзафлопная система может потребовать мощности 2 ГВт. «Это мощность средней по размеру атомной электростанции», — заявил он.

Создатели суперкомпьютеров активно ищут пути сократить энергопотребление. Один из возможных подходов состоит в том, чтобы использовать гибридные подходы, которые сочетают сопроцессоры-ускорители с центральными процессорами.

Когда был анонсирован Roadrunner, потребляющий мощность 3,9 МВт, он имел производительность всего 1 PFLOPS. В нем используется гибридная архитектура, которая объединяет процессоры AMD с процессорами Cell, имеющими девять отдельных процессорных ядер, в том числе одно ядро PowerPC и восемь меньших сопроцессорных модулей, так называемых синергетических процессорных элементов. Применение ускорителей, включающих в себя процессоры графических операций и программируемые логические матрицы, должно помочь снизить энергопотребление за счет переноса определенной работы с центральных процессоров на устройства, способные эффективно решать более специализированные задачи.

Предполагается, что экзафлопные системы будут содержать от 10 млн до 100 млн ядер.

«Производительность в экзафлоп потребует 100 млн ядер, и, по-видимому, не существует никакого другого реального способа достичь этого, — заметил Турек. — Чтобы построить столь мощную машину, исследователи ищут оптимальную архитектуру. Но если наиболее перспективной идеей будет признана ‘гибридизация’, то каким должно быть соотношение между ядрами специального назначения и традиционными ядрами»?

Подобные системы должны будут использовать меньше оперативной памяти в расчете на ядро и потребуют больше пропускной способности при доступе к памяти. В системах со 100 млн ядер где-то постоянно будут возникать сбои, поэтому, считает Турек, необходимо найти абсолютно новый подход к созданию инструментов, которые позволят справляться с такой ситуацией.

Цель, которую ставят в IBM при разработке экзафлопных архитектур, состоит в том, чтобы ограничить энергопотребление 20 МВт, а размер системы — 70-80 стойками. Jaguar целиком состоит из центральных процессоров, но Блэнд, уверенный, что будущее — за гибридными системами, указывает на тот факт, что и Intel, и AMD разрабатывают архитектуры, которые сочетают центральные процессоры с сопроцессорами.

Эддисон Снелл, директор исследовательской компании InterSect Research, специализирующейся в области суперкомпьютерных вычислений, считает, что ускорители способны предоставить огромную вычислительную мощность для конкретных приложений, в силу чего первыми достигнут экзафлопного уровня системы, созданные специально для определенных применений. «В конечном итоге появятся системы общего назначения с производительностью такого уровня, но сначала будут созданы специализированные компьютеры», — заметил он.

Прежде чем появятся такие системы, ряды петафлопных суперкомпьютеров с производительностью уровня петафлопа будут шириться, и, по-видимому, будет расти число финансируемых правительствами проектов. Fujitsu планирует в 2011 году построить компьютер с производительностью 10 PFLOPS для японского Института физико-химических исследований, а Китай уже располагает петафлопным компьютером. Целый ряд стран все активнее финансирует разработку крупных систем, готовясь к международной гонке по созданию компьютеров нового поколения, способных решать наиболее сложные и актуальные мировые проблемы.


Дмитрий Медведев познакомился с «Ломоносовым»

В ходе прошедшего 25 ноября в Московском государственном университете очередного заседания Комиссии по модернизации и технологическому развитию экономики России президенту Дмитрию Медведеву продемонстрировали новый суперкомпьютер «Ломоносов». В свежем рейтинге суперкомпьютеров мира Top 500 система с пиковой производительностью 420 TFLOPS заняла двенадцатое место. Суперкомпьютер построен компанией «Т-Платформы».

Реальная производительность «Ломоносова», по данным рейтинга, самой мощной не только в России, но и во всей Восточной Европе вычислительной системы, составляет 350 TFLOPS (83% пиковой), а общее количество трех типов его вычислительных узлов — 4446. Основные вычислительные узлы гибридного суперкомпьютера — основанные на процессорах Intel Xeon X5570 лезвия T-Blade2; кроме того, используются узлы T-Blade 1.1, а также узлы на базе процессора IBM PowerXCell 8i. Суперкомпьютер работает под управлением программного пакета Clustrx T-Platforms Edition. В качестве межсоединения узлов используется QDR Infiniband QDR.

Объем оперативной памяти «Ломоносова» — 55 Тбайт, суммарная емкость внутренних жестких дисков — 166 Тбайт, а всей системы хранения данных — 350 Тбайт. Занимаемая суперкомпьютером площадь — 252 кв. м, а энергопотребление — 1,5 МВт.

В новой версии рейтинга Top 500 два представителя России. Компанию «Ломоносову» в нем составила система МВС-100К, принадлежащая Межведомственному суперкомпьютерному центру Российской академии наук. В ноябре в результате модернизации эта машина поднялась на 38-е место (в июне она занимала 54-е место).

«Ломоносов» — не первый суперкомпьютер мирового уровня, установленный в МГУ. До развертывания новой машины самой мощной вычислительной системой здесь был развернутый в рамках программы СКИФ суперкомпьютер «Чебышев».