Вопрос вполне естественный, ведь прежде, за все то время что существует рейтинг Top500, у России не было систем подобного уровня. Отсюда и сомнения как в их необходимости, так и в том, что достигнутый успех окажется не единичным.
За год всех скептиков не переубедишь – не факт, что такое в принципе возможно. Поэтому, подводя итоги, едва ли уместно говорить о том, что абсолютно все сомнения благополучно развеяны. Тем не менее в целом итоги эти в большей степени позитивны, и перспективы российской HPC-отрасли, как минимум на ближайшее будущее, просматриваются неплохие.
В этом году в июньском и ноябрьском вариантах Top500 оказалось по 11 систем, установленных в России. Больше не было никогда. Австрия и Новая Зеландия, с которыми еще год назад приходилось делить седьмую позицию в "национальном зачете", остались позади. Впереди с большим отрывом – США (274 системы в ноябрьском списке), за ними – Китай, увеличивший за год свое представительство в Top500 почти вдвое (в ноябре 2009-го было 21, стало 41, причем впервые китайский суперкомпьютер возглавил рейтинг), далее – Франция, Германия и Япония (по 26), а также Великобритания (25).
Среди российских систем в Top500, что были установлены в 2010 году (их шесть), продукция отечественных разработчиков отсутствует. Пять из этих машин представляют собой кластеры IBM на основе четырехъядерных процессоров Intel Xeon (среди китайских систем 2010 года, кстати, таких 26). Как тут не вспомнить небезызвестного Дэйва Турека, вице-президента IBM из подразделения Deep Computing, и его тезис, высказанный без малого три года назад. Турек тогда заявил, что в России нет HPC-индустрии, а есть только интерес к приобретению и использованию суперкомпьютерных технологий.
Надо сказать, и на тот момент подобное заявление выглядело далеко не бесспорным. Еще в 2007 году в осеннем списке Top50 самых мощных суперкомпьютеров России и СНГ 14 позиций принадлежали системам компании "Т-Платформы", а весной 2008-го этот список возглавил суперкомпьютер семейства СКИФ, установленный в МГУ. Но сегодня ситуация такова, что и с высоты положения IBM (200 систем в текущем варианте Top500) не замечать конкуренции на постсоветском пространстве со стороны российских разработчиков было бы изрядным лукавством.
Список Top50 в его нынешней версии по-прежнему возглавляет установленный год назад в МГУ суперкомпьютер «Ломоносов» разработки "Т-Платформ". В мировом рейтинге Top500 за год он потерял пять позиций и занимает теперь 17-е место. К концу декабря должны быть завершены работы по расширению этой системы, в результате чего ее пиковая производительность вырастет с 414 до 510 TFLOPS. В 2011 году, как было объявлено в конце ноября, будет введена в строй вторая очередь системы. Благодаря ей суммарная пиковая производительность этого вычислительного комплекса должна достичь 1,3 PFLOPS.
Вторая очередь суперкомпьютера будет выполнена на базе разработанных в «Т-Платформах» гибридных лезвий TB2-TL – с двумя четырехъядерными процессорами Intel Xeon серии 5600 и двумя графическими процессорами nVidia Tesla X2070/1,15 ГГц в каждом вычислительном узле. С первой очередью новая система будет соединена при помощи стандартного интерфейса InfiniBand.
Дальнейшие планы «Т-Платформ» включают, в частности, сотрудничество с МГУ по созданию суперкомпьютеров с экзафлопсной производительностью (появление таких систем прогнозируется в районе 2018 года), и с университетом Гейдельберга (Германия) – в разработке и выводе на рынок перспективной коммуникационной технологии EXTOLL. По словам главного системного архитектора «Т-Платформ» Андрея Слепухина, технология эта на данный момент реализована в виде FPGA-прототипов и уже близка по характеристикам к интерфейсам InfiniBand и Gemini (используется в системах Cray XE6, самая мощная из которых находится на пятом месте в текущем Top500), а по некоторым показателям и превосходит их. К моменту же выхода контроллеров EXTOLL на рынок в четвертом квартале 2011 года, как ожидается, их характеристики должны быть существенно улучшены.
Согласно текущей редакции Top500, в мире сейчас насчитывается всего пять систем с пиковой производительностью выше 1,3 PFLOPS. Поэтому существует вероятность, что на момент публикации следующей версии «Ломоносов» окажется в первой десятке рейтинга. По мнению руководителя центра компьютерного моделирования и декана факультета вычислительной математики и кибернетики Нижегородского государственного университета Виктора Гергеля, появление столь мощного суперкомпьютера отечественной разработки, безусловно, знаковое событие.
«Можно, конечно, говорить о пиаре или о политическом деле, но в то же время нужно смотреть и на то, что происходит в мире в этой области. Мы видим закономерность: в современном мире ведущие страны становятся таковыми во многом благодаря суперкомпьютерным технологиям, и отрадно, что понимание этого на государственном уровне появилось и у нас», – отметил он.
Помимо системы "Ломоносов", с прошлого года говорится о создании системы аналогичной производительности в федеральном ядерном центре в Сарове, на что было выделено 2,5 млрд руб. Технология, позволяющая строить HPC-системы такого уровня, разработана и в рамках завершающейся в этом году российско-белорусской программы "СКИФ-Грид».
"Реализована эта технология в суперкомпьютерной платформе 'СКИФ-Аврора', нацеленной на создание машин именно с петафлопсным уровнем производительности. Однако, к сожалению, заказов на такие системы пока нет», – отметил научный руководитель проектов СКИФ от России, директор Института программных систем РАН Сергей Абрамов.
К началу октября в ИПС РАН были завершены работы по подготовке к запуску проекта Национальной суперкомпьютерной технологической платформы (НСТП) – инициативы, в частности предусматривающей разработку «стратегической программы исследований в области построения и использования суперкомпьютеров", а также "создание перспективного видения суперкомпьютерной отрасли на долгосрочную перспективу". К инициативе присоединились свыше 120 различных организаций, в том числе производители компьютерных систем ("Аквариус", РСК СКИФ, "Крафтвэй» и др.) и ряд крупных заказчиков.
"Суперкомпьютерная отрасль не может существовать сама по себе, вся логика ее развития должна исходить из потребностей пользователей в решении тех или иных задач. При этом может возникать и потребность в рекордах, но не ради самих рекордов, а чтобы удовлетворить конкретный запрос от реальной экономики", – подчеркнул Абрамов.
Применительно к «Ломоносову» вопросы, связанные с удовлетворением конкретных потребностей, нуждаются в прояснении. Использование этой системы в МГУ не столь прозрачно, как в случае с ее предшественницей в роли самого мощного российского суперкомпьютера – системой СКИФ МГУ ("Чебышев"). Для последней, судя по имеющимся данным, вполне типичной является ситуация одновременной загрузки несколькими десятками, а то и сотнями задач. Поневоле возникнет вопрос: для того ли нужны столь мощные системы, чтобы одновременно прогонять большое количество задач, каждой из которых на самом деле требуются существенно меньшие ресурсы?
В отношении «Ломоносова» известно, что суперкомпьютер использовали для решения задач, задействующих 10-12 тыс. процессорных ядер (всего в первоначальном варианте системы их более 35 тыс.). А ведь уже на подходе та самая вторая очередь – в новой системе в каждом шасси высотой 7U, установленном в стандартную 19-дюймовую серверную стойку, суммарное количество ядер архитектуры CUDA в графических процессорах nVidia Tesla X2070, согласно спецификациям "Т-Платформ", превышает 14 тыс. (Всего же в проекте второй очереди системы для размещения вычислительного оборудования предполагается использовать восемь серверных стоек формфактора 42U.)
Между тем было бы неверно утверждать, что задач для петафлопсных суперкомпьютеров в принципе не существует. Специалисты НПО «Сатурн» приводили такой пример – многокритериальная оптимизация авиационного двигателя для нестационарного режима работы потребовала бы от подобной системы семи лет вычислений. Как раз хватило бы, чтобы занять «Ломоносова» в его обновленном варианте следующего года, пока не появятся системы с производительностью в 1000 раз выше, то есть экзафлопсные!
Другое дело, что программные инструменты, имеющиеся в настоящее время на руках у заказчиков, как правило, рассчитаны на значительно меньшее количество процессорных ядер, чем то, которым располагают современные суперсистемы топ-уровня. Но ведь без появления у заказчиков таких систем прикладные программы, задействующие все их возможности, вряд ли вообще будут созданы. Поэтому трудно не согласиться с практиками, отмечающими, что по мере наращивания вычислительных ресурсов в их организациях растут и умение ими пользоваться, и сложность задач, решаемых с их помощью. К примеру, как показал опыт использования в ННГУ кластера с пиковой производительностью 2,7 TFLOPS (десятое место в списке Top50 по России и СНГ в сентябре 2007 года), десятикратного прироста мощности еле-еле хватило на три года. В данный момент, по словам Гергеля, университет испытывает острую нехватку вычислительных ресурсов и рассматривает возможности приобретения новой системы с производительностью порядка 500 TFLOPS.
По мнению Гергеля, текущие потребности России в HPC-технологиях уровня Top500 могли бы обеспечить три-четыре суперкомпьютерных центра петафлопсного класса и 20-30 систем с производительностью 100-400 TFLOPS. Согласно текущему списку Top50, в стране имеется три системы с пиковой производительностью выше 100 TFLOPS. При этом суммарная пиковая производительность десяти лучших систем едва переваливает за 1 PFLOPS. В такой ситуации установка дополнительных 10 PFLOPS вычислительных мощностей в стране едва ли позволит обойти вниманием вопрос об энергопотреблении этих систем и эффективности использования потребляемой электроэнергии.
Энергоэффективностью системы уровня Top500, установленные в России, пока особо не блещут. Лучшая из них по этому показателю занимает 78-е место в списке Green500, «Ломоносов» – 94-е. Правда, с вводом в строй второй очереди системы ситуация может несколько улучшиться – энергопотребление всего комплекса при максимальной нагрузке, по предварительным оценкам специалистов «Т-Платформ", должно составлять 2,8 МВт. При такой величине потребляемой мощности в предположении, что система сохраняет первоначальный уровень вычислительной эффективности (примерно 84,5%), в текущем варианте Green500 "Ломоносов» оказался бы в конце второго десятка, опережая 12 из 16 систем, которым он уступает по производительности.
Масштабный контракт с МГУ позволил «Т-Платформам» существенно укрепить свое положение на рынке. Как недавно заявил коммерческий директор «Т-Платформ» Михаил Кожевников, свою долю на рынке суперкомпьютеров СНГ в денежном выражении компания сейчас оценивает в 85%. Впрочем, если говорить только о России, то с подобным суждением безоговорочно согласятся не все. По оценке IDC, трио лидеров на российском рынке HPC-систем вместе с «T-Платформами» составляют HP и IBM.
«Вычислительный кластер МГУ, о сдаче которого в эксплуатацию было объявлено в конце прошлого года, обошелся заказчикам более чем в 50 млн долл. только в своей серверной составляющей, поэтому можно говорить о том, что на протяжении определенного времени доля «Т-Платформ» действительно была очень значительной. Однако, если учитывать сроки реализации крупных проектов в этой отрасли, необходимо усреднять показатели, по крайней мере за 15-20 месяцев. И тогда можно будет заключить, что доля каждой из лидирующих на рынке компаний не превышает 30%», – сказал ведущий аналитик IDC по рынкам серверов и систем хранения данных Александр Загнетко.
По данным IDC, в 2010 году объем российского рынка HPC-систем можно оценить в 150 млн долл. При этом Загнетко уточнил, что под HPC сейчас, как правило, подразумевают системы с производительностью более 2 TFLOPS (нижняя граница текущего списка Top50 по России и СНГ чуть выше). Он также подчеркнул, что проекты по созданию суперкомпьютеров в нашей стране, как правило, абсолютно непрозрачны, и реальные расходы зачастую практически невозможно подсчитать. Объем мирового рынка HPC в 2010 году, по прогнозам, должен превысить 10 млрд долл.
Перспективы российского рынка HPC-систем в IDC оценивают как неплохие. Однако Загнетко счел необходимым сделать несколько существенных замечаний. По его мнению, российская суперкомпьютерная отрасль сильно отстает от развитых стран, и это отставание существенно сократить пока не удается. Кроме того, эффективность (в первую очередь экономическая) использования уже установленных решений оставляет желать лучшего.
«Катастрофическая ситуация, которая сложилась у нас в таких ключевых областях, как НИОКР, наукоемкие производства, фундаментальные и прикладные исследования, мягко говоря, не способствует быстрому развитию HPC как реально работающего инструмента в среднесрочной перспективе», – заключил аналитик.
Тем не менее в IDC ожидают, что в ближайшие несколько лет российский рынок HPC-систем будет ежегодно увеличиваться на 40-45%. Прогнозы роста мирового рынка, кстати, заметно скромнее. Само по себе это, конечно, не повод для шапкозакидательских настроений, но все же дает основания надеяться, что обнаружившиеся у нас в последнее время достижения по части суперкомпьютерных технологий получат дальнейшее развитие.