В третий раз подряд Frontier занимает первую строчку в списке самых быстрых суперкомпьютеров на планете, оставаясь единственным его представителем, чья максимальная скорость превышает один эксафлопс.
Согласно рейтингу TOP500, публикуемому дважды в год, обладающий производительностью в 1,194 квинтиллиона операций с плавающей запятой в секунду (floating point operations per second, FLOPS) суперкомпьютер Frontier сумел сохранить свои позиции, более чем в два раза опередив своего ближайшего конкурента. Один квинтиллион равен 1018 или одному эксафлопсу (EFLOPS).
На втором месте находится система Fugaku с производительностью в 442,01 петафлопс. Один PFLOPS – это 1015 FLOPS.
За время, прошедшее с момента публикации предыдущего рейтинга в ноябре 2022 года, два суперкомпьютера из первой десятки сумели улучшить свои результаты. Однако этого оказалось недостаточно для того, чтобы приблизиться к двум лидерам. Эти двое – LUMI и Leonardo – заняли третье и четвертое места.
Десятка самых быстрых суперкомпьютеров в мире представлена теми же моделями, что и в прошлый раз, расположившимися с том же порядке.
Измерение скорости производилось при выполнении эталонного теста High Performance Linpack (HPL), оценивающего, насколько хорошо система решает систему линейных уравнений с плотной матрицей.
Половина из десяти самых быстрых суперкомпьютеров развернута в США, два находятся в Китае и по одному в Финляндии, Италии и Японии.
Помимо лидерства в скорости Frontier занял первое место и в части пригодности с выполнению функций искусственного интеллекта по классификации HPL-MxP.
Frontier и LUMI попали также в первую десятку по критерию эффективности энергопотребления, измеряемой в гигафлопсах в пересчете на ватт. Frontier занял шестое место с результатом 52,592 GFLOPS/Вт, а LUMI – седьмое (51,382 GFLOPS/Вт).
Наибольшую эффективность энергопотребления продемонстрировала система Henri, развернутая в Flatiron Institute в Нью-Йорке (65,396 GFLOPS/Вт).
Полностью первая десятка рейтинга TOP500 в июне 2023 года выглядит следующим образом.
1. Frontier
Система HPE Cray EX находится в распоряжении министерства энергетики США. Она оснащена процессорами AMD EPYC третьего поколения (которые насчитывают в общей сложности 8 730 112 ядер, оптимизированных для высокопроизводительных вычислений), ускорителями искусственного интеллекта AMD Instinct 250X и межсоединениями Slingshot-11. В тесте HPL Frontier продемонстрировал производительность в 1,194 EFLOPS.
2. Fugaku
Суперкомпьютер Fugaku, размещенный в вычислительном центре RIKEN в японском городе Кобе, в тесте HPL достиг скорости в 442,01 PFLOPS. Он создан на базе микропроцессора Fujitsu A64FX и имеет 7 630 848 ядер.
3. LUMI
Еще одна система HPE Cray EX с производительностью в 309,1 PFLOPS находится в центре CSC в финском Каяани. Она построена на основе процессоров AMD и насчитывает 2 220 288 ядер.
4. Leonardo
Система, в которой используются компоненты Intel и Nvidia, развернута в итальянском городе Болонья. Ее 1 463 616 ядер обеспечивают производительность на уровне 238,7 PFLOPS.
5. Summit
Система IBM размещена в Национальной лаборатории в Окридже (США). Ее скорость в тесте HPL достигает 148,6 PFLOPS. Модель имеет 4356 узлов, в каждом из которых установлены два 22-ядерных процессора Power9 и шесть графических процессоров Nvidia Tesla V100 с 80 потоковыми мультипроцессорами. Узлы соединены сетью Mellanox dual-rail EDR InfiniBand. В общей сложности в компьютере насчитывается 2 414 592 ядра.
6. Sierra
Имея ту же архитектуру, что и Summit, Sierra развивает производительность в 94,64 PFLOPS. В суперкомпьютере установлено 4320 узлов с двумя процессорами Power9 и четырьмя графическими процессорами Nvidia Tesla V100, объединяющих в общей сложности 1 572 480 ядер. Развернута система в Национальной лаборатории имени Лоуренса в Ливерморе.
7. Sunway TaihuLight
Эта машина разработана в китайском центре National Research Center of Parallel Computer Engineering & Technology (NRCPC) и находится в городе Уси. Производительность суперкомпьютера с 10 649 600 ядрами в тесте HPL составляет 93,01 PFLOPS.
8. Perlmutter
Гетерогенная система с процессорами AMD EPYC и 1536 ускорителями Nvidia A100 создана на базе платформы HPE Cray Shasta и насчитывает 761 856 ядер. Производительность в результате модернизации с прошлогодних 60 PFLOPS выросла до 70,87 PFLOPS, однако этого все еще недостаточно для того, чтобы догнать Sunway TaihuLight.
9. Selene
Узлы Nvidia DGX A100 SuperPOD, объединяющие процессоры AMD EPYC и ускорители Nvidia A100, связаны здесь сетью Mellanox HDR InfiniBand. Суперкомпьютер, насчитывающий 555 520 ядер и развивающий производительность в 63,46 PFLOPS, развернут в вычислительном центре Nvidia в США.
10. Tianhe-2A (Milky Way-2A)
Оснащенный процессорами Intel Xeon и ускорителями NUDT Matrix-2000 суперкомпьютер Tianhe-2A имеет 4 981 760 ядер и развивает производительность в 61,44 PFLOPS. Он был разработан в Национальном университете оборонных технологий Китая (National University of Defense Technology, NUDT) и развернут в Национальном суперкомпьютерном центре в Гуанчжоу.