Суперкомпьютер Frontier занимает первое место в рейтинге TOP500 в четвертый раз подряд, оставаясь единственной машиной эксамасштаба в списке самых мощных компьютерных систем мира. Второе место на сей раз досталось новичку Aurora. Когда этот суперкомпьютер будет построен полностью, он, как ожидается, превзойдет Frontier.
Система Frontier, развернутая в Национальной лаборатории США в Окридже, заняла первое место при выполнении эталонного теста HPL с результатом в 1,194 квинтиллиона операций с плавающей запятой в секунду (FLOPS), что совпадает с тем, что он демонстрировал ранее в этом году. Один квинтиллион равен 1018 или одному эксафлопсу (EFLOPS). Основным показателем производительности, используемым при оценке суперкомпьютеров, является тест High Performance Linpack (HPL), оценивающий, насколько хорошо системы решают систему линейных уравнений с плотной матрицей.
Система Frontier, использующая процессоры AMD EPYC 64C с тактовой частотой 2 ГГц, построена на основе новейшей архитектуры HPE Cray EX235a и имеет в общей сложности 8 699 904 ядра центральных и графических процессоров. Суперкомпьютер с показателем энергоэффективности в 52,59 GFLOPS/ватт использует для передачи данных сеть HPE Slingshot 11.
Дебютировавшая в нынешнем рейтинге система Aurora заняла второе место, потеснив Fugaku. Система, развернутая на площадке Argonne Leadership Computing Facility в Иллинойсе, показала в тесте HPL результат в 585,34 PFLOPS. Один петафлопс равен 1015 FLOPS. Суперкомпьютер Aurora был построен компанией Intel на базе серверов HPE Cray EX-Intel Exascale Compute Blade с процессорами Intel Xeon Max Series и графическими ускорителями Intel Data Center Max Series. Обмен данными между ними осуществляется через сетевое межсоединение HPE Slingshot-11.
Составители рейтинга Top500 отмечают, что результаты Aurora были получены после развертывания примерно половины запланированной системы, а значит, после завершения всех работ она может превзойти Frontier и сместить этот суперкомпьютер с лидирующей позиции, обновив рекорд, который пока составляет около 2 EFLOPS.
Следующим нарушителем устоев в списке стала система Eagle, занявшая третье место. Она развернута в облаке Microsoft Azure и сумела продемонстрировать самый высокий результат за всю историю облачных систем. Система, производительность которой в тесте HPL составила 561,2 PFLOPS, построена на базе процессоров Intel Xeon Platinum 8480C и ускорителей Nvidia H100.
Суперкомпьютер Fugaku сохранил за собой место в первой десятке, но опустился на четвертую строчку. Ранее с июня 2020-го по ноябрь 2021 года он занимал вторую позицию. Система, развернутая в японском городе Кобе, продемонстрировала результат в 442,01 PFLOPS и продолжает удерживать за собой звание самой быстрой за пределами США.
Суперкомпьютер LUMI, входивший ранее в тройку лидеров, теперь занимает пятую строчку с результатом 379,70 PFLOPS. Эта система является самой мощной в Европе и неоднократно модернизировалась, что позволяет ей сохранять за собой одно из ведущих мест в списке. В нынешней редакции рейтинга производительность LUMI выросла по сравнению с предыдущей, когда она составляла 309,10 PFLOPS.
В нынешней редакции Top500 прослеживается ряд тенденций. При взгляде на первую десятку можно заметить, что предпочтительным выбором для высокопроизводительных систем являются процессоры Intel, AMD и IBM.
Пять суперкомпьютеров из первой десятки используют процессоры Intel Xeon (Aurora, Eagle, Leonardo, MareNostrum 5 ACC и EOS Nvidia DGX SuperPod), два – процессоры AMD (Frontier и LUMI) и еще два – процессоры IBM (Summit и Sierra).
Наибольшее представительство в рейтинге в целом получили Китай и США. США упрочили свое лидерство, получив на этот раз 161 место (в прошлый раз было 150 машин), а у Китая этот показатель уменьшился со 134 до 104. В более широком масштабе Северная Америка улучшила свой результат со 160 машин до 171, у Азии представительство сократилась со 192 до 169 машин, а у Европы выросло со 133 до 143 систем.
Из первой десятки по сравнению с предыдущей версией рейтинга выбыли Sunway TaihuLight, Perlmutter, Selene и Tianhe-2 A (Milky Way-2A).
Вот как выглядит в ноябре 2023 года список из 10 самых быстрых суперкомпьютеров в мире.
1. Frontier
Cистема HPE Cray EX первой в США сумела преодолеть планку в 1 EFLOPS. Она развернута в Национальной лаборатории США в Окридже и эксплуатируется министерством энергетики США.
Количество ядер: 8 699 904
Максимальная производительность (Rmax): 1 194,00 PFLOPS
Теоретическая максимальная производительность, рассчитанная с учетом объявленной тактовой частоты процессора (Rpeak): 1 679,82 PFLOPS
Потребляемая мощность: 22 703 кВт
2. Aurora
Новая система Intel построена на базе серверов HPE Cray EX — Intel Exascale Compute Blade. Она установлена в вычислительном центре Argonne Leadership Computing Facility в штате Иллинойс и также используется министерством энергетики США.
Количество ядер: 4 742 808
Rmax: 585,34 PFLOPS
Rpeak: 1059,33 PFLOPS
Потребляемая мощность: 24 687 кВт
3. Eagle
Суперкомпьютер Eagle развернут компанией Microsoft в облаке Azure. Система Microsoft NDv5 построена на базе процессоров Xeon Platinum 8480C и ускорителей Nvidia H100.
Количество ядер: 1 123 200
Rmax: 561,20 PFLOPS
Rpeak: 846,84 PFLOPS
4. Fugaku (ранее он занимал второе место)
В суперкомпьютере Fugaku, установленном в вычислительном центре RIKEN в японском городе Кобе, насчитывается 7 630 848 ядер.
Количество ядер: 7 630 848
Rmax: 442,01 PFLOPS
Rpeak: 537,21 PFLOPS
Потребляемая мощность: 29 899 кВт
5. LUMI (3-е место в предыдущем рейтинге)
Модернизированная система LUMI, еще один вариант HPE Cray EX, установлена в центре EuroHPC CSC в Финляндии. Совместное предприятие European High-Performance Computing Joint Undertaking (EuroHPC JU) сконцентрировало общеевропейские ресурсы для создания суперкомпьютеров эксамасштаба и обработки больших данных.
Количество ядер: 2 752 704
Rmax: 379,70 PFLOPS
Rpeak: 531,51 PFLOPS
Потребляемая мощность: 7 107 кВт
6. Leonardo (4-е место в предыдущем рейтинге)
Суперкомпьютер Leonardo в еще одном центре EuroHPC CINECA в Италии. В качестве центральных процессоров в системе Atos BullSequana XH2000 используются модели Xeon Platinum 8358 32C с тактовой частотой 2,6 ГГц, в качестве графических ускорителей – Nvidia A100 SXM4 (40 Гбайт), а в качестве межсоединений – Quad-rail Nvidia HDR100 Infiniband.
Количество ядер: 1 824 768
Rmax: 238,70 PFLOPS
Rpeak: 304,47 PFLOPS
Потребляемая мощность: 7 404 кВт
7. Summit (5-е место в предыдущем рейтинге)
Система Summit, также развернутая в Окридже, имеет 4356 узлов, в каждом из которых установлены два 22-ядерных процессора POWER9 и шесть графических процессоров Nvidia Tesla V100 с 80 потоковыми мультипроцессорами (SM). Связь между узлами поддерживается с помощью сети Dual-rail Mellanox EDR InfiniBand.
Количество ядер: 2 414 592
Rmax: 148,60 PFLOPS
Rpeak: 200,79 PFLOPS
Потребляемая мощность: 10 096 кВт
8. MareNostrum 5 ACC (впервые в рейтинге)
Восьмое место заняла новая система MareNostrum 5 ACC, установленная в суперкомпьютерном центре EuroHPC в Барселоне. Система BullSequana XH3000 построена на базе процессоров Xeon Platinum 8460Y с ускорителями NVIDIA H100 и межсоединениями Infiniband NDR200.
Количество ядер: 680 960
Rmax: 138,20 PFLOPS
Rpeak: 234,00 PFLOPS
Потребляемая мощность: 2560 кВт
9. Eos Nvidia DGX SuperPOD (впервые в рейтинге)
Новая система Eos построена на базе серверов Nvidia DGX H100 с процессорами Xeon Platinum 8480C, ускорителями Nvidia H100 и межсоединениями Infiniband NDR400.
Количество ядер: 485 888
Rmax: 121,40 PFLOPS
Rpeak: 188,65 PFLOPS
10. Sierra (6-е место в предыдущем рейтинге)
Система, установленная в Национальной лаборатории им. Лоуренса в Ливерморе, имеет архитектуру, очень похожую на Summit. Она состоит из 4320 узлов с двумя процессорами POWER9 и четырьмя графическими процессорами Nvidia Tesla V100.
Количество ядер: 1 572 480
Rmax: 94,64 PFLOPS
Rpeak: 125,71 PFLOPS
Потребляемая мощность: 7 438 кВт