В то время как остальная часть отрасли высокопроизводительных вычислений изо всех сил пытается довести вычислительную мощность до одного эксафлопса, Nvidia намерена создать суперкомпьютер с новой архитектурой графических процессоров, производительность которого будет достигать 18 эксафлопс.
У графического процессора H100 насчитывается 80 млрд транзисторов (у чипов предыдущего поколения Ampere их было 54 млрд). Пропускная способность его внешних соединений составляет почти 5 Тбайт/с. Поддерживается интерфейс PCIe Gen5, а также High Bandwidth Memory 3 (HBM3), что обеспечивает обмен данными с памятью на скорости 3 Тбайт/с. Чип будет выпущен в третьем квартале и станет первым в новом семействе графических процессоров, названных в честь адмирала Грейс Хоппер. В свое время Хоппер создала язык COBOL и ввела термин 'computer bug'.
Новый графический процессор предназначен для ЦОДов, поддерживающих функции искусственного интеллекта, и в Nvidia утверждают, что 20 из них достаточно для обработки эквивалента всего мирового интернет-трафика.
Семейство Hopper совместимо со вторым поколением технологии Nvidia Secure Multi-Instance GPU (MIG), позволяющей совместно использовать один графический процессор для обеспечения безопасности в мультиарендной среде. «H100 может обслуживать семь облачных арендаторов, полностью изолированных за счет виртуализации ввода-вывода и защищенных возможностью выполнения конфиденциальных вычислений на каждом экземпляре, – сообщил старший директор подразделения Nvidia Data Center Computing Пареш Харья. – Теперь эти вычислительные мощности могут быть безопасно разделены между различными пользователями и облачными арендаторами». Их возможности в семь раз превышают возможности технологии MIG предыдущего поколения.
H100 поддерживает новую функцию конфиденциальных вычислений, которая защищает модели искусственного интеллекта и данные клиентов в процессе их обработки. Конфиденциальные данные часто шифруются в состоянии покоя, но во время перемещения обычно остаются незащищенными. Функция конфиденциальных вычислений защищает данные в процессе их использования.
Процессоры Hopper поддерживают технологию высокоскоростных соединений NVLink четвертого поколения. В сочетании с новым внешним коммутатором NVLink Switch технология NVLink позволяет объединить до 256 графических процессоров H100 с пропускной способностью, в девять раз превышающей пропускную способность предыдущего поколения.
И наконец, у процессоров Hopper появились новые инструкции DPX для ускорения динамического программирования – разбиения задач с комбинаторной сложностью на более простые подзадачи. Такой подход используется в широком спектре алгоритмов, которые находят применение в геномике и оптимизации графов. Инструкции DPX Hopper ускорят динамическое программирование в семь раз.
Собранная воедино эта технология будет использоваться для создания систем Nvidia DGX H100 – модулей высотой 5U, устанавливаемых в стойку и выполняющих роль строительных блоков для мощных суперкомпьютеров DGX SuperPOD.
Новая система DGX H100 позволит довести производительность задач искусственного интеллекта до 32 петафлопс, что в шесть раз больше, чем у DGX A100, представленной в настоящее время на рынке. А в сочетании с системой коммутаторов NVLink будет создан 32-процессорный суперкомпьютер DGX SuperPOD, который обеспечит системе искусственного интеллекта производительность в один эксафлопс. Ширина его полосы пропускания составит 70 терабайт в секунду, что в 11 раз превышает возможности DGX A100 SuperPod.
Чтобы продемонстрировать возможности H100, Nvidia построит суперкомпьютер Eos, объединяющий 18 DGX H100 SuperPOD. Он будет включать в себя 4600 графических процессоров H100, соединенных коммутаторами NVLink 4 и InfiniBand, что обеспечит системе искусственного интеллекта производительность в 18 эксафлопс. Чтобы представить себе открывающиеся перспективы, стоит обратиться к последнему рейтингу суперкомпьютеров Top500. Пиковая производительность самого быстрого на сегодняшний день суперкомпьютера Fugaku не превышает половины эксафлопса. Nvidia обещает производительность в 36 раз выше.
Eos обеспечит изоляцию выделенной арендаторам аппаратной производительности, а также гарантию того, что одно приложение не оказывает никакого влияния на другое.
Суперкомпьютер Eos будет использоваться исследовательскими группами, занимающимися искусственным интеллектом, а также другими инженерами-программистами и командами, которые создают различные продукты, в том числе платформу для автономных транспортных средств и программное обеспечение для разговорного искусственного интеллекта. График развертывания Eos пока не публикуется. Появление DGX H100 POD и SuperPOD ожидается в нынешнем году.