В Oracle представили кластерное решение нового поколения – Oracle Cloud Infrastructure Zettascale10, объединяющее сотни тысяч графических процессоров Nvidia в нескольких ЦОДах, которое в компании называют крупнейшим облачным ИИ-суперкомпьютером. Его пиковая производительность достигает 16 ZPLOPS.

OCI Zettascale10 создан на основе усовершенствований, внесенных в первый кластер облачных вычислений этой компании — Zettascale, представленный в сентябре 2024 года. По данным Oracle, новая архитектура отличается энергоэффективной оптикой и «сверхоптимизированной» плотностю, поскольку кластеры OCI Zettascale10 расположены в гигаваттных дата-центрах в зоне радиусом 2 км, что ограничивает задержки передачи данных между графическими процессорами в крупномасштабных задачах обучения ИИ. Задержки при работе системы минимизируются также сетевой архитектурой Oracle Acceleron RoCE (RDMA over Converged Ethernet), обеспечивающей взаимодействие всех ее компонентов.

Объединение этой сетевой архитектуры и нового поколения ИИ-инфраструктуры Nvidia обеспечивют многогигаваттную вычислительную мощность, необходимую для масштабных нагрузок ИИ, включая обучение крупнейших моделей ИИ и формирование ими логических выводов в режиме эффективного энергопотребления в совместном с OpenAI проекте Stargate, пояснили в Oracle.

Эксперты Info-Tech Research Group относят к преимуществам платформы повышенную производительность, необходимые предприятиям масштабируемость и операционну эффективность, адаптированные к потребностям отраслевых ИИ-приложений.

Представители Oracle сообщили также о новых возможностях сетевого пакета Oracle Acceleron — выделенных под определенные задачи сетевых структурах, конвергентных сетевых адаптерах, маршрутизации пакетов с нулевым доверием на уровне хоста. Все это позволяет, согласно Oracle, удвоить пропускную способность сети и комплексов хранения данных, сокращая и задержки, и расходы.

В Oracle пояснили, что сетевая архитектура поддерживает соединения с небольшой глубиной маршрутизации, обеспечивающие высокую отказоустойчивость, отметив, что современные сетевые интерфейсы графических процессоров предоставляют возможность одновременно подключаться к нескольким изолированным независимым сегментам сети, повышая безопасность и устойчивость к сбоям. Это важно для масштабных вычислений и ИИ-решений, поскольку позволяет с меньшим числом задержек и перезапусков из контрольных точек развертывать более крупные кластеры.

Заказы на работу с OCI Zettascale10 уже начали принимать, доступность кластера ожидается во второй половине 2026 года. Сначала планируется предлагать гигаваттные решения на базе до 800 тыс. графических процессоров Nvidia.