В Nvidia разработали программные протоколы Spectrum-XGS, которые поддерживаются коммутаторами Spectrum-X, сетевыми адаптерами SuperNIC ConnectX-8, а также системами с графическими процессорами Blackwell и автоматически регулируют производительность протяженных сетей, обеспечивая совместную работу графических процессоров, установленных в серверах удаленных дата-центров, как единого ИИ-суперкомпьютера.

Протоколы XGS анализируют в реальном времени телеметрические данные, включая сведения о расстояниях и характере трафика между ЦОДами, показатели загруженности и производительности сети. На основе полученной информации они осуществляют управление перегрузками, маршрутизацию и балансировку нагрузок, а также минимизируют задержки и вариации времени доставки пакетов (jitter).

Новые протоколы, утверждают в Nvidia, помогут тем компаниям, где вынуждены расширять сеть дата-центров из-за локальных ограничений, связанных с их размерами и потребляемой мощностью, в результате чего совместно работающие графические процессоры разносятся на значительные расстояния. В настоящее время Spectrum-XGS внедряют в дата-центрах, удаленных на сотни километров друг от друга.

ИИ-нагрузки обычно распределяются между графическими процессорами, которые координируют работу для получения единого результата. При их выполнении синхронизацию сети и графических процессоров на больших расстояниях обеспечивает адаптивная маршрутизация. Протоколы XGS поддерживают «мелкозернистую адаптивную маршрутизацию пакета за пакетом», что устраняет проблемы с потерей данных или глубокой буферизацией для ее предотвращения, пояснили разработчики технологии.

В Nvidia протестировали алгоритмы XGS на серверном оборудовании и добилась улучшения связи между графическими процессорами в 1,9 раза по сравнению с готовыми сетевыми технологиями, сообщили представители компании.

Они считают, что фактическая производительность охватывающих континенты высокопроизводительных оптоволоконных сетей облачных провайдеров, которые передают данные на большие расстояния, в значительной степени определяется развивающимися программными протоколами, работающими поверх этих сетей.

По мнению аналитиков Next Curve, новая технология может использоваться сегодня в основном для обучения моделей в компаниях, испытывающих нехватку электроэнергии в регионах развертывания, «но нет сомнений в том, что XGS найдет применение и для формирования логических выводов. В Nvidia хотят предоставить полный набор функций для своего оборудования, сохранив возможность комбинирования с такими продуктами, как технология NVLink Fusion».

Сетевые технологии становятся важным рынком для Nvidia. Но здесь конкуренция растет, и такие традиционные лидеры рынка Ethernet, как Arista, Cisco, Ciena, Broadcom и другие компании, адаптируют свои продукты для кампусных и региональных оптических сетей.