Технологии межсоединений, содержащие протоколы и решения, которые позволяют устройствам стандартизированным способом подключаться друг к другу и унифицировать их взаимодействие, являются одним из фундаментальных сетевых компонентов современной ИТ-инфраструктуры. В ЦОДах с ИИ нагрузками они должны обладать высокой производительностью и низкими задержками, поскольку даже самые продвинутые модели ИИ могут «зависать», из-за проблем в передаче данных, препятствующих необходимой для LLM и генеративного ИИ параллельной обработке. В настоящее время предлагаются три основные технологии межсоединений для дата-центров — Ethernet, InfiniBand и Omni-Path.
Традиционная технология Ethernet не подходит для ИИ из-за задержек и возможных потерь пакетов при интенсивном трафике. Переломным моментом в развитии сетей ЦОДов для ИИ стал стандарт IEEE 802.3df-2024, принятый в феврале 2024 года. Спецификация 800 Gigabit Ethernet заложила основу для кластеров ИИ следующего поколения. Этот стандарт обеспечивает оптическую и электрическую обратную совместимость с существующими сетями 100 Гбит/с.
Наряду с этим, чтобы оптимизировать Ethernet с быстродействием 400-800 Гбит/с для рабочих нагрузок ИИ, в объединении Ultra Ethernet Consortium разработали и опубликовали в 2025 году спецификацию UEC 1.0, где представлены современные реализации технологии RDMA, улучшенные транспортные протоколы и усовершенствованные методы управления перегрузками, ранее доступные только в проприетарных решениях. Для исключения потерь используется повторная передача данных на канальном уровне (Link Level Retry, LLR), что устраняет одно из исторических отличий Ethernet от InfiniBand.
Технология InfiniBand появилась в конце 1990-х годов для обмена данными между серверами в кластерах ЦОДов. Благодаря аппаратному управлению потоком данных и специализированным сетевым адаптерам она предотвращает потери и минизирует задержки, что устраняет устраняет каскадные сбои при обучении больших моделй ИИ. Переход к спецификации XDR (eXtended Data Rate) позволяет достичь пропускной способности Ethernet, сохраняя архитектурные преимущество. В спецификации IBTA Volume 1 Release 1.7, выпущенной в октябре 2023 года, регламентируется быстродействие порта 800 Гбит/с, которая достигает 1,6 Тбит/с при соединении коммутаторов с использованием технологии SerDes.
Omni-Path разработали в Intel в середине 2010-х годов в качестве ответа на доминирование Nvidia с InfiniBand в высокопроизводительных вычислениях. Технология обрела новую жизнь, когда в 2020 году разработчики Intel Omni-Path создали компанию Cornelis Networks. Там возродили Omni-Path в платформе CN5000 для ИИ, которая масштабируется до 500 тыс. конечных точек и поддерживает быстродействие 400 Гбит/с. В CN6000, как ожидают, будет и поддержка собственного протокола Omni-Path, и совместимость с Ethernet. В Cornelis ориентируются на оптимизацию соотношения цены и производительности, а не только на значения последнего показателя.
Несмотря на лидирующие сегодня позиции InfiniBand, открытость Ethernet и возрождение Omni-Path способствуют более демократизированному будущему межсоединений, так как стратегии гиперскейлеров основаны на сочетании инноваций с экономичностью, полагают эксперты.