Консорциум под руководством OpenAI, объединивший такие технологические гиганты, как AMD, Broadcom, Intel, Microsoft и Nvidia, представил новый сетевой протокол Multipath Reliable Connection (MRC), созданный для борьбы с перегрузками сетей, которая постоянно усугубляется из-за передачи огромных объемов данных, необходимых для поддержки приложений ИИ. MRC предназначен для передачи данных в процессе обучения моделей на более чем 100 тыс. графических процессоров. Протокол распределяет трафик по сотням сетевых каналов, а не по нескольким маршрутам, которые могут легко перегружаться. MRC обеспечивает максимально эффективное использование графических процессоров, осуществляя балансировку коммуникационной нагрузки по всем доступным путям. Для исключения перегрузок осуществляется динамическое перераспределение трафика в режиме реального времени. MRC помогает поддерживать максимальную загрузку графических процессоров во время обучения, несмотря на замедление сети, перегрузку, сбои и другие проблемы, которые обычно прерывают или замедляют обучение. В OpenAI утверждают, что многоуровневая сетевая архитектура MRC позволяет соединить более 100 тыс. графических процессоров всего двумя уровнями Ethernet-коммутаторов вместо трех или четырех уровней, необходимых стандартным сетям с производительностью 800 Гбит/с.