Компания Mellanox Technologies объявила, что ее Ethernet-коммутаторы Spectrum и сетевые адаптеры ConnectX-4 с поддержкой технологии 100G Ethernet выбраны компанией Baidu для платформы машинного обучения. Проведенные тесты показали, что названные продукты позволят на 200% улучшить временные показатели процедур обучения, что обеспечит существенно более быстрое принятие решений.
Помимо высочайшей скорости передачи данных, эксперты компаний особо отмечают поддержку продуктами Mellanox технологи RDMA. Механизм удаленного прямого доступа к памяти (Remote Direct Memory Access, RDMA) был разработан еще в 90-е годы прошлого века для InfiniBand, а затем адаптирован для Ethernet. С его помощью приложение, находящееся на одном узле, может обращаться к ресурсам на другом без участия центральных процессоров обоих узлов. За взаимодействие с отправителем и получателем информации и за проверку данных в ходе операций отвечает сетевой адаптер.
Лидер в области Интернет-услуг в Китае компания Baidu инициировала проект IDL (Institute of Deep Learning) в 2013 году с целью задействовать преимущества машинного обучения для таких задач, как распознавание изображений, голоса а также для механизма предсказания вероятности клика на баннер (Click Through Rate prediction, pCTR). Поддержка RDMA, реализованная в приложениях Baidu, оказалась весьма важным требованием и к сетевым компонентам. В случае возникновения проблем в работе механизма RDMA, сеть автоматически перейдет на работу по протоколу TCP, что гарантирует непрерывность работы системы.