Новые графические процессоры Nvidia Blackwell для центров обработки данных вызывают серьезные проблемы с перегревом при установке в серверные стойки с высокой плотностью размещения оборудования, что требует изменений в конструкции таких стоек, сообщает The Information.
Нарушение температурного режима происходит в серверных стойках, где установлено 72 графических процессора Nvidia Blackwell.
Необходимость в модернизации стоек, как сообщают, приводит к задержкам отгрузок продукции крупнейшим клиентам Nvidia, включая Google и Microsoft, что вызывает опасения в соблюдении ими графиков ввода в действие серверов с процессорами Blackwell.
Эксперты отрасли не считают подобные проблемы слишком редкими, но поясняют, что в данном случае они сдвигают сроки намеченных на текущий квартал поставок. В Nvidia, в свою очередь, активно работают с партнерами для модернизации стоек и решения проблем перегрева.
Сообщения о перегреве — не первые слухи о трудностях с процессорами Blackwell. В августе стало известно, что Nvidia и ее производственный партнер TSMC столкнулись с проблемами упаковки при соединении чиплетов. Однако все было быстро устранено и практически не повлияло на квартальные показатели.
В Moor Insights&Strategies считают, что нужно понять является ли перегрев распространенной проблемой или относится к конкретной конфигурации, так как сомневаются в том, что в Nvidia не уделяют должного внимания охлаждению. Они не исключают связи сообщений о перегреве с желанием конкурентов ослабить позиции компании.
В Nvidia, комментируя ситуацию, заявили, что внедрение в ЦОДы суперускорителей нового поколения на базе архитектуры Blackwell требует совместной разработки с клиентами и что изменения инженерных решений соответствуют ожиданиям компании.