По мере роста спроса на генеративный ИИ владельцы облачных сервисов – Microsoft, Google и AWS – наряду с поставщиками больших языковых моделей (large language model, LLM), в том числе с OpenAI, рассматривают возможность разработки собственных специализированных чипов для решения задач искусственного интеллекта.
Рассуждения о том, что некоторые из этих компаний (в частности, OpenAI и Microsoft) решили заняться созданием собственных чипов для задач генеративного искусственного интеллекта по причине нехватки процессоров общего назначения, на протяжении последних нескольких недель доминируют в заголовках газет.
В то время как OpenAI, по слухам, для реализации своих планов по разработке чипов стремится приобрести готовую компанию, Microsoft работает над созданием специализированного процессора, которому присвоено кодовое наименование Athena, совместно с AMD.
Google и AWS уже сейчас являются обладателями собственных чипов для задач ИИ. У Google речь здесь идет о тензорных процессорах (Tensor Processing Units, TPU), а у AWS – о чипах Trainium и Inferentia.
Что же побуждает эти компании выпускать свои собственные чипы? Ответ, по мнению аналитиков и экспертов, кроется в стоимости обработки запросов генеративного искусственного интеллекта и эффективности доступных процессоров, в основном графических. На рынке чипов для поддержки решений искусственного интеллекта в настоящее время преобладают графические процессоры Nvidia A100 и H100.
Графические процессоры не слишком эффективны при решении задач генеративного искусственного интеллекта, и здесь лучше подходят какие-то специализированные чипы, отмечают в IDC.
Как указывают эксперты, графические процессоры – это устройства общего назначения, отличающиеся крайне высокой эффективностью при выполнении обращения матриц – основных математических операций в ИИ-прирожениях. Однако в эксплуатации они очень дороги. Поэтому компании стремятся разработать процессорную архитектуру, которая будет оптимизирована для их задач и позволит сократить затраты.
Применение специализированных чипов позволит Microsoft и OpenAI сократить энергопотребление и улучшить взаимодействие вычислительных компонентов и памяти, что в свою очередь поможет добиться снижения стоимости запросов.
По оценкам исследовательской компании SemiAnalysis, OpenAI ежедневно затрачивает на работу с ChatGPT примерно 694 444 долл. или 36 центов на каждый запрос.
Задачи ИИ требуют не только графических процессоров. Графические процессоры отлично подходят для параллельных вычислений, однако при выполнении операций ИИ лучше проявляют себя другие архитектуры и ускорители. К другим преимуществам специализированных процессоров следует отнести контроль доступа к чипам и проектирование элементной базы с учетом особенностей LLM, что помогает увеличить скорость обработки запросов.
Некоторые аналитики сравнивают проектирование специализированных процессоров со стратегией Apple, направленной на оснащение своих устройств собственными чипами. Подобно Apple, которая в целях повышения производительности своих устройств перешла с процессоров общего назначения на специализированные чипы, провайдеры сервисов генеративного ИИ также стремятся адаптировать архитектуру своих чипов к решению стоящих перед ними задач.
Хотя графические процессоры Nvidia безумно популярны, они относятся к категории устройств общего назначения. Между тем, во многих «умных» приложениях нужны чипы, оптимизированные для выполнения конкретных функций – обработки изображений или генеративного искусственного интеллекта. В таких ситуациях специализированные чипы становятся наилучшим решением.
Вместе с тем эксперты признают, что разработка специализированных чипов станет непростой задачей для любой компании.
К препятствиям, мешающим разработке специализированных чипов, следует отнести необходимость крупных инвестиций, длительный жизненный цикл проектирования, сложность цепочек поставок, нехватку специалистов, объем, оправдывающий любые расходы, и непонимание всего процесса в целом, предупреждают в Gartner. У любой компании, которая начинает все с нуля, длительность процесса проектирования составит по меньшей мере 2–2,5 года. При этом задержки объясняются по большей части нехваткой специалистов в области проектирования.
Соответствующие заявления подтверждаются практикой крупных технологических компаний, которые для разработки собственных специализированных чипов приобретают готовые стартапы или сотрудничают с компаниями, обладающими необходимым опытом в этой сфере. В 2015 году AWS приобрела для разработки нужных ей специализированных чипов израильский стартап Annapurna Labs. Компания Google создает свои чипы искусственного интеллекта в сотрудничестве с Broadcom.
Хотя OpenAI, по слухам, стремится приобрести стартап, который помог бы в создании специализированного чипа для задач искусственного интеллекта, эксперты полагают, что план этот связан скорее не с нехваткой чипов, а с желанием обеспечить поддержку операций логического вывода в рамках LLM. Microsoft, со своей стороны, продолжает добавлять функции ИИ в приложения, побуждая клиентов оформлять подписку на свои сервисы генеративного ИИ.
Возможно, покупка и интеграция аппаратных средств для логического вывода обходится дешевле, чем приобретение мощного графического процессора или новейшего процессора Sapphire Rapids. При этом никаких ответных обязательств у AWS и Google не возникает. Такой вывод можно сделать на основании комментариев генерального директора OpenAI Сэма Олтмена о том, что GPT-4 вряд ли будет масштабироваться дальше и нуждается скорее в доработке. Масштабирование LLM требует большей вычислительной мощности по сравнению с логическим выводом модели. Операции логического вывода выполняются в процессе использования уже обученной LLM для получения более точных прогнозов и результатов.
Кроме того, приобретение крупного разработчика чипов вряд ли можно считать для OpenAI разумным решением, поскольку проектирование чипов и их подготовка к производству обойдется примерно в 100 млн долл.
В OpenAI могли бы попытаться привлечь деньги с рынка, однако предпочли этому сделку с Microsoft. По сути, она привела к продаже за 10 млрд долл. опциона, стоимость которого превышает половину компании.
Альтернативным решением для создателя ChatGPT может стать приобретение стартапов, у которых уже имеются ускорители искусственного интеллекта. Такой шаг представляется более целесообразным с экономической точки зрения.
Для поддержки задач, связанных с логическим выводом, потенциальными целями могли бы стать стартапы из Кремниевой долины, включая компании Groq, Esperanto Technologies, Tenstorrent и Neureality. Сюда же можно отнести и SambaNova, если OpenAI захочет отказаться от графических процессоров Nvidia и сменить облачный подход на использование локальных ресурсов.