На ежегодной конференции IBM Think Conference представители компании сообщили о новых продуктах и решениях в области ИИ, отметив особое значение поддерживаемых граничными сетями небольших моделей, которые позволят решить проблемы доступности данных, стоимости, скорости и безопасности вычислений.
Арвинд Кришна, генеральный директор IBM, заявил об активной работе над решениями, позволяющими предприятиям применять модели, которые адаптированы для поддержки таких конкретных задач, как управление персоналом, продажи, розничная торговля и производство. Эти небольшие специализированные модели помогут решить проблему использования данных, поскольку, по оценкам IBM, из-за отсутствия интеграции и координации между многочисленными дата-центрами, облачными сервисами и граничными средами только 1% корпоративных данных были доступны моделям генеративного ИИ.
Кришна подчеркнул, что в планах IBM — интеграция открытых больших языковых моделей (LLM) с небольшими моделями, которые могут быть легко развернуты и настроены любым использующим их предприятием. Он пояснил, что намного более точные и экономные небольшие модели являются не заменой, а дополнением более крупных моделей, которые теперь будет легче адаптировать к потребностям конкретных предприятий. По его словам, они проще в развертывании и настройке, их эксплуатация обходится в среднем в 30 раз дешевле традиционных LLM.
Кришна выделил серию IBM Granite — небольших базовых ИИ-моделей с числом параметров от 3 млрд до 20 млрд. Для сравнения: в таких LLM, как GPT-4, – их более 1 трлн.
К примеру, модели IBM Granite 3.0, объявленные прошлой осенью в рамках стратегии предоставления бизнесу масштабируемых и настраиваемых ИИ-решений, разработаны и обучены для реализации функций корпоративного предметно-ориентированного ИИ. Они интегрированы в ИИ-платформу Watsonx, созданную для помощи предприятиям в разработке, обучении и развертывании моделей.
На конференции IBM Think 2025 состоялся анонс Granite 4.0 Tiny Preview, предварительной версии самой маленькой модели в грядущем семействе языковых моделей Granite 4.0. Разработчики пояснили, что при 8-разрядном формате данных с плавающей запятой (FP8) эта версия очень компактна и эффективна, что позволяет нескольким параллельным сеансам выполнять задачи с «длинным контекстом» на потребительском оборудовании, включая графические процессоры.
В IBM рассчитывают, что со временем технологии искусственного интеллекта станет значительно дешевле и будет использоваться для гораздо более широкого спектра задач. «Эпоха экспериментов с ИИ закончилась. Теперь успех определяется интеграцией в бизнес специализированных ИИ-систем, способных приносить конкретные результы», — заявил Кришна.