В Salesforce AI Research обнародовали свой подход созданию общего корпоративного интеллекта (Enterprise General Intelligence, EGI). Целью является разработка бизнес-оптимизированного ИИ, способного работать надежно в сложных сценариях и интегрироваться с существующими системами.
Исследователи подчеркивают, что агенты — это не просто большие языковые модели (LLM), а сложные системы, состоящие из четырех компонентов.
— Память. Позволяет агентам сохранять информацию, такую как лучшие практики, политики, данные клиентов и предыдущие взаимодействия.
— Мозг. Отвечает за рассуждения, планирование действий и координацию процессов.
— Актуатор. Выполняет действия, запланированные «мозгом».
— Интерфейс. Обеспечивает связь с людьми через язык, аудио, видео и другие модальности.
«Мозг» и «актуатор» опираются на большие модели действий (large action model, xLAM) — специализированных версий LLM, обученных на выполнение задач в конкретных средах.
Salesforce рассматривает автономных агентов не как замену людей, а как «усилители» их возможностей.
В простом сценарии человек непосредственно использует несколько подходящих для решения его задач ИИ-агентов. В более сложном — у него есть личный ИИ-ассистент, «оркестратор», который самостоятельно множеством агентов, адаптируясь к предпочтениям и стилю работы человека.
Одна из ключевых проблем — «зазубренный интеллект» (jagged intelligence), когда ИИ может успешно справляться со сложными задачами, но порой терпит неудачу в простых, которые легко решаются человеком. Для демонстрации этой проблемы в Salesforce AI Research создали набор данных SIMPLE, содержащий 225 базовых вопросов на логику. Одна из них — чуть измененная версия классической задачи про волка, козу и капусту, в которой в лодку разрешается взять три разных предмета. В версии SIMPLE лодка может взять сразу три предмета. Однако современные модели, такие как ChatGPT-o1, все равно предлагают классическое решение, игнорируя измененное условие.
Эта проблема подчеркивает необходимость человеческого контроля над автономными агентами, особенно в корпоративных сценариях, где ошибки могут привести к сбоям операций, потере доверия клиентов и финансовым потерям.
Salesforce использует матрицу возможностей и согласованности, чтобы классифицировать ИИ-агентов. Ось X отражает «возможности» (capability), то есть способность решать сложные задачи, а ось Y — «согласованность» (consistency), то есть надежность и предсказуемость результатов. В зависимости от характеристик агента, он попадает в один из четырех квадрантов:
— универсалы (низкие возможности, низкая согласованность) ограничены в функциях и недостаточно надежны;
— вундеркинды (высокие возможности, низкая согласованность) решают сложные задачи, но ненадежны;
— работяги (низкие возможности, высокая согласованность) надежны в простых задачах, но не справляются со сложными;
— чемпионы (высокие возможности, высокая согласованность) — идеал общего корпоративного интеллекта.
Для потребительских приложений иногда достаточно «вундеркиндов», но для бизнеса нужны «чемпионы».
В Salesforce выделяют три этапа создания системы общего корпоративного интеллекта: предварительное обучение (формирование общей основы для понимания языка, распознавания шаблонов и базового мышления); точная настройка (адаптация модели к конкретным отраслям и бизнес-функциям); ультраточная настройка (дальнейшая специализация под контекст конкретной организации). При этом общий корпоративный интеллект будет представлен не одним универсальным ИИ-агентом, а множеством специализированных агентов, каждый из которых должен стать «чемпионом» в своей области.
Одновременно следует инвестировать в развитие навыков, включая обучение сотрудников работе с ИИ, создание кросс-функциональных команд, сочетающих знания предметной области и ИИ-грамотность, а также внедрять механизмы обратной связи для улучшения системы.
Следует помнить, что система общего корпоративного интеллекта представляет собой не просто реализацию новых технологических идей, но подразумевает комплексную бизнес-трансформацию. Успех зависит от создания надежных, согласованных и специализированных ИИ-агентов, которые усиливают человеческий труд, а не заменяют его.