По оценкам Gartner, к 2027 году 40% решений с генеративным искусственным интеллектом (GenAI) станут мультимодальными, то есть сочетающими в себе работу с текстом, изображениями, аудио и видео. В 2023 году доля таких решений не превышала 1%. Переход к мультимодальным моделям обеспечивает улучшение взаимодействия человека с ИИ. По мнению аналитиков Gartner, мультимодальный генеративный ИИ наряду с большими языковыми моделями (LLM) с открытым кодом обладает наивысшим потенциалом для вывода организаций в ближайшие пять лет на новый качественный уровень и обеспечения конкурентных преимуществ. К перспективным инновациям GenAI, которые получат массовое распространение в течение 10 лет, относятся в первую очередь модели генеративного ИИ, ориентированные на конкретную предметную область, и автономные агенты.
Мультимодальный генеративный ИИ
Мультимодальный генеративный ИИ оказывает существенное влияние на корпоративные приложения, позволяя добавлять новые функции, которые в противном случае были бы нереализуемы. Причем влияние это не ограничивается какими-то конкретными отраслями или вариантами использования и может найти отражение в любой точке взаимодействия искусственного интеллекта с человеком. Сегодня многие мультимодальные модели ограничены двумя или тремя модальностями, но в ближайшие несколько лет их число начнет увеличиваться. Мультимодальный GenAI важен потому, что данные, как правило, являются мультимодальными. А попытки простого объединения одномодальных моделей для поддержки мультимодальных приложений GenAI часто приводят к задержкам и получению менее точных результатов, что ухудшает качество работы.
LLM с открытым кодом
LLM с открытым кодом повышают эффективность внедрения генеративного ИИ за счет демократизации коммерческого доступа и оптимизации моделей для конкретных задач и вариантов использования. Кроме того, они открывают доступ к сообществам разработчиков на предприятиях, в научных кругах и других исследовательских подразделениях для достижения общих целей по улучшению и повышению ценности моделей. LLM с открытым кодом помогают ужесточить контроль за конфиденциальностью и безопасностью, добиться прозрачности моделей, использовать совместные разработки и снизить зависимость от конкретных поставщиков. В конечном итоге предприятия получают более компактные модели, обучать которые становится проще и дешевле.
Предметно-ориентированные модели
Предметно-ориентированные модели GenAI оптимизированы для нужд конкретных отраслей, бизнес-функций или задач. Они улучшают согласование вариантов использования ИИ на предприятии, обеспечивая при этом повышенную точность, безопасность и конфиденциальность с учетом нужного контекста. По сравнению с моделями общего назначения такой подход уменьшает потребность в промпт-инжиниринге и снижает риск возникновения «галлюцинаций» в процессе целенаправленного обучения. Появление моделей, ориентированных на конкретную предметную область, будет способствовать более широкому внедрению GenAI, поскольку организации смогут применять их в тех случаях, когда модели общего назначения недостаточно эффективны.
Автономные агенты
Автономные агенты представляют собой системы, способные достигать определенных целей без вмешательства со стороны человека. Для выявления закономерностей, принятия решений, определения последовательности действий и получения результатов ими используются различные методы искусственного интеллекта.
Автономные агенты способны самообучаться и самосовершенствоваться, что позволяет им справляться со сложными задачами. Их независимая работа и способность самостоятельно принимать решения помогают улучшать бизнес-операции, повышать качество обслуживания клиентов и внедрять новые продукты и сервисы. Задача персонала в этом случае сводится к выполнению контрольных функций.