РСХБ: ИИ и аналитика на единой платформе

Россельхозбанк запустил и развивает решение RAISA — единую систему продвинутой аналитики и MLOps-платформу полного цикла. Она объединяет в себе унифицированный инструментарий для исследования данных, отработки гипотез, прототипирования, обучения и промышленного мониторинга моделей ИИ. Главной задачей при этом является внедрение ИИ-инструментов в повседневную работу сотрудников банка и организаций группы при полном соблюдении требований безопасности и конфиденциальности. О построении платформы и достигнутых результатах рассказывает Даниил Потапов, руководитель Лаборатории искусственного интеллекта Департамента больших данных РСХБ и номинант на премию Data Award.

- Что стало причиной создания платформы RAISA? Какие проблемы она должна закрыть?

Используемая ранее система ModelOps имела существенные ограничения, которые приводили к увеличению сроков вывода моделей в эксплуатацию и негативно сказывались на их качестве. Сложности с доступом к инструментам сдерживали масштабирование ИИ-решений. RAISA была призвана устранить эти барьеры, обеспечивая доступ ко всей экосистеме и предоставляя единый инструментарий для работы с различными источниками данных.

- Какие требования предъявлялись к создаваемому решению?

Мы столкнулись с типичными для крупных организаций ограничениями: разрозненные хранилища и инструменты работы с ними, отсутствие сред для экспериментов, невозможность воспроизвести сами эксперименты, отсутствие средств контроля за жизненным циклом моделей и процессов их применения, долгий вывод решений в промышленную эксплуатацию. Главная задача была в том, чтобы убрать эти барьеры.

К платформе предъявлялось пять ключевых требований. Было важно создать единую точка доступа, унифицировать подключение ко всем источникам данных банка — от озера данных до локальных баз подразделений. Требовалось реализовать полный цикл разработки: четко разделить исследовательскую среду для экспериментов и продуктивную среду, настроив между ними CI/CD-конвейер для ускорения вывода моделей. Третье требование — технологическая независимость. Хотели уйти от зарубежного ПО (SAS) в пользу open source и отечественных решений, развернутых в изолированном контуре. Также была нужна централизация компетенций — создание среды, где Лаборатория ИИ выступает центром экспертизы, а инструменты доступны широкому кругу сотрудников при регулярном обучении. Наконец, управление всем жизненным циклом (MLOps): охватить все этапы — от подключения данных и разработки до мониторинга моделей и управления модельными рисками.

В итоге требовалось создать не просто инструмент, а экосистему, которая снимет инфраструктурные барьеры и обеспечит промышленное качество ИИ-решений.

- Как подходили к выбору технологий, какие принципы пытались соблюсти?

На старте мы сформулировали для себя три главных критерия отбора технологий. Первый — 'Open Source first'. Мы сознательно избегали проприетарных решений с жесткими лицензиями, поскольку открытые платформы давали нам свободу: возможность кастомизировать код под задачи банка, независимость от вендоров и прозрачность для службы безопасности. Даже там, где использовались коммерческие продукты, мы выбирали те, которые имели открытые API и позволяли при необходимости заменить себя без боли. Второй критерий — зрелость и комьюнити. Мы не брали технологии «с пылу с жару», а оценивали размер сообщества, частоту релизов, количество успешных кейсов в крупных компаниях. Если инструмент хорошо зарекомендовал себя в индустрии (как MLflow или Airflow), это снижало наши риски. Третий критерий — удобство для разных аудиторий. Мы смотрели, насколько технология закрывает потребности конкретного пользователя: для дата-сайентистов важна гибкость и возможность писать код, для бизнес-пользователей — низкий порог входа через визуальные интерфейсы и no-code конструкторы. Если инструмент не проходил этот тест на юзабилити, мы его не брали, даже при техническом совершенстве. Эти три принципа — open source, зрелость и ориентация на пользователя — стали нашим фильтром при формировании технологического стека RAISA.

- На каких платформах в итоге реализовано решение?

Платформа RAISA интегрирована с корпоративной Lakehouse-архитектурой банка, которая объединяет возможности озера данных и корпоративного хранилища в единую аналитическую среду. Данные хранятся и обрабатываются в Lakehouse на базе Arenadata Hyperwave и Picodata, а RAISA использует этот контур как основу для аналитики и жизненного цикла ML-моделей.

Технологический стек самой платформы RAISA включает набор компонентов по нескольким функциональным областям. За аналитику, моделирование и визуализацию отвечают JupyterHub с набором опенсорсных и самописных библиотек на Python и Superset. Жизненный цикл моделей ИИ строится на MLflow, KServe, в качестве базы для модельного мониторинга мы выбрали Evidently, а реестр моделей написали сами. Процессы обработки данных реализованы на Airflow, самописных библиотеках и операторах для работы с данными (RAIL Connectors / RAIL Operators) и интегрированном в платформу кластере Spark.

- Как появление платформы RAISA повлияло на работу сотрудников? На каких процессах это отразилось сильнее всего?

Появление RAISA кардинально расширило круг сотрудников, работающих с продвинутой аналитикой. Сегодня это более 3 тыс. человек — от дата-сайентистов до бизнес-аналитиков. Платформа стала единой средой, где с данными работают специалисты разных компетенций.

Другое важное направление — разработка и внедрение ИИ-моделей. Благодаря выделению исследовательской среды и промышленного контура с CI/CD-процессами дата-сайентисты получили пространство для экспериментов, а бизнес — ускоренный вывод моделей в эксплуатацию.

Главный эффект — мы ушли от «лоскутной» автоматизации к единой промышленной среде, где и аналитик, и исследователь работают в одном контуре с одними и теми же данными, а их действия стали прозрачны с точки зрения информационной безопасности.

- Приведите пример нескольких ИИ-моделей, запущенных на платформе. Каких эффектов с их помощью удалось достичь?

Сейчас мы работаем по большей части с ML-моделями. Среди наиболее успешных бизнес-кейсов, реализованных с применением ИИ, выделяются проекты, приносящие значительный экономический эффект. Так, в сегменте работы с корпоративными клиентами разработаны и внедрены решения по прогнозированию предпочтительного канала коммуникации, наиболее контактного номера телефона, риска оттока клиентов, а также подбора наиболее релевантного продукта для кросс-продаж.

В направлении взыскания задолженности физических лиц активно применяются аналитические модели, повышающие эффективность процесса. В рамках этого бизнес-кейса определяются заемщики на стадиях soft и hard collection, спрогнозированные моделью как «безнадежные» к взысканию текущими инструментами (звонки и выезды сотрудников). Таких клиентов модель рекомендует досрочно переводить со стадии soft на hard, а с hard — на legal. По итогам внедрения модели мы увеличили эффективность и скорость взыскания задолженности за счет своевременного перевода клиента на следующую стадию, а также сократили количество звонков «безнадежным» клиентам.

Из ключевых проектов 2025 года стоит отметить систему для автоматического установления, изменения и контроля максимального остатка наличной валюты РФ в кассах и банкоматах банка. Решение оптимизирует операционную деятельность и показывает общие эффекты около 700 млн руб., которые продолжают расти.

На платформе также разрабатываются модели склонности клиентов к покупкам различных банковских продуктов, а также модели розничных и корпоративных рисков, и это важная часть перехода банка на подход на основе внутренних рейтингов (ПВР) в рамках положения ЦБ РФ 845-П.

- Какое внимание уделяется генеративному ИИ? В каких направлениях работаете? Какие проекты запущены?

Отдельная линия развития платформы включает сценарии больших языковых моделей (LLM) и поисковой дополненной генерации (RAG).

Генеративный ИИ — одно из приоритетных направлений развития платформы RAISA. Мы выделили сценарии LLM и RAG в отдельную линию и активно масштабируем это направление. Для внедрения технологий мы сформировали команду с необходимыми компетенциями, развертываем GPU-кластеры, организовали специализированное S3-хранилище для документов и выстраиваем LLMOps — процедуры управления жизненным циклом LLM-моделей в контуре банка.

Ключевой проект в этом направлении — сервис «ИИ Советникъ», который объединяет LLM Market для организации доступа сотрудников банка к внутренним моделям и широкий спектр бизнес-задач. Мы развиваем три основных направления: «умный» поиск по базам знаний и документам, работа с документами (генерация, сравнение, суммаризация) и кодогенерация для разработчиков.

- Какие из генеративных моделей показывают наибольшую эффективность с точки зрения пользы для сотрудников?

Наибольшую практическую пользу для сотрудников показывают RAG-сценарии, реализованные в сервисе «ИИ Советникъ». Общий эффект от внедрения сервиса оценивается нами в 1,4 млрд руб. в год. Наиболее востребованы три следующих сценария.

«Умный» поиск — контекстный поиск по базам знаний банка, внутренним нормативным документам, отчетам и инструкциям. Особенно ценится возможность поиска поручений по протоколам заседаний, распоряжениям и резолюциям с контролем исполнения. Это экономит часы ручной работы руководителей и секретарей.

Работа с документами — генерация типовых документов на основе шаблонов (служебные записки, должностные инструкции, уведомления клиентам), сравнение документов на наличие противоречий, сверка с актуальными версиями нормативных актов, а также суммаризация больших объемов текста (презентации, законодательные акты, судебные постановления).

Кодогенерация — это помощь разработчикам, аналитикам и тестировщикам. Она включает написание кода, его комментирование, генерация документации прямо в рабочей среде. Процесс интерактивный: сотрудник уточняет запросы и корректирует результат, что ускоряет разработку и повышает ее качество.

Эффективность этих решений измеряется не только скоростью, но и качеством: снижается нагрузка на поддержку, ускоряется адаптация новых сотрудников, уменьшается количество ошибок при обслуживании клиентов. Платформенный подход RAISA позволяет тиражировать успешные сценарии на разные подразделения, масштабируя полученный эффект.

Также генеративные модели используются в автоматизации и других ежедневных задач сотрудников: от онбординга новых сотрудников в мобильном приложении до автоматизации создания SQL-запросов и отчетов в аналитическом контуре банка.

- Какие результаты достигнуты?

На текущий момент платформу RAISA используют более 3 тыс. сотрудников банка и организаций группы, в том числе в ежедневной деятельности. В системе настроено более 40 интеграций, реализовано более 3 тыс. дата-продуктов. Лабораторией ИИ разработано более 100 моделей ИИ, а также на платформе решено 3,5 тыс. задач.

На текущий момент в банке реализован первый этап внедрения ПВР: разработаны и внедрены модели, ИТ-архитектура и системы, обеспечена автоматизация расчетов и контроль качества данных, а также проведены внутренние и независимые проверки готовности. В ближайшее время будет направлено первое ходатайство в Банк России на применение ПВР не менее чем к 30% активов, что позволит снизить регуляторные риски и повысить операционную эффективность за счет сокращения ручных процессов.

К бизнес-результатам можно также отнести сокращение числа рутинных операций, рост вовлеченности сотрудников в работу с ИИ и формирование базы для внедрения ИИ-решений в риск-анализ, клиентский сервис и обучение персонала. Общий экономический эффект на горизонте до конца 2029 года оценивается в 8,8 млрд руб.

- Что выделяет ваш проект?

RAISA демонстрирует пример построения корпоративной MLOps-платформы в изолированном контуре банка, с соблюдением требований безопасности и конфиденциальности, на базе отечественных программных компонентов. Платформа задает масштабируемую модель для финансовой организации: единый инструментарий для моделирования, аналитики и создания приложений, промышленное внедрение моделей через интеграцию с целевыми системами, а также контроль качества и мониторинг.

Таким образом, мы создали единую экосистему, объединяющую полный цикл работы с ИИ и практической аналитикой в рамках одной платформы. Система поддерживает процессы построения и тестирования моделей, их развертывание и контроль качества в промышленной среде, а также создание сервисов на основе аналитических моделей с масштабированием вычислительных ресурсов и мониторингом.

Платформа используется для подготовки аналитической отчетности в различных форматах и автоматизации отчетных процессов, заменяя разрозненные локальные процедуры и средства «малой механизации» в Microsoft Office единым набором инструментов.

- В чем роль проекта для бизнеса банка?

RAISA — это платформа искусственного интеллекта, которая создает единую промышленную основу для внедрения ИИ и аналитики. Простыми словами, это «фабрика ИИ», позволяющая банку создавать, обучать и внедрять модели машинного обучения для решения конкретных бизнес-задач.

Для бизнеса это означает переход от разрозненных экспериментов к системному повышению эффективности. Платформа дает возможность использовать передовые методы обработки больших данных для увеличения доходности продуктов, повышения удовлетворенности клиентов, сокращения затрат и оптимизации процессов, повышения скорости и качества управленческих решений, сокращения времени вывода новых продуктов.

Кроме того, RAISA обеспечивает внедрение ИИ-инструментов в повседневную работу сотрудников с соблюдением требований безопасности и конфиденциальности, а также поддерживает развитие внутренних компетенций: платформа используется широким кругом специалистов, включая аналитиков и разработчиков отчетности. Главный показатель эффективности платформы для бизнеса — именно конкретная финансовая отдача. Она становится не просто технологическим ядром, а драйвером измеримых бизнес-результатов.

- Каковы направления развития платформы?

Мы рассматриваем RAISA как ключевой драйвер ИИ-трансформации банка, поэтому развитие платформы идет по нескольким векторам.

Первое направление — демократизация ИИ. Развиваем low-code и no-code инструменты, чтобы снизить порог входа для бизнес-пользователей. В планах — self-service для самостоятельного создания ИИ-агентов подразделениями, что ускорит разработку и снизит стоимость поддержки. Второе направление — интеграция в рабочие инструменты. Расширяем присутствие платформы в повседневных средах сотрудников через браузерные расширения, интеграцию с офисным ПО и инструменты кодогенерации, чтобы функциональность была доступна прямо в рабочем процессе.

Кроме того, наращиваем мощности. Расширяем вычислительный слой для обработки данных вплоть до сотен терабайт, разворачиваем векторные базы для работы с LLM. Важную роль играет создаваемая экосистема приложений. Движемся к созданию полного спектра решений — от простых универсальных инструментов до сложных бизнес-приложений для автоматизации ключевых процессов. Наконец, новые данные и модели. Развиваем работу с геоданными, текстовыми датасетами, пилотируем LLM с возможностью рассуждений и создаем MCP-сервер для стандартизации взаимодействия ИИ-агентов.

В конечном счете RAISA должна стать средой, где создается полный спектр решений — от локальных инструментов до комплексных систем, автоматизирующих ключевые процессы банка.

РСХБ: ИИ и аналитика на единой платформе

От кликов до миллионов: как повседневные операции влияют на маржу компании