Банк «Санкт-Петербург» при поддержке интегратора GlowByte внедрил новые MLOps-инструменты для повышения эффективности работы платформы моделирования. Проект позволил ускорить цикл обновления моделей, централизовать процессы подготовки данных, обучения моделей и их развертывания, а также внедрить автоматизированную систему для управления версиями кода моделей. Об этом сообщили представители GlowByte.
В рамках проекта были внедрены инструменты Airflow, GitLab CI/CD и DVC (Data Version Control), благодаря которым происходит управление жизненным циклом моделей. Airflow обеспечивает координацию задач и автоматический запуск процессов, с помощью инструмента Gitlab CI/CD построен единый пайплайн вывода модели от стадии разработки до применения в продакшене, DVC позволяет сохранять данные в S3, а также версионировать большие файлы данных, модели и другие артефакты.
«Мы интегрировали все этапы разработки и тестирования с системой контроля версий GitLab, благодаря чему автоматизировали процессы сборки для моделей машинного обучения и процесс продуктивизации моделей, сделали прозрачной историю всех изменений в кодовой базе. Кроме того, Airflow дал возможность автоматизировать запуск batch-моделей, а также позволил оптимизировать управление ресурсами кластера Kubernetes», – пояснил Сергей Новоселов, архитектор Advanced Analytics GlowByte.
Внедрение новых MLOps-подходов повысило интерес к использованию ML-платформы, что, в свою очередь, способствовало привлечению большего числа бизнес-пользователей в банке «Санкт-Петербург».
Кирилл Светлов, управляющий директор Дирекции Казначейство ПАО «Банк “Санкт-Петербург”»: «В банке «Санкт-Петербург» ML-платформа существует уже достаточно давно. В 2024 году благодаря совместным работам с GlowByte она получила дополнительный импульс к развитию на пути к единому пространству банка для решения сложных многофакторных задач. Внедренные инструменты не только повысят эффективность разработчиков моделей, но и существенно облегчат доступность их результатов для пользователей».
В дальнейшем планируется продолжать развитие платформы, улучшая стабильность ее работы за счет более эффективного управления ресурсами в кластере Kubernetes и применения современных подходов в области машинного обучения и MLOps, в том числе инструмента MLFlow для отслеживания экспериментов с моделями.