В конце прошлого года в Банке Санкт-Петербург завершился крупный инфраструктурный проект, по результатам которого ряд критичных платформ и бизнес-сервисов были переключены с локального хранилища данных на централизованную платформу управления данными. Среди них — кредитный конвейер, система маркетингового взаимодействия с клиентами, система поддержки корпоративного кредитования и другие. О реализации проекта и его роли для бизнеса рассказывают Ян Гузов, CDO, и Глеб Смирнов, Data CTO Банка Санкт-Петербург, — номинанты на премию Data Award.
- В прошлом году вы рассказывали о создании единой платформы данных в концепции Lakehouse. Какие ключевые события произошли с тех пор?
Ян Гузов: Начну с современных трендов. Банк активно включился в повестку внедрения искусственного интеллекта, и сейчас мы прорабатываем инфраструктурные и архитектурные задачи организации данных и интеграций для ИИ. Есть успехи и интересные решения, о которых планируем рассказать в будущем.
Если говорить про операционную работу, то можно уверенно заявить, что платформа данных стабилизировалась и заработала как конвейер дата-продуктов. Мы выстроили процессы и видим, как растет спрос и скорость поставки данных для бизнеса. Показательно, что на источники данных платформы переезжают критичные бизнес-сервисы. Это говорит о зрелости и стабильности внедренного решения. Параллельно мы продолжаем централизацию ландшафта данных для снижения его стоимости. Все эти эффекты ярко проявились в новом крупном проекте по миграции бизнес-функционала на платформу данных, который стал следующим этапом развития платформы.
- Насколько этот проект оказался важным для банка, каким оказалось его влияние?
Я.Г.: Во-первых, проект напрямую повлиял на скорость вывода изменений в бизнес-сервисы. Каждая доработка в кредитном конвейере или маркетинговых сценариях – это новые продажи, рост конверсии и дохода. Во-вторых, бизнес получил качественно новые возможности: больше данных, поддержку стриминга, готовность к сценариям реального времени и ML/ИИ, масштабируемость без архитектурных ограничений. В-третьих, существенно выросла стабильность сервисов. Ранее они работали на локальном источнике. Теперь все ключевые сервисы переведены на централизованные источники данных. И, наконец, важный фактор – импортозамещение. Локальное хранилище работало на стеке Microsoft SQL Server, который больше не поддерживается в России. Переход на новый стек снизил технологические и регуляторные риски и открыл возможности для развития.
Но главный результат – банк получил масштабируемую платформу, которая позволяет расти без технологических ограничений.
- Что сейчас представляет собой платформа управления данными?
Глеб Смирнов: У нас была внедрена централизованная Платформа управления данными (ПУД) в концепции Lakehouse с использованием дистрибутива Arenadata Hyperwave. Ключевая задача заключалась не просто в переносе данных, а в создании единого управляемого контура данных, который обеспечивает полный цикл: от загрузки и очистки до предоставления витрин в онлайн- и офлайн-сервисы. Сейчас платформа аккумулирует данные практически по всему жизненному циклу клиента и продукта. Основными источниками являются данные АБС и CRM. В ходе проекта было разработано несколько десятков высоконагруженных витрин и почти 1 тыс. атрибутов данных.
До проекта ключевые сервисы питались из локального хранилища на базе MS SQL, которое не поддерживало стриминговые сценарии, не позволяло гибко масштабироваться и было технологически ограничено. После перехода на ПУД эти проблемы устранены: данные централизованы, устранены дубли и рассинхронизация, обеспечена готовность к real-time сценариям и архитектура стала масштабируемой под рост нагрузки.
Важно подчеркнуть, что архитектура создавалась не «ради технологии», а под конкретные бизнес-задачи: поддержка кредитного конвейера с требованиями к высокой скорости отклика, обеспечение маркетинговых триггерных сценариев, формирование витрин для поддержки корпоративного кредитования, возможность быстрого запуска новых продуктов и кампаний.
Сегодня ПУД – это не просто хранилище. Это операционный слой бизнеса, который обеспечивает стабильную работу ключевых сервисов, сокращает время вывода изменений, готов к интеграции ML/ИИ, позволяет банку масштабироваться без архитектурных ограничений.
- Приведите пример сервисов, которые заметно повысили свою эффективность с использованием новой платформы. О каких изменениях в показателях идет речь?
Я.Г.: Мы получили инфраструктурную основу для роста ключевых направлений бизнеса. В розничном и корпоративном кредитовании ускорение доступа к качественным и консолидированным данным позволило сократить цикл принятия решений и повысить пропускную способность кредитного конвейера. Это напрямую влияет на объем выдач и процентный доход.
В маркетинге платформа дала возможность строить более точные сегменты и запускать персонализированные триггерные коммуникации практически без задержек, что повышает конверсию и эффективность кампаний. Бизнес получил возможность быстрее тестировать гипотезы, запускать новые продуктовые предложения и масштабировать успешные сценарии.
Кроме того, централизация данных снизила операционные риски и повысила предсказуемость работы критичных сервисов. В результате проект стал не ИТ-инициативой, а фактором повышения доходности, управляемости и устойчивости бизнеса в целом.
- А какие продукты и сервисы стали принципиально возможными после появления новой платформы?
Г.С.: В первую очередь, стали возможны стриминговые сценарии и сервисы, то есть когда «горячие» данные с источников практически без задержки подхватываются в бизнес-сервисами банка. Также за счет наличия на платформе данных из различных источников появилась возможность использовать больше атрибутов по клиентам и продуктам и повысить точность персонализированных и автоматических коммуникаций с клиентами.
Стоит отметить, что созданные в рамках проекта витрины стали активно использоваться сотрудниками из бизнеса для анализа и разработки новых продуктов.
Часть аналитических витрин и приложений была реализована на уровне BI-системы поверх централизованных витрин данных. Экспертизу по построению прикладных витрин и поддержке BI-ландшафта банк реализовывал при участии внешнего партнера BI Consult, что позволило ускорить внедрение прикладных сценариев без изменения общей архитектурной стратегии банка.
- Какие бизнес-эффекты вы можете особо отметить?
Я.Г.: Начну с главного. После перехода на новую платформу данных скорость доработки витрин данных и сервисов для бизнеса выросла на 30%. Это значит, что банк быстрее вносит изменения в продукты для рынка и быстрее проводит коммуникации с клиентами. Это косвенно влияет на рост доходов от кредитования и транзакционной активности клиентов.
Также проект дал прямой экономический эффект в виде снижения совокупной стоимости владения ландшафтом данных на 20% за счет вывода из эксплуатации большого локального хранилища данных.
Есть и другие прикладные эффекты. Во-первых, повысилась точность управленческих расчетов и снизилось количество расхождений между различными версиями отчетности. Централизация витрин и атрибутов позволила устранить дублирование логики и уменьшить зависимость от локальных расчетов. Во-вторых, сократилось время реакции на изменения регуляторных требований и внутренних методик.
Наконец, после перехода на новый технологический стек и проведения импортозамещения банк обеспечил непрерывность работы BI-сервисов и минимизацию регуляторных рисков. Поддержание аналитического контура в рабочем состоянии в период трансформации стало важным фактором стабильности бизнеса.
- А что ожидается в ближайшем будущем?
Я.Г.: В ближайшей перспективе ожидается рост конверсии в продажах за счет более точного и оперативного офферинга, а также увеличение дохода от кредитования благодаря ускорению процессов принятия решений.
- Каково значение проекта для отрасли?
Г.С.: В банковской среде часто складывается ситуация, когда каждый бизнес-сервис живет на собственных слоях данных, нередко с дублированием данных и накоплением технического долга. Мы показали, что даже в крупном банке возможно перевести критичные высоконагруженные системы: кредитный конвейер, маркетинг, поддержку корпоративного кредитования, – на единый централизованный источник данных без потери скорости и с измеримыми эффектами.
Отраслевое значение проекта заключается в подтверждении того, что централизация данных может повышать, а не снижать гибкость бизнеса, а дата-офис может быть драйвером доходности, а не только сервисной функцией.
- Что выделяет ваш проект?
Я.Г.: В первую очередь, масштаб и модель реализации. Мы перевели сразу несколько критичных, высоконагруженных бизнес-сервисов на единый контур данных без остановки бизнеса и без потери производительности. Проект охватил одновременно архитектуру, процессы поставки данных и организационную модель работы. Наша небольшая команда дата-офиса обеспечивает полный цикл работ: интеграцию, трансформацию, разработку витрин и сопровождение сервисов. Это позволило сократить разрозненность решений, убрать дублирование логики и создать единый стандарт работы с данными внутри банка.
Дополнительная уникальность – в технологиях. В банке функционирует единая платформа данных на стеке Arenadata Hyperwave, на которой решается весь спектр задач – от классических высоконагруженных витрин данных до песочниц для задач ML/ИИ. Фактически мы создали не просто хранилище, а промышленный слой данных, который обеспечивает масштабируемость, устойчивость и готовность к дальнейшему развитию без повторной архитектурной перестройки.
- Что дальше? Каковы направления дальнейшего развития проекта?
Я.Г.: Проект уже завершился и плавно перешел в операционную работу. Здесь нам важно обеспечивать бесперебойность и выдерживать принятые SLA по доработкам и поставке данных.
Если говорить про новые направления развития, то это сценарии реального времени и внедрение ML/ИИ-моделей в прикладные сервисы банка, а также использование ИИ-агентов для расширения self-service возможностей бизнес-подразделений. Платформа уже обеспечивает необходимый уровень качества и консистентности данных для решения таких задач.
Еще одним важным направлением остается дальнейшая оптимизация TCO ландшафта данных за счет перехода к раздельному масштабированию серверов под хранение и вычисления и управления температурой данных.