«Вкусно – и точка» создала платформу данных на импортонезависимом стеке, позволившую централизовать предоставление сервисов по аналитике и прогнозным моделям. В результате у бизнеса появились новые возможности и средства поддержки принятия решений. О реализации проекта рассказывает Павел Медведев, директор департамента информационных систем управления данными ООО «Технологии – и точка» и номинант на премию Data Award.
- Что представляла собой инфраструктура для работы с данными до начала проекта?
До старта проекта в компании использовалась децентрализованная система сбора и обработки данных. Она включала в себя несколько серверов, размещенных в офисе, которые отвечали за сбор, обработку и анализ информации из 920 наших предприятий в 65 субъектах России – от Калининграда и до Владивостока. Мобильные данные собирались другой системой, но уже в облаке. Собранные данные из всех наших источников нигде не объединялись и не обрабатывались вместе. Поэтому часть отчетов формировалась в одной системе, часть – в другой, а некоторые аналитические задачи и вовсе передавались сторонним подрядчикам.
- Какие возникали проблемы? Чем не устраивала ситуация?
До модернизации мы сталкивались с серьезными ограничениями. Основная проблема заключалась в неспособности системы обрабатывать большие объемы детализированной информации – например, детализированные транзакции из кассовых систем. Вместо этого приходилось полагаться на готовые агрегированные отчеты из кассовых систем.
Приложение собственной разработки по анализу данных было значительно ограничено в части визуализации данных. Часть отчетности строилась в облачном Power BI, но здесь мы видели риски того, что чувствительные данные компании передавались во внешнее иностранное облако. Из-за отсутствия своей команды разработки компания была вынуждена постоянно обращаться к сторонним подрядчикам для подготовки «красивых» дашбордов и отчетов. Также отсутствовали возможности для машинного обучения, контроля качества данных и интеграции между разными платформами.
Ситуация стала критической в 2022 году, когда еще наложились внешние факторы. Во-первых, McDonald’s ушел из России и прекратил предоставлять аналитические сервисы по прогнозированию, которые мы ранее использовали. Во-вторых, уход с рынка Microsoft лишил нас Power BI – ключевого инструмента для анализа чековых данных мобильного приложения. В-третьих, перед бизнесом встали новые задачи, требовавшие обработки значительно больших массивов информации в сжатые сроки. Все это стало предпосылками для перехода на современные отечественные технологии обработки и анализа данных.
- Какой подход был выбран для решения задачи?
Было принято решение о комплексной трансформации ИТ-ландшафта с помощью платформенного подхода. Вместо старых разрозненных решений мы создали 8 новых систем на современном технологическом стеке и импортозамещенных продуктах. Одна из них – как раз платформа данных, которая стала единственной централизованной системой для обработки и анализа данных.
- Какие цели были поставлены перед проектом?
Проект должен был решить три ключевые задачи: избавиться от зависимости в западном ПО через полное импортозамещение, обеспечить бизнес комплексной аналитикой для принятия стратегических и тактических решений на основе данных и с акцентом на удобную визуализацию, а также сформировать внутренние экспертные компетенции, чтобы исключить необходимость обращения к внешним подрядчикам.
- Какие платформы были выбраны для реализации проекта и почему?
Внутри платформы были созданы все компоненты для обработки и анализа данных: DWH (хранилище данных), ETL (сбор и загрузка), DC (глоссарий и каталог данных), BI (дашборды и отчеты), ML (задачи прогнозирования), DQ (качество данных), ESB (интеграционная шина), self-service аналитика, MDM (мастер-данные).
При выборе программного обеспечения предпочтение отдавалось отечественным разработкам или решениям с открытым исходным кодом. В результате хранилище данных построено на Arenadata DB и Arenadata QM, процессы ETL – на Apache Airflow, в качестве каталога данных и инструментов обеспечения их качества использован Arenadata Catalog.
Также применяется MDM-система «Гармония» одноименного разработчика и интеграционная шина Arenadata Streaming. Средства BI реализованы на Apache Superset и Plotly Dash. Self-service аналитика является нашей собственной разработкой, ML-модели реализуем на различных оpen source решениях.
Вендоры были выбраны, исходя из их опыта успешных внедрений. Также мы обращали внимание на предоставление поддержки, чтобы не остаться один на один с ошибками в их продуктах.
- Какими ресурсами, в какие сроки реализован проект?
Проект по созданию новой платформы данных был реализован в рекордные сроки – всего за один год, включая разработку первых прикладных задач. Для достижения такой скорости пришлось масштабировать команду: за этот период штат специалистов вырос с нуля до 35 человек благодаря активной работе рекрутеров, которые вели поиск кандидатов круглосуточно. Кроме того, ключевую роль сыграло привлечение опытных подрядчиков, уже имевших успешный опыт разработки и внедрения подобных решений.
В результате компания не только получила работающую платформу, но и сформировала собственную профессиональную команду, что стало стратегическим преимуществом и вывело организацию на новый уровень развития.
- Что собой представляет созданная платформа данных?
Для конечных пользователей платформа, вместе со всеми технологическими компонентами, стала современным инструментом для анализа данных по разным направлениям бизнеса.
Сейчас мы не только собираем данные из существовавших ранее источниках, но и собираем данные, которые раньше не могли обрабатывать из-за технических ограничений. Также мы подключили новые источники, данные из которых ранее не собирались в компании. Это существенно расширило аналитические возможности компании. Вместе с созданием платформы данных произошел технологический качественный рост в обработке и анализе данных.
- Что получилось особенно удачно?
Создание платформы данных в целом прошло удачно. Нам помогли и накопленный опыт по внедрению подобных систем, и готовность наших вендоров предоставлять качественное программное обеспечение, и команда высококлассных специалистов, собранная несмотря на дефицит кадров на рынке, и поддержка бизнеса. Все это вместе позволило добиться результата.
- Какие бизнес-решения уже удалось построить на созданной платформе данных?
На созданной платформе данных уже работает целый ряд бизнес-решений. В их числе – система прогнозирования продаж готовой продукции и финансового планирования. Для HR-направления реализована аналитика и оптимизация численности штата. Отдельно настроен анализ отзывов и рекомендательная система для гостей. Также платформа поддерживает маркетинговую аналитику.
- В каком направлении будет развиваться платформа данных?
У нас большие планы по развитию платформы. У нас готова стратегия развития на три года вперед, которую мы каждый год пересматриваем и актуализируем под новые вызовы и реалии. В нашем бэклоге сейчас более двухсот задач, но прежде всего мы фокусируемся на трех ключевых направлениях.
Во-первых, мы активно работаем над развитием self-service аналитики. Это позволит сотрудникам из маркетинга, финансов и производственных подразделений самостоятельно делать необходимые отчеты и аналитику, не обращаясь каждый раз в ИТ-отдел.
Во-вторых, мы совершенствуем систему персонализации предложений для гостей, ведь они – наш приоритет. Сейчас авторизованные пользователи в мобильном приложении и на киосках уже получают рекомендации на основе истории покупок. Но мы работаем над тем, чтобы сделать эти предложения еще более точными и релевантными.
В-третьих, мы внедряем рекомендательную систему для руководителей предприятий. На основе данных моделей прогнозирования и систем «Умного зрения» мы сможем давать рекомендации руководителям, когда нужно увеличить количество сотрудников в зале и на кухне во время наплыва гостей, как точнее спланировать найм сотрудников, контролировать количество сотрудников на линиях производства и предлагать оптимальные конфигурации расстановки сотрудников по линиям. Это поможет улучшить качество обслуживания и сделать посещение наших предприятий еще более комфортным.