Развертывание «Платформы данных и глубокой аналитики» для групп «УралХим» и «УралКалий» стало составной частью стратегии цифровой трансформации с целью создания экосистемы работы с данными: сбор, обработка и хранение для поддержки бизнес-инициатив, а также разработка цифровых двойников и внедрение сервисов прогнозной аналитики для процессов и активов компании. Дмитрий Шведов, заместитель руководителя департамента цифровизации компании «УралХим» и номинант на премию Data Award 2022 рассказывает о создании платформы и ее роли в развитии цифровых инициатив предприятия.
Когда и почему был начат проект?
«УралХим» — большая производственная структура, где специалисты многих подразделений постоянно заняты расчетами и анализом информации. Каждый день им поступают просьбы предоставить текущие сведения по произведенной продукции, маржинальности, расходам, подготовить финансовые сводки по проектам, ключевым финансовым показателям и пр. В 2020 году стало ясно, что количество запросов на аналитические сервисы резко увеличилось, что потребовало оперативного принятия управленческих решений. Для снижения участия человека в процессе обработки данных, сокращения времени на коммуникации, требуемого для процесса «вопрос — обработка — ответ» и предоставления по запросу необходимой информации в нужное время, было принято решение о создании платформы данных и глубокой аналитики. Такая платформа обеспечивает получение требуемой информации из корпоративного хранилища. Создание единой платформы снижает стоимость владения данными за счет их повторного использования сотрудниками разных бизнес-направлений. С помощью компонентов платформы решается задача учета данных, обеспечения их сохранности и защиты от несанкционированного доступа. Кроме этого решаются задачи управления качеством данных, включающие улучшение их сопоставимости на базе НСИ и предоставления корпоративной (интегрируемой) информации за счет мастер-данных. Процессы интеграции между информационными системами обеспечиваются качественными корпоративными данными. Для проведения аналитики формируются витрины данных для сотрудников компании, которым предоставляются наборы для создания и обучения цифровых моделей. За 2021 год в корпоративное хранилище был загружен большой объем информации, что позволило на основе достоверных данных выполнять бизнес-анализ и по ключевым показателям строить прогнозные модели, реагирующие на любое внутреннее или внешнее изменение для получения объективной и независимой оценки.
Дмитрий Шведов: «Важно, чтобы в ходе проекта не только создавалась аппаратно-программная инфраструктура, но и новые цифровые сервисы: модели, наборы данных для прогнозной аналитики, а также цифровые двойники оборудования» |
Какие принципы были взяты за основу при проектировании платформы?
Для реализации проекта был выбран подход на основе гибридного размещения компонентов платформы данных. Сервисы для каждой из подсистем могут размещаться в облачной или в локальной инфраструктуре «бесшовно» связанных между собой, что обеспечивает гибкость при распределении нагрузки и предоставлении сервисов по обработке и хранению данных. При создании платформы мы руководствовались принципом единого управления данными — обеспечение сквозного процесса в рамках всех операционных процессов компании; принципом вовлеченности — разработка и внедрение соглашений о качестве данных совместно с владельцами данных. Не менее важен был также принцип непрерывности: управление данными — это непрерывный процесс и нельзя допускать деградации моделей и структуры данных.
Что включает архитектура платформы?
Платформа включает в себя подсистему сбора данных на основе экосистемы Apache, подсистему управления и описания данных на основе решений Informatica Axon и Atlassian, подсистему хранения на основе продуктов Microsoft, PostgreSQL и облачных сервисов Sbercloud, а также лабораторию ИИ — Jupyter и Sbercloud ML Space. При выборе подобных инструментов в первую очередь учитывалась их универсальность — возможность использования для работы с различными типами и объемами данных и, конечно, стоимость владения и поддержки инструментов и компонентов платформы. Кроме этого оценивалась вендоронезависимость — возможность быстрой замены одного компонента на другой. Важно, что компоненты платформы позволяют обеспечить самостоятельную работу «гражданских» аналитиков из бизнес-подразделений. В мае 2022 года был запущена корпоративная Школа аналитика данных, в которой проходят обучение более 500 сотрудников компании. На занятиях рассказывается про подходы и инструменты работы с данными. Курс состоит из трех блоков: теоретическая часть, демонстрация инструментов работы с данными, работа над собственными проектами в группах, используя знания и self-сервисы платформы данных (ETL, BI, RPA). После успешного обучения в школе и защите собственных проектов сотрудники получают дипломы «Гражданского аналитика». «Продвинутым» бизнес-аналитикам платформа предоставляет средства обучения прогнозных моделей на основе накопленных наборов данных в корпоративном хранилище данных, например, динамика по показателям бизнес-функций компании.
Функциональная архитектура платформы |
Как взаимодействуют «традиционная» и облачная часть платформы?
Платформа данных строится на основе взаимодействия облачных сервисов и локальной инфраструктуры. Локальные компоненты отвечают за сбор данных из внутренних информационных систем компании, обеспечивают хранение наиболее чувствительных данных и участвуют в интеграционных процессах компании. Облачные же компоненты позволяют оперативно регулировать потребление вычислительных мощностей и использовать сервисы для сложных расчетов больших объемов данных, а также для разработки и обучения цифровых моделей. Кроме того, в облачных сервисах SberCloud оптимально размещать «холодное» хранилище и исторические данные компании.
Какова роль этого проекта для компании?
Важно, что в ходе проекта не только создается инфраструктурная часть, но и формируются цифровые дата-сервисы, а также проверяются гипотезы, например модели: прогноз валютного риска, дебиторской и кредиторской задолженностей, роста цен на готовую продукцию на основании внешних факторов, объема запаса ТМЦ на складах. На первой линии поддержки пользователей работает искусственный интеллект, который автоматически по тексту заявки пользователя определяет рабочую группу ответственных за выполнение заявки. Кроме этого появилась возможность на основе исторических данных создавать цифровые двойники оборудования, которые позволяют заблаговременно обнаруживать проблемы в работе и предупреждать о вероятности поломок.
Каковы успехи в создании цифровых двойников?
В 2021 году было подготовлено и протестировано девять цифровых моделей, часть из которых в начале 2022 года были переведены в промышленную эксплуатацию, например, в функции HR запущена модель ONA (организационный сетевой анализ), в функции «Финансы» — прогноз показателя «Объем производства» и др. Сейчас мы планируем реализовать еще два десятка пилотов по ключевым бизнес-направлениям «УралХима».
Где, благодаря платформе данных, был достигнут заметный бизнес-эффект?
Внедрение системы управления качеством данных позволило бизнес-экспертам выявить некорректные данные, ранее поступающие через интеграционную шину информационных систем, что отрицательно сказывалось на доверии к данным. Теперь бизнес-подразделения полностью доверяют данным из платформы и используют ее как независимого «эксперта». В разы сократилось время подготовки аналитических записок руководству, бизнес-экспертам теперь требуется меньше времени на получение необходимой информации из платформы. Теперь показатели рассчитываются автоматически и через сервисы принятия решений доступны бизнес-пользователям, например, доля внешнего электронного документооборота с контрагентами по каждому сотруднику, участвующему в процессе, сравнение ключевых показателей между фактом, бизнес-планом, оперативным планом.
Перспективы развития платформы?
Внедрение платформы данных и глубокой аналитики — важный шаг, приближающий «УралХим» к переходу в класс компаний, управляемых данными. За 2021 год мы совместно с бизнес-функциями запустили четыре продуктовых команды (функциональные группы), создали более 100 аналитических приложений, оперирующих с более чем 450 показателями эффективности бизнес-подразделений. В 2022 году мы продолжаем развивать аналитические показатели и вовлекать еще больше сотрудников компании в их создание, в том числе и через обучение во внутренней школе аналитика данных. Сосредоточимся на автоматизированной проверке качества данных в корпоративном хранилище данных, а также на разработке прогнозных моделей по нашим ключевым показателям. Планируется пилот подхода получения бизнес-пользователями наборов данных из интегрированного слоя данных через маркет-данные, запуск чат-бота, через который можно будет получать ответы на вопросы по показателям компании, все это должно еще больше увеличить скорость получения аналитики по показателям. Что касается организационной составляющей, то сейчас мы создаем Центр компетенций по развитию сервисов поддержки принятия решений, в задачи которого входит управление портфелем текущих сервисов в бизнес-функциях и определение вектора их развития.
Николай Смирнов (nsmirnov@osp.ru) — главный редактор портала "Директор информационной службы", председатель оргкомитета премии Data Award (Москва).