До появления централизованной системы аналитики данные в компании использовались преимущественно для решения локальных задач: мониторинг коммерческих показателей — объемы перевозок и выручка; логистика; маркетинг, финансы и управление персоналом. Однако все эти данные работали в режиме «вчера»: отчеты формировались раз в сутки и давали картину минувшего дня, а не текущего момента. Первой зоной, где такой подход перестал удовлетворять бизнес, стало логистическое направление — в среде, где ежеминутно меняется нагрузка на склады, маршруты курьеров и статусы тысяч заказов, вчерашние данные бесполезны. Управление на местах строилось на телефонных звонках и интуиции бригадиров — по сути, на «ручном пилотировании». Компании была необходима оперативная аналитическая экосистема, способная не позже чем за час доставлять актуальные данные линейному руководителю.

Перед командой больших данных были поставлены конкретные цели. Во-первых, сформировать единый контур, в котором каждое физическое действие — будь то перемещение грузоместа или выход курьера на маршрут — оцифровывается и попадает в отчет за считанные минуты. Во-вторых, дать линейным руководителям инструмент реакции «здесь и сейчас», а не постфактум. В-третьих, повысить производительность складов и плотность доставки за счет мониторинга и прогнозных моделей. Кроме того, требовалось стандартизировать качество управления через единые метрики для всей распределенной партнерской сети группы компаний СДЭК.

Технологическая основа

К моменту старта проекта в СДЭК работало корпоративное хранилище, ежедневно пополняемое сведениями от всех внутренних систем, и имелись инструменты визуализации, которыми пользовались сотрудники компании. На этой основе требовалось спроектировать новую архитектуру и плавно перевести на нее аналитику, не останавливая текущие бизнес-процессы.

От «ручного пилотирования» к оперативной аналитике
Архитектура хранилища данных

Платформу возвели на полностью импортонезависимом стеке с открытым исходным кодом (см. рисунок). За хранение и формирование витрин данных отвечают Greenplum и ClickHouse. Потоковая обработка и передача информации реализованы на Apache Kafka и Spark. Оркестрацию процессов ведет Apache Airflow, а единым окном визуализации служит Apache Superset — на его базе разработано почти 300 активных дашбордов.

Выбор в пользу Open Source был вполне осознанным — стек открытого ПО дает ряд преимуществ: независимость от конкретного поставщика, прозрачность кода, высокий уровень безопасности и экономия на лицензиях. Рынок также демонстрировал тенденцию перехода на Open Source, что отразилось на компетенциях персонала, поэтому проблем с квалифицированными кадрами не было. У компании имелся опыт работы с проприетарными продуктами, однако, после отказа поставщиков работать в стране, от них решили отказаться.

Платформа агрегирует потоки из всех систем группы компаний СДЭК и ее партнеров. Среди ключевых категорий: операционная информация (движение грузомест, статусы заказов, телеметрия), ресурсы (геолокация курьеров, транспорт, графики выхода персонала) и клиенты (претензии, обратная связь).

Данные по единой шине поступают из корпоративной системы ERP. Каждые пять минут они считываются и записываются в «сырой» слой — это самая свежая информация. Уже на этом этапе можно строить отчеты с максимальной оперативностью. Но, как правило, команда объединяет свежий поток с историческими данными из хранилища, чтобы получить полную картину: отклонения от средних значений за предыдущие периоды, динамику и тренды.

Главное достижение проекта — массовое проникновение бизнес-аналитики во все подразделения компании. Сейчас в СДЭК данными пользуются все специалисты, кто действительно исполняет процессы «на земле»: бригадиры складов, супервайзеры курьеров, менеджеры пунктов выдачи. Параллельно в компании была выстроена единая экосистема для партнерской сети — тысячи предпринимателей получили инструменты «большого бизнеса» для роста и развития собственных точек доставки и приемки грузов.

Ключевой сложностью оказался переход на новую архитектуру без пауз в текущей аналитике. К моменту старта проекта в компании уже работало около 200 дашбордов, которыми ежедневно пользовались тысячи сотрудников — остановить их на время «сервисных работ» было невозможно. Был выстроен план пошагового обновления: для каждого объекта описывался новый процесс, проверялась корректность его работы и только после этого отключалась старая версия. В итоге менее чем за год на новые технологии было переведено 1200 операционных цепочек.

Результаты

Проект существенно повлиял на культуру работы с информацией в компании. Данные стали доступны на складах и курьерских базах. Число активных пользователей платформы (Monthly Active Users, MAU) превысило 10 тысяч, или 23% всей штатной численности компании.

Были получены и конкретные бизнес-эффекты. В складской логистике внедрено почасовое прогнозирование грузопотока с детализацией по категориям: короба, пакеты, негабарит. Благодаря этому на 8% оптимизировался фонд оплаты труда склада за счет вывода персонала строго под реальную нагрузку. В управлении доставкой компания полностью ушла от координации курьеров «по телефону» — супервайзер теперь видит план и факт в режиме реального времени. Показатель «не сданные грузы по заявкам» снизился до 4%, а контроль за срочными отправлениями стал заметно точнее.

Скорость реакции на операционные проблемы выросла кратно — время обнаружения инцидентов сократилось с суток до 15–60 минут. Средний срок доставки в 2025 году уменьшился на 9% по сравнению с предыдущим годом.

В финансовом выражении эффект также был ощутим. Например, дашборд менеджера клиентского офиса — единое окно, в котором отображаются количество необработанного груза по категориям, процент выполнения дневного плана и сообщения от других офисов, — экономит теперь каждому сотруднику 15 минут в день. При более чем 5000 точках выдачи только этот инструмент высвобождает 1250 человеко-часов ежедневно.

Для бизнеса в целом проект стал фундаментом трансформации СДЭК из классического логистического оператора в технологическую компанию. Операционные процессы стали прозрачными и понятными для менеджмента и партнеров — каждое решение об изменениях теперь верифицируется конкретными показателями. Тысячи партнеров получили инструменты корпоративного уровня, что помогло выровнять стандарты качества сервиса группы компаний СДЭК по всей стране. Кроме того, точное планирование улучшает условия труда курьеров и складского персонала: снижается уровень стресса, сокращаются переработки, а связь результата с оплатой становится прозрачной.

Развитие платформы продолжается по трем направлениям. Первое — расширение охвата: перевод на оперативную аналитику все большего числа процессов, для которых критична скорость реакции. Второе — синергия: объединение данных из разных систем компании для получения максимального эффекта. Третье — прогнозная аналитика: предсказание событий на горизонте часа, рабочей смены или суток для принятия решений не постфактум, а на опережение. 

***

Логистика — это бизнес, в котором цена задержки информации равна цене потерянного клиента. Пока данные приходят с опозданием, решения на местах принимаются вслепую, а ресурсы распределяются по наитию. Платформа оперативной аналитики группы компаний СДЭК позволила до нескольких минут сократить задержку от события до отчета. Кроме бизнес-преимуществ и финансовых эффектов, применение платформы способствовало повышению общей культуры работы с данными.

Дмитрий Ширшаков (d.shirshakov@cdek.ru) — руководитель департамента больших данных СДЭК, лауреат премии Data Award 2026 (Москва).