28.11.2019
Прогноз отказов с помощью машинного обучения: «Утконос ОНЛАЙН», SAS и ФКН ВШЭ выбрали наиболее точную аналитическую модель
В сфере электронной коммерции всегда существует вероятность отмены заказа, как целиком, так и отдельных заказанных товаров. Это может произойти на любом этапе — от момента формирования заказа до непосредственно доставки. В этом случае онлайн-ритейлер недополучает прибыль, ведь на сборку, обработку и процессинг каждой покупки компания тратит ресурсы. Минимизировать эти потери позволяет аналитика покупательского поведения и построение математической модели прогнозирования вероятности и ожидаемого времени отмены заказа. Именно такая задача стояла перед участниками хакатона SAS Data Hack Platypus, организатором которого выступили компания SAS, признанный лидер в области бизнес-аналитики, «Утконос ОНЛАЙН», крупнейший игрок на рынке e-grocery, и Факультет компьютерных наук НИУ «Высшая Школа Экономики». В минувшие выходные были проведены финальные испытания.
Победу в SAS Data Hack Platypus одержал Дмитрий Федотов (FEDOTOVDN): именно ему удалось предложить наиболее точную и оптимальную модель прогнозирования отказов и рассчитать максимально приближенный к реальности временной промежуток отмены покупки. Пятёрка лидеров хакатона получила ценные призы от спонсоров и организаторов.
Хакатон SAS Data Hack Platypus стартовал 18 октября и проходил в два этапа – онлайн и оффлайн. В ходе онлайн-этапа участникам предлагалось спрогнозировать вероятность отказа клиента от заказа без учета времени и стадии формирования заказа. Для построения модели участникам предоставлялась подвыборка (sample) истории заказов клиентов за определенный период времени с бинарной целевой переменной – признаком того, что заказ был отменен клиентом. В конкурсе мог поучаствовать любой желающий. На онлайн-этапе модели на конкурс прислали 69 человек.
В финал конкурса, который проходил в Культурном центре ВШЭ, были отобраны 22 участника, авторы лучших моделей первого онлайн-этапа: 3 конкурсанта выступали в индивидуальном зачете, еще 19 – в составе пяти команд (от факультета компьютерных наук ВШЭ, от факультета вычислительной математики и кибернетики МГУ, а также сборные команды). В ходе двухдневного марафона участники должны были построить модель, способную уже не только просчитать отмену, но и спрогнозировать, за сколько часов до периода запланированной доставки это произойдет.
Конкурсанты учитывали такие факторы, как дата заказа и дата доставки. Были подтверждены гипотезы, что чем дальше срок доставки от момента заказа, тем вероятнее произойдет отмена, а в выходные дни это происходит чаще, чем в будние. Жюри высоко оценило использование участниками дополнительных внешних данных, которые могут повлиять на отмену покупки — например, погодные условия.
Финальный лидерборд был сформирован на основании точности построенных моделей, а также на возможной бизнес-применимости и оригинальности идеи, которые оценивались жюри в ходе презентаций решений участников.
SAS Data Hack Platypus помогает участникам развивать профессиональные навыки и на практике учиться применять теоретические знания. В будущем это поможет им стать востребованными специалистами — в первую очередь дата-сайентистами, которых сегодня остро не хватает во всех отраслях. Работа дата-сайентистов неразрывно связана с аналитикой в самой широкой трактовке этого слова, при этом она носит прикладной характер: на основе полученных и проанализированных данных дата-сайентистам необходимо решать конкретные бизнес-задачи.
«Цель SAS Data Hack Platypus — не просто собрать вместе единомышленников и способных студентов, чтобы предложить им выполнить какую-то абстрактную задачу. Мы стремились сделать наш хакатон максимально приближенным к реальным условиям бизнеса, поэтому и задачу ставили очень актуальную для рынка. Теоретические знания должны согласовываться с реальными бизнес-процессами. Это поможет будущему специалисту развиваться с профессиональной точки зрения. И конечно, нам важно в таких условиях знакомиться со студентами, которые, возможно, захотят пройти стажировку в SAS», — комментирует Михаил Петровский, руководитель Академической программы SAS в России и СНГ.
«Совместный хакатон с SAS стал для “Утконоса” отличной возможностью посмотреть на способы решения сложных нестандартных задач с помощью аналитики больших данных. Построение точных моделей аналитики потребительского поведения и прогнозирования отмены заказа на основе работы с большими данными открывает новые возможности для оптимизации всего бизнес-процесса и позволяет нам минимизировать убытки», — комментирует Мария Артамонова, директор по IT «Утконос ОНЛАЙН».
«Когда хакатон организовывает компания-лидер в области аналитики вместе со своим заказчиком на реальных данных – это приносит участникам двойную пользу. Во-первых, хакатоны способствуют развитию бизнес-мышления студентов, что пригодится им в будущем за стенами учебного заведения. Во-вторых, такие соревнования – это приятное времяпрепровождение с единомышленниками и возможность получить награду за свой труд. Рады были принимать гостей в новом здании на Покровке. Будем ждать еще», — комментирует Тамара Вознесенская, первый заместитель декана факультета компьютерных наук, НИУ ВШЭ.