Компания «Яндекс» представила метод машинного обучения CatBoost, среди основных характеристик которого — работа с данными из разных источников, умение переводить категориальные данные в числа, а также сокращение числа ошибок при прогнозировании не в процессе последовательных доработок модели, а сразу. В компании планируют заменить предыдущий метод машинного обучения Matrixnet на CatBoost в тех сервисах, где он будет показывать лучшие результаты, в частности, перевести на CatBoost сервис «Яндекс.Такси», а также внедрить его наравне с Matrixnet в поиск.

Библиотека машинного обучения CatBoost выложена в открытый доступ. В «Яндексе» считают, что технология имеет перспективы использования в финансовом секторе, медицине, промышленности, рекомендательных сервисах и др. Библиотека поддерживает ОС Linux, Windows и macOS и доступна на языках программирования Python и R. «Яндекс» разработал также программу визуализации CatBoost Viewer, которая позволяет следить за процессом обучения на графиках.

CatBoost выложен в открытый доступ
Источник: «Яндекс»