Mail.Ru Group запустила сервис аудиоаналитики Sounds, с помощью которого можно распознавать посторонние звуки на различных производствах и автодорогах, очищать аудиозаписи от шумов и идентифицировать людей по голосам.
Технология распознавания звуков может использоваться во множестве сценариев: распознавание отдельных звуков в аудиопотоке (крики, выстрелы, шаги, звуки разбитого стекла, плач), очистка аудиозаписей от шумов, идентификация людей по голосам, повышение четкости голоса диктора, выявление неполадок в работе механизмов. Сервис аудиоаналитики Sounds, работающий на базе нейронных сетей, позволяет решать задачи в сферах безопасности, ретейла, медиа, телекоммуникаций и др.
С помощью аудиоаналитики можно обрабатывать как архивные файлы, так и онлайн-потоки. В ряде ситуаций технология применяется как альтернатива видеонаблюдению.
Нейронные сети «компьютерного слуха» обучены на собственных датасетах Mail.Ru Group и работают на серверных мощностях компании.
Специалисты Mail.Ru Group сопровождают проект на всех стадиях реализации и дорабатывают его в соответствии с задачами заказчика.
Стоимость использования технологии в компании не раскрывают, говорят только, что тарифы рассчитываются индивидуально для каждого клиента в зависимости от задач. Итоговая цена зависит от количества обращений к API и продолжительности обработанного аудио.