Специалисты МТИ автоматизировали важный этап машинного обучения, который обычно выполняется вручную, — выбор (конструирование) признаков, имеющих значение для прогнозирования. Ученые продемонстрировали модель, способную автоматически находить в наборе данных медицинского исследования признаки, свидетельствующие о расстройстве голосовых связок.
Данные собирали в течение недели при помощи нашейных акселерометров среди 50 здоровых участников и такого же количества имеющих узелки голосовых связок. Устройства регистрировали все моменты, когда носитель пользовался голосовыми связками, и сохраняли данные в форме временных рядов.
В ходе экспериментов модель с помощью признаков, автоматически извлеченных из полученного набора данных, с высокой точностью классифицировала здоровых людей и пациентов с повреждениями голосовых связок.
По словам исследователей, чтобы избежать переобучения, система преобразует каждый образец в спектрограмму и с помощью нейронной сети перекодирует ее с высокой степенью сжатия. Сжатые репрезентации первоначальных спектрограмм и являются признаками. Больных от здоровых система отличает по более широкому разнообразию особенностей произношения звуков.
Систему также предполагается использовать для контроля эффективности лечения, и есть планы реализовать аналогичную модель для электрокардиограмм.