В июне исследователи из МТИ представят новый язык программирования под названием Picture, который обещает радикально уменьшить объем кода программ распознавания объектов на изображениях и видеозаписях. В языке применяется относительно новый принцип программирования — вероятностный. Он позволяет более компактно реализовывать задачи высокого уровня сложности.
В частности, тестируя новый язык, исследователи смогли сократить объем программы распознавания образов с нескольких тысяч строк всего примерно до 50. Результаты разработчики планируют обнародовать на конференции Computer Vision and Pattern Recognition.
«При вероятностном программировании строятся модели, дающие общее представление о том, как выглядит, к примеру, лицо, и с их помощью делаются предположения о том, какое именно лицо присутствует на изображении», — объясняет Джош Тененбаум, профессор, специалист в области когнитивных вычислений, принимавший участие в исследовании.
Чтобы исключить необходимость выполнять большой объем вычислений, характерный для систем компьютерного зрения, в Picture применяются методы статистического анализа. По словам разработчиков языка, принцип его действия напоминает компьютерную анимацию наоборот. Программы компьютерной графики, применяемые студиями наподобие Pixar, автоматизируют создание плоских репрезентаций пространственных объектов, тогда как Picture распознает объект на плоском изображении, сравнивая его с набором моделей, показывающих, какими подобные объекты бывают вообще.
Исследователи из МТИ участвуют в программе, начатой в 2013 году DARPA, Агентством перспективных оборонных исследований Минобороны США. Ее задача — разработать вероятностные языки программирования, способствующие более широкому применению методов машинного обучения.
Многие десятилетия машинное обучение оставалось уделом научных изысканий, но сегодня его методы быстро проникают в мир бизнеса благодаря увеличившейся мощи компьютеров и появлению облачных сервисов Amazon и Microsoft.
Вероятностное программирование не требует обязательного использования машинного обучения, но позволяет упростить его применение, отметил Тененбаум.
«При чисто машинном обучении вы добиваетесь повышения результативности просто за счет сбора все большего количества данных, на которых обучается система, — продолжил он. — А вероятностный подход при распознавании изображений основан на знаниях о том, как они могут видоизменяться».
Помимо Picture, в МТИ работают и над другими вероятностными языками. Еще один из них, Venture, рассчитанный на более широкий круг применений, можно использовать для решения задач иных типов, отметил Тененбаум.