Технологии распознавания речи до сих пор воспринимаются скорее как диковинка, чем как серьезный инструмент. Почему вы убеждены, что они найдут свое применение на предприятиях?
По ряду причин. Во-первых, это глобализация экономики и Internet. Если какая-то компания хочет открыть представительство, допустим, в Китае, ей не обойтись без системы перевода с одного языка на другой.
Во-вторых, голос человека - самый естественный интерфейс для общения с любым устройством или программой, какой только можно придумать. У нас есть системы речевого ввода, распознающие китайский, японский, арабский, французский, португальский и другие языки. По сравнению с клавиатурой такие системы гораздо более универсальны. Мы собираемся выпустить также программы, распознающие мандаринское и кантонское наречия китайского, согласованные с локализованными клавиатурами и снабженные функциями адаптации к конкретной предметной области, в которой работают пользователи.
Обычно залогом успеха речевых технологий называют простоту в обращении с ними. Есть ли еще что-то?
Да. Снижение операционных издержек. Если, например, мне удастся существенно сократить их путем использования голосовых интерфейсов, я обязательно возьму их на вооружение.
Можете ли вы привести пример такой экономии?
Медицинский рынок. Ежегодно на заполнение бланков со слов пациентов тратится по нескольку миллиардов долларов. Благодаря применению речевых технологий эти расходы можно будет существенно сократить. Кроме того, повысятся качество и продуктивность, что очень важно. То же можно отнести к любым организациям, использующим бланки.
Есть ли еще какие-то сферы применения речевых технологий, кроме заполнения форм?
Конечно. Искусственный интеллект или понимание естественной речи - технологии, обеспечивающие возможность расшифровки и обобщения огромных объемов информации.
На мой взгляд, это именно те области, для которых совершенствование речевых технологий очень важно. Системы искусственного интеллекта - это следующий этап развития технологий понимания естественного языка.
В любой современной компании объем неструктурированной информации быстро растет. Одна из главных функций СУБД Oracle, например, заключается в обеспечении полного и эффективного доступа к такой информации.
Все основные достижения нашей компании в области речевых технологий связаны с искусственным интеллектом и основаны на понимании естественного языка и методиках осуществления доступа к неструктурированной информации, которой всегда больше, чем структурированной.
В страховых компаниях объем структурированной информации очень велик. Однако в повседневной работе предприятия неструктурированные данные, поступающие ежедневно из разных источников, играют гораздо более важную роль.
Как показали проведенные GartnerGroup исследования, перед принятием решения всегда приходится изучать огромные объемы информации, зачастую неструктурированной.
Так вот, технология понимания естественного языка позволит вам очень быстро просмотреть всю эту информацию и извлечь при помощи интеллектуальных агентов все необходимые сведения. На мой взгляд, использование средств понимания естественного языка и систем искусственного интеллекта пригодилось бы в любой компании.
В каких еще крупных областях будут использоваться речевые технологии?
В этом плане интересен рынок карманных компьютеров огромной вычислительной мощности с голосовым интерфейсом ввода и вывода информации. Очень большие возможности таит в себе рынок компьютерных систем перевода, понимающих естественный язык.
Кроме того, синтез речи - технология, позволяющая компьютеру «говорить» человеческим голосом. В этой области мы опережаем все крупнейшие лингвистические лаборатории мира. Мы представили наши технологии на Comdex и собираемся выпустить коммерческие продукты уже в начале 1999 года.
Любая крупная корпорация, продающая свою продукцию по всему миру, должна адаптировать ее к местной культуре и местным языкам. В этой области мы располагаем огромным опытом и видим для себя большие перспективы. Мы считаем, что развитие технологий понимания естественного языка пойдет в двух направлениях - в области пользовательских интерфейсов и в области компьютерных лингвистических систем.