ОБЩЕНИЕ с разного рода автоматизированными системами предоставления услуг — своего рода искусство. Возьмем для примера традиционный диалог с интерактивным меню при звонках в службы технической поддержки.
В этом случае вам надо длительное время слушать информацию о том, какая цифра в тональном варианте набора соответствует тому или иному виду сервиса, нажимать необходимую клавишу на телефонном аппарате и вновь слушать заунывное перечисление пунктов меню. Такой алгоритм взаимодействия с абонентом снижает нагрузку на живых операторов, но увеличивает время получения нужной справки. Кроме того, психологи утверждают, что человек начинает испытывать чувство раздражения, если время получения требуемой информации от автоматизированной системы превышает три секунды.
Если вы когда-нибудь пользовались услугами операторов IP-телефонии с помощью PIN-кодов, то наверняка вспомните, какого усердия требует безошибочный ввод длинной череды цифр. Кстати, именно данное обстоятельство служит основным барьером для ряда потенциальных клиентов. Карточная IP-телефония с ее дешевыми услугами интересна многим людям пожилого возраста, живущим на весьма скромную пенсию. Однако, не все они могут безошибочно пройти извилистый путь идентификации по PIN-кодам.
Решение указанных и ряда других проблем может заключаться во внедрении технологий распознавания речи. Эта задача не нова и над ее разрешением работают многие компании. Однако до сих пор на рынок не было выпущено ни одного коммерческого продукта, имеющего полноценную поддержку русского языка. В середине апреля компания CompTek провела специальный семинар, на котором представлялись решения компаний Intel и ScanSoft в области распознавания речи. Центральное место на семинаре заняло представление продукта SpeechPearl, который поддерживает 45 языков, включая русский.
По словам Игоря Чижа, руководителя направления компьютерной телефонии CompTek, поиски полноценного коммерческого продукта в области распознавания русской речи их компания ведет с середины 90-х годов. Для практического применения необходим достаточно гибкий и простой в использовании инструмент, который не требовал бы постоянного сопровождения и настройки со стороны разработчиков. Именно этим требованиям отвечает продукт SpeechPearl. Он обеспечивает распознавание непрерывной речи без необходимости настройки на голоса дикторов.
В настоящее время система SpeechPearl способна распознавать до 1 млн русских слов и создавать разветвленные, многорежимные приложения. В числе особенностей этой системы необходимо отметить применение метода непрерывной обработки речи и возможность прерывать воспроизводимые меню. Технология непрерывной обработки речи, разработанная компанией Intel, позволяет абоненту сохранять стиль общения с автоматической системой близким к разговору с «живым» собеседником. Этот эффект еще больше усиливает функция Barge-In, дающая возможность произносить команды не дожидаясь окончания фразы автоответчика, перечисляющего пункты меню.
На семинаре демонстрировался ряд примеров использования данного решения. В частности, был показан тестовый образец системы заказов товаров по телефону. Несмотря на то что система SpeechPearl только делает первые шаги на российском рынке, можно предсказать большой интерес к ней со стороны операторов связи и компаний, занимающихся электронной коммерцией.