Network World, США

Широкополосные кодеки улучшают качество передачи голоса

Многие предприятия приступили к массовому внедрению технологии VoIP, рассчитывая снизить операционные затраты и повысить эффективность сетевой обработки за счет интеграции телекоммуникационных сервисов с потоками данных корпоративных информационных систем. Однако наиболее распространенные кодеки, при помощи которых осуществляется передача голоса в IP-сетях, не способны воспроизводить многие акценты и оттенки речи.

Обычная речь человека, содержащая широкий спектр звуковых частот, хорошо передается в частотном диапазоне до 10 кГц.

К сожалению, большинство VoIP-кодеков воспроизводит в лучшем случае только половину этого спектра. Голосовой кодек G.729, один из наиболее часто используемых в VoIP-системах, работает в полосе частот примерно от 200 Гц до 4 кГц. В результате значительная часть частотного спектра обычной человеческой речи им не воспроизводится.

Для минимизации объема передаваемых данных требуется кодирование оцифрованной речи, позволяющее «вписаться» в ограниченную полосу пропускания сети. Поэтому в алгоритмах, подобных G.729, применяется ряд методов кодирования, учитывающих особенности речи человека.

Как правило, эти методы рассчитаны на усредненный голос европейского мужчины. Подобная направленность технологии кодирования вместе с ограниченной полосой пропускания кодека приводят к плохой передаче речи людей азиатского происхождения из-за более высокого частотного спектра многих местных диалектов. Узкополосные кодеки приводят также к искажениям при передаче и кодировании музыки.

Для решения этих проблем разработаны кодеки с удвоенной полосой кодируемых частот. Верхняя граница диапазона широкополосных кодеков ограничена 8 кГц.

За счет удвоения полосы кодирования достигается более естественная передача речи и лучшее ее воспроизведение на удаленном конце канала связи.

Так как в большинстве случаев для воспроизведения голоса достаточно 10 кГц, широкополосные кодеки могут более точно, чем узкополосные, передавать оригинальную речь. При их использовании становится возможной также передача музыки.

Спецификации широкополосного кодека G722.2, известного также как Wideband Audio Modem Riser, разработаны комитетом European Telecommunications Standards Institute/Third Generation Partnership Project под названием Wideband ARM для применения в сотовых сетях.

Затем эти спецификации были ратифицированы группой International Telecommunication Standardization Sector, которая выпустила стандарт G.722.2 для VoIP и других приложений. G.722.2 поддерживает 9-битные потоки данных со скоростью передачи от 6,6 до 23,85 Кбит/с. Быстродействие не ниже 12,65 Кбит/с обеспечивает приемлемое качество передачи голоса.

Реальные требования

Для передачи голоса кодеку G.729 требуется быстродействие 8 Кбит/с. Но это без учета заголовков пакетов протоколов Real-time Transport Protocol (RTP), User Datagram Protocol (UDP) и IP. С учетом всех этих заголовков G.729 нужна реальная пропускная способность сети 29,6 Кбит/с, а кодеку G.722.2 — от 28,2 до 45,45 Кбит/с в зависимости от дискретизации кодирования.

При максимальной скорости данных G.722.2 немного более половины полосы пропускания отводится для передачи частотного спектра, обеспечивающего улучшенное качество воспроизведения звука.

Для обеспечения высокого качества звука широкополосных кодеков в их алгоритмах производится существенно больше вычислений, что, в свою очередь, предъявляет более высокие требования к производительности процессоров оконечных VoIP-систем.

Поэтому многие существующие VoIP-устройства не способны поддерживать широкополосные кодеки. К счастью, с ростом вычислительной мощности процессоров возможности широкополосных VoIP-коммуникаций становятся доступными во все увеличивающемся количестве недорогих устройств. 

Майкл Уорд — директор по управлению продуктами компании Trinity Convergence. С ним можно связаться по адресу mward@trinityconvergence.com.