Производимые с помощью этой службы телефонные вызовы могут скоро получить постоянную прописку в корпоративных сетях. Готовы ли вы к этому?
В классическом телефонном мире разговоры становятся все дешевле. Конкурентное давление со стороны альтернативных операторов связи, компаний кабельного ТВ и большого количества операторов беспроводной связи резко снизило стоимость дальних телефонных звонков. Эту тенденцию усиливают бесплатные телефонные услуги на базе Internet. Они были добавлены к приложениям немедленного обмена сообщениями (Instant Messaging, IM), таким, как Microsoft MSN Messenger, Yahoo Messenger, а также ICQ Phone и Instant Messenger от AOL, и позволяют делать бесплатные звонки с ПК на телефон и с ПК на ПК с помощью различных функций обмена сообщениями.
Вероятно, именно рост популярности телефонных вызовов через Internet послужил причиной недавно обнародованного решения компаний AT&T и WorldCom о рассмотрении возможности выделения их сервисных подразделений для индивидуальных клиентов в самостоятельные компании. Прежде всего потому, что трудно конкурировать с бесплатными услугами... или все-таки можно?
Во многих сферах бизнеса телефонные услуги на базе систем немедленного обмена сообщениями Internet могут найти лишь ограниченную применимость из-за неадекватного звучания голоса и некоторых других параметров качества. Но в этой области ожидаются изменения к лучшему — как только производители усовершенствуют свои продукты. В данной статье мы рассмотрим, насколько полезными могут быть бесплатные вызовы в составе службы немедленного обмена сообщениями, какой уровень качества можно от них ожидать и в какой степени применение таких приложений может повлиять на качество и конфигурацию вашей сети. Для того чтобы более объективно оценить данную технологию и качество голоса на стороне принимающего абонента, мы рассмотрим подробно некоторые технические детали, касающиеся передачи голоса с помощью соединений TCP.
Основное внимание в данной статье будет уделено системе Yahoo Messenger, так как ее технология оцифровки голоса и функции шлюза разработаны компанией Net2Phone, провайдером телефонных услуг в Internet, который также поставляет голосовое ядро для продуктов обмена сообщениями Microsoft и AOL.
МАСТЕР ГОЛОСОВЫХ СООБЩЕНИЙ ОТ YAHOO
Впервые голосовые вызовы в Yahoo Messenger появились в бета-версии продукта, вышедшей осенью 2000 г. Сегодня загрузив новую исполняемую версию Yahoo Messenger, вы можете снабдить тем самым функцией телефонного вызова персональный компьютер. После загрузки этого приложения вызывается мастер, который помогает пользователю пройти стадию тестирования звукового оборудования компьютера, оценивая уровень эха, обобщая ключевые параметры соединения с Internet и информируя о возможности использования чата Yahoo Voice Chat. Поскольку мастер отображает потенциальное качество голоса, которое можно получить при данном соединении, то очень полезно поработать с ним до выполнения звонков, обратившись к меню подсказки. Мастер Yahoo Audio Setup выполняет свою работу за пять этапов. На первых трех этапах проверяются микрофон, динамики и уровень эха без соединения с Internet. На четвертом и пятом этапах устанавливается возможность подсоединения компьютера к чату Yahoo Voice Chat и магистральной сети компании Net2Phone. Кроме того, на четвертом этапе аудиомастер вычисляет и отображает долю потерянных пакетов как процент не дошедших дейтаграмм UDP, а также среднее время обращения пакетов и вариацию задержки, иногда называемую дрожанием (jitter). Последние два параметра выражаются в миллисекундах (мс).
Доля потерянных пакетов, среднее время обращения и вариация задержки дают общую оценку качества голоса, которое можно ожидать во время данного соединения с Internet. По мере роста доли потерянных пакетов начинают возникать перерывы в принимаемой речи. Высокий процент потерь означает, что во время разговора могут возникать длительные периоды молчания; небольшие потери обещают высокое качество голоса.
Время обращения представляет собой среднее время, которое требуется пакету, чтобы покинуть пользовательский компьютер, попасть на сервер Yahoo и вернуться снова на компьютер. Таким образом, половина времени полного обращения представляет собой задержку пакета при передаче в одном направлении. Поскольку ваш вызов будет направлен на шлюз Net2Phone, а тот, скорее всего, не расположен поблизости от сервера Yahoo, эта метрика дает только самую общую оценку задержки в Internet, а не реальную задержку, с которой будут доставляться ваши пакеты.
В своей статье «Сокращение задержки голоса по IP» («Журнал сетевых решений/LAN», июль-август 2000 г.) я уже упоминал, что стандарт ITU определяет предельное значение для задержки в одну сторону в 150 мс. При превышении этой величины разговор становится трудно вести, поскольку невозможно определить, что делает человек на другом конце соединения: то ли он просто взял паузу, то ли продолжает говорить, то ли ждет ответа. Если же задержка в одну сторону достигает 250 мс, то разговор принимает форму переговоров по рации, и каждый собеседник должен информировать другого об ожидании ответа с помощью команды «Прием».
Третья метрика мастера показывает вариацию задержек пакетов с оцифрованным голосом. Вариация отражает отклонение приходящего в пункт назначения потока от равномерного исходного потока, когда пакеты поступают через случайные интервалы времени. Случайные интервалы между пакетами возникают из-за влияния другого трафика в сети, а также из-за задержек на обработку пакетов в маршрутизаторах. Высокий уровень вариации задержек означает, что разговор будет иметь периоды неустойчивости.
В соответствии с данными Yahoo, значение вариации задержек меньше 300 мс считается хорошим показателем. Одностороннюю задержку и вариацию целесообразно рассматривать как единый фактор. Задержка в одну сторону вычисляется как половина времени обращения по сети (оно может быть определено путем отправки запроса ping по адресу назначения) и не учитывает компенсации, предназначенной для корректировки вариации задержки. Обычно приложения, работающие с оцифрованным голосом, используют специальный буфер для компенсации случайных задержек при доставке пакетов. Однако такой буфер увеличивает задержку в одну сторону. Поэтому лучше всего задержку и ее вариацию рассматривать вместе, чтобы определить, превысят ли задержки четверть секунды, превращая ваш разговор в попеременное общение по рации.
ПЕРСОНАЛЬНЫЙ ЦЕНТР ОБРАБОТКИ ВЫЗОВОВ
Если вы перешли к последней версии Yahoo Messenger, то, наверное, обратили внимание на пиктограмму с телефоном. Эта пиктограмма обеспечивает доступ к центру обработки вызовов Yahoo, где находится шлюз Internet-телефонии.
При работе с данным центром операции производятся так же просто, как при нажатии кнопок телефона: вызов выполняется с помощью щелчков мышью по цифрам и кнопке с надписью Call. Центр обработки вызовов также поддерживает ссылки на другие сервисы Yahoo: пиктограммы над областью, где отображаются телефонные номера, представляют ссылки на вашу адресную книгу Yahoo, желтые страницы, сервис поиска людей в Internet (People Search) и учетную информацию. Сходный набор пиктограмм, расположенных под сообщением Ready, обеспечивает управление (включение/выключение) микрофоном и динамиком. Между выключателями микрофона и динамика находится панель управления громкостью динамика.
После щелчка по пиктограмме генерируется соответствующий телефонный номер, затем нужно щелкнуть по кнопке Call, чтобы инициировать звонок. Вслед за этим надпись Call изменяется на Hang Up («повесить трубку»), позволяя быстро завершить уже текущий вызов.
В настоящее время возможности выполнения звонков с ПК на телефон в Yahoo Messenger ограничены территорией США. Поэтому предварять номер префиксом «1» не нужно, но само по себе добавление префикса не принесет вреда. Все вызовы, включая местные, требуют задания трех цифр кода региона и семи цифр собственно номера. Когда я тестировал функцию вызова по схеме «ПК-телефон», то обнаружил, что качество голоса изменялось от почти неприемлемого до коммерческого. Я попробовал настроить различные параметры речи для улучшения качества вызова, но уровень интеграции технологии Net2Phone в различные функции Yahoo Messenger не позволил это сделать. Вместо этого наилучший вариант пришлось искать путем установления соединений с различными провайдерами Internet, применения разнообразных методов доступа и наблюдения за их влиянием на качество голоса.
ГОЛОСОВЫЕ ВАРИАЦИИ
Еще одним фактором, влияющим на величину задержки в одну сторону, является скорость передачи данных применяемого метода доступа в Internet. В статье «Сокращение задержки голоса по IP» я приводил результаты тестирования влияния фактора скорости доступа к интерфейсу провайдера Internet с помощью модемов стандартов на 14,4 Кбит/с, 28,8 Кбит/с, 33,6 Кбит/с и 56 Кбит/с. Последние обычно обеспечивают скорость соединения 33,6 Кбит/с. Хотя при использовании модема 56 Кбит/с часто можно увидеть сообщение «Соединение на скорости 45 333» (или 44 000, или 42 667), эти значения относятся к направлению передачи данных «из сети». В направлении же «в сеть» модемы стандарта V.90 выполняют два аналого-цифровых преобразования, что ограничивает максимальную скорость передачи данных значением 33,6 Кбит/с. Поэтому наиболее длительные задержки всегда будут соответствовать направлению «в сеть». Таким образом, эффект различных скоростей доступа можно оценить путем деления типичной длины голосового пакета на значение скорости доступа.
Каждый оцифрованный фрагмент речи передается с помощью протокола UDP, а каждый пакет снабжается отметкой о времени транспортного протокола реального времени (Real-time Transport Protocol, RTP). Для вычисления размера пакета нужно учесть и заголовок IP, предшествующий заголовку UDP. Так как, в зависимости от текущих характеристик сети, технология компании Net2Phone варьирует количество фрагментов речи, помещаемых в один пакет, это затрудняет определение средней длины пакета для произвольных сетевых соединений (более подробно об этом написано во врезке «Передача голоса с помощью Net2Phone»). Поэтому, при выяснении влияния скорости доступа на задержки, среднюю длину пакета будем считать равной 64 байт.
Данные, приведенные в Таблице, показывают задержку доступа (в мс) для голосовых замеров, передаваемых в дейтаграммах IP длиной в 64 байт. Скорость линии T1 была уменьшена с 1,544 до 1,536 Мбит/с, так как именно до этой величины уменьшается ее реальная пропускная способность из-за служебных бит, разделяющих кадры и передаваемых со скоростью 8 Кбит/с. Из таблицы видно, что переход от модема 14,4 Кбит/с к модему 28,8 Кбит/с уменьшает задержку почти на 18 мс, в то время как замена модема 28,8 Кбит/с модемом V.90, который обеспечивает скорость 33,6 Кбит/с, дает преимущество только в несколько миллисекунд. Поэтому для улучшения качества передачи голоса такая модернизация мало что дает.
ТЕЛЕПОРТЫ
Если вы соединяетесь с Internet из офиса или у вас дома установлен настольный или персональный межсетевой экран, следует поинтересоваться, какие порты применяет Yahoo Messenger. При вызове с ПК на телефон Yahoo Messenger использует при взаимодействии между ПК и коммутатором Net2Phone два порта UDP и один порт TCP. Один из портов UDP имеет фиксированное значение 6801, он должен быть открыт в обоих направлениях. Значение второго порта UDP должно находиться в пределах от 1 до 3000, он также используется в двух направлениях. Номер порта TCP не фиксируется, диапазон его значений — от 1 до 3000. Если в вашей организации применяются на маршрутизаторах списки доступа или фильтры на межсетевых экранах, то их придется модифицировать, так как по умолчанию эти устройства не пропускают то, что не разрешено явно. Следовательно, администратор, ответственный за конфигурацию маршрутизаторов и межсетевых экранов в офисе, должен быть в курсе значений портов, используемых в режиме «ПК-телефон», а дома эта обязанность лежит целиком на вас.
ЭХО СТАРОЙ ЭРЫ
За несколько недель я выполнил серию звонков с помощью Yahoo Messenger — в разное время дня и с разными результатами. Назову основные недостатки «бесплатной» телефонии от службы немедленного обмена сообщениями: некоторое недовольство вызываемой стороны из-за возникающего эха, случайные перерывы в разговоре, вынуждающие иногда пользоваться командой «Прием», неспособность механизма вызова передавать сигналы тонального набора (Dual-Tone MultiFrequency, DTMF).
Проблемы с эхо возникали постоянно. Наблюдаемое при этом так называемое акустическое эхо возникает, когда голос собеседника, находящегося на другом конце соединения, воспроизводится вашими встроенными или внешними динамиками, попадает в микрофон и возвращается собеседнику по петле обратной связи (см. Рисунок). Чтобы исключить этот эффект, надо воспользоваться наушниками. Можно просто отнести микрофон как можно дальше от динамиков и закрывать его пальцем после окончания очередной фразы — но для этого нужна определенная сноровка, если разговор достаточно оживленный!
Система Net2Phone борется с акустическим эхо с помощью реализованных на базе ПК средств эхо-компенсации. Однако они потребляют значительную часть вычислительной мощности ПК, и компьютеры только сейчас становятся достаточно мощными для реализации эффективной эхо-компенсации программными средствами.
ЗВУКИ ТИШИНЫ
Второй проблемой при выполнении телефонных звонков с помощью систем немедленной доставки сообщений является периодическая потеря в сети дейтаграмм. Последствия могут проявляться как в искажении отдельного слога, так и в пропуске нескольких слов. В последнем случае одна из сторон может ждать части разговора, между тем как на самом деле он давно уже находится в небесной «мусорной корзине». Такое ожидание часто приводит к наложению фраз, когда оба собеседника начинают одновременно повторять недавно сказанное, или же к длительным паузам перед возобновлением разговора.
Net2Phone использует частную управляемую сеть IP для маршрутизации свыше 85% обрабатываемых вызовов. Для ускоренной доставки голосового трафика данная сеть использует поле Type of Service (ToS) в заголовке IP для задания наивысшего приоритета пакетам, переносящим голос. Но так как голосовой трафик на пути к магистрали Net2Phone обычно не приоритезируется, то причиной перерывов в разговоре могут стать соединения с провайдером Internet. Чтобы проверить это соображение, я воспользовался услугами провайдера, периодически передающего рекламные объявления, отображаемые на экране. При этом становится очень легко предсказывать перерывы во время разговора — просто наблюдая за областью экрана, отведенной для объявлений. При появлении нового объявления голос сразу прерывался, так как данные объявления задерживали очередную порцию поступающих фрагментов речи.
Вторым потенциальным виновником перерывов в разговоре может быть ваша компьютерная платформа, в частности Windows. Эта операционная система не очень хорошо подходит для работы в реальном масштабе времени. Фактически в то же время, когда я устанавливал новую версию Yahoo Messenger, компания Bonzi Software объявила о выпуске программной утилиты Internet BOOST 2001 для оптимизации модемного доступа к Internet в среде Windows 95 или 98.
Так как периодические перерывы в воспроизведении речи могут возникать также из-за потерь пакетов в различных точках сети, например в сети провайдера Internet или даже в компьютере пользователя, то выявить истинного виновника оказывается непросто. Отключение антивирусных и других фоновых программ может оказаться полезным, так как освобождается больше ресурсов для работы Windows. Вместе с обеспечением высокоскоростного соединения с Internet это может сократить частоту возникновения пауз при передаче речи. Можно, конечно, попробовать звонить рано утром или поздно вечером, что не всегда удобно.
Третье ограничение телефонных вызовов, базирующихся на системах немедленного обмена сообщениями, связано с их неспособностью передавать тональные сигналы DTMF. Это не позволяет выполнять некоторые обычные телефонные операции, например посылку сигнала громкого вызова или набор добавочного номера. Если вы привыкли обращаться к своему голосовому почтовому ящику по междугородной связи, то бесплатный звонок такое обращение обеспечить не сможет. Кроме того, вам придется отказаться от услуг удаленного доступа к своему банковскому счету и услуг других интерактивных голосовых систем, где используются тональные сигналы DTMF.
Хотя я выполнял тесты для этой статьи в январе 2001 г., их результаты вполне соответствуют данным, приведенным в обзоре, выполненным в июле 2000 г. исследовательской компанией Edge Research по инициативе компании eYak (поставщик услуг деловых конференций через IP с вызовами с телефона на телефон и с ПК на телефон). В ходе исследования было опрошено около 800 пользователей систем немедленного обмена сообщениями и выяснилось, что только 10% случаев взаимодействия непосредственно порождало телефонные вызовы, а из всех пользователей, щелкавших по кнопке разговора, только 7% нашли качество голоса превосходным.
ВПРОК ЗАДЕШЕВО
Ясно, что телефонные звонки с помощью систем немедленного обмена сообщениями пока не пригодны для делового применения, но такое положение должно скоро измениться. Как ожидается, благодаря постоянно растущей мощности процессоров программная компенсация эха с помощью ПК вскоре станет реальностью. Распространение оптических сетей на основе технологии плотного мультиплексирования по длине волны (Dense Wavelength Division Multiplexing, DWDM) должно существенно уменьшить задержки и вероятность потерь пакетов. А бизнес компании Net2Phone, передающей сейчас от 250 до 300 млн мин телефонных разговоров в месяц, может привести к потерям традиционными телефонными операторами доходов на сотни миллионов долларов в год. Пока это не представляет серьезной угрозы для отрасли с доходами в десятки миллиардов долларов, но широкое применение систем немедленного обмена сообщениями для выполнения телефонных вызовов должно, по крайней мере, озаботить традиционных операторов связи. При улучшении качества передаваемого голоса обращение серьезного бизнеса к телефонным возможностям систем немедленного обмена сообщениями — дело времени.
С переносом телефонных вызовов от учрежденческих АТС в среду локальных сетей администраторы должны готовиться к пересмотру требований к таким сетям. Каждый разговор будет вызывать дополнительный трафик примерно в 10 Кбит/с. Для локальной сети это немного, но если 10 или 20 сотрудников одновременно начнут разговаривать, то легко может возникнуть насыщение низкоскоростного соединения с Internet.
Переход к передаче голоса через IP (Voice over IP, VoIP) потребует от менеджеров изменение корпоративной политики, выражающейся, в частности, в переопределении соответствующих списков доступа в маршрутизаторах и набора правил в межсетевых экранах.
Телефонные услуги на базе систем немедленного обмена сообщениями Internet могут найти лишь ограниченную применимость из-за неадекватного звучания голоса. Но в этой области ожидаются изменения к лучшему.
Гилберт Хелд — известный автор и лектор. С ним можно связаться по адресу: gil_held@eahoo.com.
Передача голоса с помощью Nеt2Phone
Компания Net2Phone, провайдер услуг телефонии через Internet, передает голосовые сообщения с помощью пакетов различной длины, уменьшая накладные расходы, связанные с формированием дейтаграмм. В настоящее время компания использует два кодека: SX9600 компании Elemedia, который обеспечивает высокое качество голоса при скорости 9,6 Кбит/с, и кодек, совместимый со стандартом ITU G.723.1. Этот стандарт определяет двухскоростной голосовой кодек, передающий оцифрованный голос со скоростью 5300 и 6300 бит/с. Кодек SX9600 использовался в начальной версии клиента MSN Messenger, в то время как кодек G.723.1 применялся в Yahoo Messenger, а теперь является частью всех клиентских решений Net2Phone.
В период доминирования модемов 14,4 Кбит/с компания Net2Phone выбирала компрессию кодека таким образом, чтобы она удовлетворяла ограничениям устройств стандарта V.32bis. Сегодня метод компрессии кодека фиксирован, однако количество кадров, посылаемых в одном пакете UDP, является переменным. Размер кадра для кодека G.723.1 при скорости 6300 бит/с позволяет вместить 30 мс голоса, или примерно 1/33-ю секунды речи. При скорости 6300 бит/с сжатый кадр состоит из 24 байт (6300/33 x 8) оцифрованного голоса. Так как голосовые кадры Net2Phone снабжены четырехбайтовыми заголовками, то отдельный кадр состоит из 56 байт, в которых 20 байт отводится под заголовок IP и 8 байт — под заголовок UDP. Если в пакет помещается два кадра, то в результате в дейтаграмме из 84 байт передается 56 байт голосовых данных. При трех кадрах в пакете передается 84 байт голоса в дейтаграмме из 112 байт, при шести кадрах в пакете — 168 байт голосовых данных. Изменяя количество помещаемых в отдельный пакет фрагментов речи, можно добиться уменьшения накладных расходов за счет использования общего заголовка.
Ресурсы Internet
Версию Yahoo Messenger для Windows, Macintosh, Linux и других операционных систем можно загрузить с http://messenger.yahoo.com.
Для загрузки MSN Messenger обратитесь к http://messenger.msn.com.
Загрузить копию нового продукта Netscape AOL Instant Messenger можно по адресу: http://www.newaol.com/aim/netscape/adb00.html.
Информацию о кодеке SX9600 компании Elemedia можно получить по адресу: http://www.elemedia.com (см. также врезку «Передача голоса с помощью Net2Phone»).