Несмотря на определенную популярность решений с использованием специализированных коммутаторов, наибольшее распространение получили протоколы для передачи звука на базе IP (Audio over IP), поскольку они могут быть реализованы в существующей сетевой инфраструктуре. Сегодня используется более двух десятков подобных протоколов, как открытых, так и проприетарных. Наиболее популярным среди них является протокол Dante, разработанный австралийской компанией Audinate.

В случае аналоговых систем звуковое оборудование обычно соединяется кабелями напрямую: один канал — один кабель. Медные аудиокабели занимают много места, тяжелы и громоздки. Их подключение — трудоемкая и дорогостоящая процедура, которая, помимо прочего, чревата ошибками в крупных инсталляциях. В случае же AoIP по одному витопарному кабелю можно одновременно передавать данные десятков и сотен аудиоканалов.

Помимо сокращения объема работ и удешевления проекта в целом, применение AoIP обеспечивает и функциональные преимущества, в том числе возможность маршрутизации аудиосигналов на большие расстояния без ухудшения их качества. При этом маршрут передачи сигнала может быть скорректирован, по сути, щелчком мыши без внесения изменений в кабельную проводку. В свою очередь, отсутствие деградации сигнала позволяет отказаться от усилителей, которые необходимы для компенсации ослабления сигнала из-за электромагнитных помех, высокочастотного затухания и падения напряжения.

РАЗНОВИДНОСТИ АУДИО ПО СЕТИ

Системы AoIP позволяют передавать несжатые цифровые аудиосигналы по Ethernet/IP. В зависимости от того, на каком уровне они работают, протоколы делятся на три больших класса: физического, канального и сетевого уровней.

Протоколы физического уровня позволяют передавать сигнал от одного устройства к другому по обычным витопарным кабелям Категории 5е или лучше. К ним относятся такие протоколы, как AES50 компании Behringer или Roland Ethernet Audio Communication (REAC).

Протоколы канального уровня позволяют создать канал между двумя устройствами в сети. Первым протоколом этого класса был Cobra Net компании Cirrus Logic, который появился еще в 1996 году. Другим ее известным представителем является Ethersound.

IEEE был принят стандарт 802.1BA на Audio Video Bridging (AVB) (а также ряд сопутствующих стандартов). AVB разрабатывался таким образом, чтобы минимизировать необходимые изменения в сетевой инфраструктуре. Однако для сетевой трансляции видео и аудио профессионального качества все мосты (коммутаторы) на пути передачи сигнала должны поддерживать AVB.

С помощью протоколов сетевого уровня можно соединить множество устройств и обеспечить коммутацию сигналов между ними. Помимо Dante, таковыми являются проприетарный протокол Livewire, предложенный Axia Audio, и открытый протокол Ravenna от ALC NetworX. Первый широко используется телерадиовещательными компаниями. Второй послужил базисом при разработке AES67 (он появился позже, чем Dante, а у его создателей своеобразное чувство юмора: в Равенне находится могила Данте).

ПРОТОКОЛ DANTE

Протокол Dante представлен австралийской компанией Audinate в 2006 году. Это был далеко не первый протокол данного класса: Livewire появился в 2003 году, а Wheatnet IP — в 2005-м. Однако ни их предшественникам, ни последователям не удалось добиться того же успеха, что Dante. Его поддерживают свыше 400 производителей профессионального аудио-оборудования, и он интегрирован в более чем 1400 продуктов (см., например, рис. 1). По числу доступных продуктов Dante опережает конкурентов в несколько раз (см. рис. 2).

Звук профессионального качества по IP
Рис. 1. Цифровая беспроводная система компании Shure поддерживает Dante на сетевых интерфейсах ресиверов. При подключении ресивера к сети ПО Dante Controller немедленно обнаружит его. После этого аудиоканалы можно маршрутизировать и контролировать по сети

Источник: Shure

Поэтичное название протокола расшифровывается весьма прозаически: цифровое аудио по сети Ethernet (Digital Audio Network Through Ethernet, Dante). К тому же такое название не совсем верно отражает его природу (но чего не сделаешь ради красивого названия) — Dante относится к решениям сетевого уровня, а не канального (использует IP-пакеты).

Звук профессионального качества по IP

Рис. 2. Распространенность различных протоколов: количество продуктов, в которых реализована их поддержка (по данным на февраль 2017 года)

Источник: ProTools Expert

Впрочем, этот протокол рассчитан на те же области применения, что и CobraNet и EtherSound. По сравнению с двумя последними он обеспечивал дополнительные преимущества: изначальную поддержку гигабитных скоростей, большее число каналов, меньшую задержку и автоматическую конфигурацию.

Dante удалось завоевать популярность не только за счет технических достоинств, но и благодаря принятой бизнес-модели и ориентации на более широкий рынок. В то время как конкурирующие протоколы были ориентированы на телерадиовещательный сегмент, Dante предназначался для использования с профессиональным аудиооборудованием в студиях звукозаписи, конференционных залах и переговорных, системах фоновой трансляции музыки и т. д.

Сам разработчик описывает Dante как «многоканальную цифровую сетевую технологию передачи несжатого звука с практически нулевой задержкой и точной синхронизацией». Под Dante, или сетью Dante, подразумевается не только протокол, но и решение для передачи оцифрованного звука по стандартным сетям Ethernet, куда входят аппаратное и программное обеспечение (физические и виртуальные звуковые карты, программный контроллер).

Настройка параметров устройств, маршрутизация сигналов между ними и их мониторинг осуществляются с помощью бесплатного программного контроллера Dante Controller. Достаточно подключить звуковое устройство к сети, и контроллер автоматически его обнаружит. По сути он выполняет функции диспетчера: какой сигнал на какое устройство направить. Изменение же маршрута передачи сигнала в аналоговом мире требует прокладки кабелей заново (или их перекоммутации).

ТЕХНИЧЕСКИЕ ОСОБЕННОСТИ

Протокол предназначен для использования в сетях Ethernet на 100 Мбит/с и 1 Гбит/с. Теоретически по сети можно передавать неограниченное количество каналов — для этого достаточно добавить столько коммутаторов и сетевых карт, сколько требуется. Однако максимальное число каналов на конкретном порту ограничено его пропускной способностью.

Аудиотрафик может сосуществовать с другими типами трафика в одной сети. Dante использует стандартные функции приоритизации трафика для обеспечения преимущественного обслуживания голосовых потоков и синхронизирующих сообщений. Первым присваивается средний приоритет, а вторым — высокий.

Для 64 аудиоканалов с частотой дискретизации 48 кГц и разрядностью 24 бита необходима полоса шириной 74 Мбит/с. В результате на каждом 100-мегабитном порту может поддерживаться 48 двунаправленных аудиоканалов, а на гигабитном порту — до 512 двунаправленных аудиоканалов.

Типовая задержка в сети Dante составляет 1 мс. Как утверждает разработчик, такой показатель обеспечивается в сети с 10 транзитными коммутаторами при протяженности кабелей между ними до 100 м. В случае необходимости его можно настроить для каждого устройства в диапазоне от 150 мкс до 5 мс, однако при сверхмалых задержках возможны проблемы с производительностью.

Для качественного воспроизведения звука нужна синхронизация устройств. Среди сетевых устройств проводятся «выборы»: в итоге главным становится то, у которого синхронизация оказывается лучшей, а все остальные синхронизируются с ним. Для согласования используется протокол точного времени (Precision Time Protocol, PTP), так что расхождение не превышает нескольких микросекунд (до 1 мкс, по утверждению разработчика).

При отказе главного синхронизирующего устройства новое выбирается заново за доли секунды, это никак не сказывается на качестве звука. Каждое устройство имеет собственные часы. Поскольку локальные часы синхронизированы и процедура выбора длится недолго, рассинхронизации за это время не происходит. При полной потере синхронизации звук отключается, чтобы слушатели ничего не заметили.

AES67

Ближайшим соперником Dante является протокол Ravenna, он не столь популярен, но в некоторых областях применения является доминирующим. В отличие от Dante, это открытый протокол. Он поддерживает более широкий спектр форматов данных: разрядность 16, 24 и 32 бита и соответствующие частоты дискретизации. По одной и той же сети могут передаваться потоки с данными различных форматов. Если Dante для передачи трафика использует UDP/IP, то Ravenna — RTP, благодаря чему он может применяться для передачи не только аудио, но и видео.

Помимо Dante и Ravenna, на рынке имеется множество других протоколов. С ростом популярности транспорта AoIP отсутствие интероперабельности между ними стало проблемой для пользователей, в частности, это выражалось в вынужденной зависимости от решений одного вендора (и его партнеров) и в ограниченности выбора оборудования. Для обеспечения совместимости общество звукоинженеров (Audio Engineering Society, AES) разработало открытый стандарт AES67, который был опубликован в 2013 году.

AES67 содержит набор рекомендаций, которым должны следовать производители, чтобы их системы были совместимы между собой. Привлекательной чертой AES67 является, как это ни покажется странным, его ограниченная функциональность. По сути поддерживается только транспорт аудиопотоков по сети — стандарт призван обеспечить доставку аудио от отправителя получателю с наименьшими накладными расходами (наилучшей производительностью). Маршрутизация, мониторинг, обнаружение и контроль устройств и управление соединениями осуществляются внешними по отношению к нему средствами.

Чтобы гарантировать взаимопонимание получателя и отправителя, AES67 предъявляет минимальный набор требований, которым должно отвечать оборудование AoIP. Стандарт поддерживает разные показатели частоты дискретизации, разрядности, размера пакетов, а также разное количество каналов. Однако для большей совместимости используемые устройства должны поддерживать один основной формат обмена — так называемый опорный формат (pivot format): частоту дискретизации 48 кГц, два канала, разрядность 28 бит, пакеты с фрагментами длительностью 1 мс (48 сэмплов в каждом) (см. таблицу).

Звук профессионального качества по IP
Параметры потоков AES67

Целью разработки AES67 была не замена существующих протоколов, а обеспечение беспроблемного обмена аудиопотоками между различными устройствами и системами, их поддерживающими. Для минимизации задержки и передачи оцифрованного звука без искажений AES67 задействует существующие интернет-стандарты, а именно RTP для транспорта данных, PTPv2 для синхронизации, QoS для приоритетной доставки звукового трафика и SDP для обмена информацией о потоке между отправителем и получателем.

Протокол поддерживает как многоадресную рассылку (multicast), так и целевую одноадресную передачу (unicast). Первая позволяет максимально эффективно использовать пропускную сеть при наличии управляемых коммутаторов. Отправителю не надо генерировать отдельные аудиопотоки для каждого получателя: достаточно сделать это один раз — и аудиопоток будет доставлен всем адресатам. (Неуправляемые коммутаторы воспринимают многоадресный трафик как широковещательный и направляют его на все порты. При большом количестве аудипотоков это чревато перегрузкой сети.) В случае одноадресной передачи применяется протокол инициирования сеансов (Session Initiation Protocol, SIP).

Стандарт претерпел несколько редакций, последняя была опубликована в апреле этого года. Самое существенное изменение — Декларация о совместимости реализаций протокола (Protocol Implementation Conformance Statement, PICS). AES67 не определяет, каким образом должен быть реализован стандарт, каждый производитель может это сделать по-своему. Для PICS требуется заполнить проформу, где указывается, какие функции и опции реализованы. Как отмечается на сайте AES, PICS — «важный инструмент для обеспечения совместимости реализаций AES67».

Совместимость с AES67 обеспечивают многие производители, предлагающие собственные решения для построения сетей AoIP; в их числе Audinate (Dante), ALC NetworX (Ravenna), LiveWire (TelosAlliance) и др. Они реализуют функции обнаружения и контроля, которые намеренно не были включены в стандарт.

ЗАКЛЮЧЕНИЕ

Первые протоколы AoIP появились больше двух десятков лет назад, однако только в последние несколько лет они получили признание в области профессионального аудио и видео. С каждым годом системы становятся все более функциональными — и при этом дешевеют. Как следствие, растет число профессионалов в области записи и воспроизведения звука, которые используют аудио поверх IP.

Стандартом де-факто в области профессионального аудио стал протокол Dante. Благодаря широкой поддержке производителей, пользователи получили возможность выбора из множества вариантов самых разнообразных моделей устройств. Однако использование такого проприетарного решения достаточно рискованно: отрасль может оказаться в зависимости от лицензионной политики одного вендора, столкнуться с проблемами в случае ухода компании с рынка и т. п.

Впрочем, рынок профессиональных решений AoIP пока находится в стадии становления. Об этом свидетельствует присутствие на нем множества различных экосистем, базирующихся на проприетарных протоколах. А значит, говорить об окончательном выборе в пользу какого-то конкретного протокола, наверное, преждевременно. К тому же, как показывает вся предыдущая история ИТ, выбор в пользу открытых подходов неизбежен: где-то он делается раньше, где-то — позже.

Как бы то ни было, в переходе на IP профессионалы в области аудио продвинулись намного дальше, чем их коллеги, занимающиеся видео. При этом следует отметить, что общество инженеров кино и телевидения (Society of Motion Picture and Television Engineers, SMPTE) разрабатывает пакет стандартов SMPTE ST 2110 Professional Media Over Managed IP Network с целью создания общего механизма для передачи профессионального аудио, видео и мультимедиа по управляемым сетям IP.

SMPTE 2110 — не первая попытка вещательной отрасли перевести производство на IP. В отличие от предшественников, SMPTE 2110 предусматривает раздельную передачу видео, аудио и вспомогательных данных (см. рис. 3). Такой подход обеспечивает гибкость, позволяя независимо маршрутизировать и обрабатывать отдельные потоки. Транспорт аудио по IP описывается в стандарте SMPTE ST 2110-30, который базируется на AES67 (с небольшими дополнениями).

Звук профессионального качества по IP
Рис. 3. В отличие от SMPTE 2022-6, который просто отображает последовательный цифровой интерфейс (Serial Digital Interface, SDI) на IP, SMPTE 2110 разделяет аудио, видео и вспомогательные данные на отдельные элементарные потоки

Источник: Netinsight

Пока же SMPTE 2110 ограничен пределами локальных сетей. Ему, как и многочисленным разновидностям AoIP, еще предстоит выйти на широкие просторы Интернета.

Дмитрий Ганьжа, главный редактор «Журнала сетевых решений/LAN»