Аудио высокой «четкости»: мифы и реальность

V_A_N, 

Про High Definition Audio годик-два назад только ленивый не говорил. Сейчас шум поутих, процесс идет своим чередом. Покупатель зачастую и не подозревает, что за сюрприз – материнскую плату – ему подкинули в нагрузку к новому компьютеру.

Технология Intel® High Definition Audio (она же Azalia) по замыслу её создателей должна прийти на смену изъезженной вдоль и поперёк архитектуре компьютерного звука AC-97. Последняя получила широчайшее распространение на всех типах платформ, включая мобильные решения, но рано или поздно будет вынуждена сойти с дистанции. Вообще-то старение AC-97 пока ещё не столь заметно. «Ветеран» AC-97 может поупираться ещё довольно долго, благодаря всяким ревизиям-обновлениям, хотя запас «расширений» уже исчерпан. Главное преимущество продвигаемой «Интелом» новаторской технологии (далее сокращенно HD Audio) – это 32 битный многоканальный (7.1) звук с частотой дискретизации до 192 кГц. Для специалистов это преимущество весьма сомнительно, но на народ действует гипнотически. Посему настал черёд разобраться, стоит ли принимать во внимание «новинку» (которая уже год, как тихой сапой продаётся) при выборе компьютера.

Есть у HD Audio и другие преимущества. Например, поддержка 16 микрофонов. Всё дело в микрофонной решётке, выделяющей голос из окружающих шумов, что (не без хитрых алгоритмов) помогает распознавать слитную речь. Это скорее задел на светлое корпоративное будущее, чем реалии современного быта. Устаревающий стандарт AC-97 был готов обслуживать 2 мономикрофона (один стерео), но на практике производители ограничивались единственным моновходом, очевидно, по причине отсутствия массового спроса. Не спешат использовать кучу микрофонов и новоявленные HD Audio устройства. Так, в ноутбуках с Sonoma, которая потенциально поддерживает HD Audio, даже стереовходы лично мне ещё не встречались ни разу.

Самым «слабым» местом AC-97 были драйверы, которые разрабатывались сторонними производителями по принципу «кто во что горазд». HD Audio обещает обслуживаться готовыми драйверами операционной системы (разумеется, от MicroSoft), но на деле системными драйверами для такого сложного устройства, как аудиокарта (не важно, встроенная, или нет), ограничиться будет крайне сложно. В любом случае, потребуются дополнительные драйверы от тех же сторонних производителей.

Azalia 9880 DD

Как выяснилось, удобство инсталляции «plug’n’play» у AC-97 было реализовано лишь частично. HD Audio берётся довести это «до ума». Похвально! Но верится с трудом.

Что действительно революционно у HD Audio, так это поддержка многопоточности с динамическим распределением каналов (памяти) DMA для каждого потока в отдельности. То есть предоставляется возможность озвучивать одновременно несколько источников, причём с разной частотой дискретизации (например, воспроизводить фильм с Dolby Digital 5.1, и параллельно не забывать про монофонический голосовой чат). Полоса пропускания составит для вывода до 48 Мбит в сек, а для ввода – 24 Мбит в сек. Это позволит воплотить в жизнь доктрину «цифрового дома», стерев границы между бытовым и компьютерным аудио. Фактически, в ближайшем будущем появится некая штуковина вроде домашнего развлекательного центра, обслуживающего всё видео и аудио в нашей квартире. Более того, стабильная синхронизация для каждого потока заложит «мину замедленного действия» под профессиональные аудиорешения. Однако, всё это лишь в перспективе, а действительность выглядит не столь радужно. О чём в подробностях чуть ниже.

Azalia многопоток
Увеличить

Даешь все домашнее видео и аудио в руках одного компьютера!

Если верить информации, выложенной на сайте Intel, на данный момент HD Audio поддерживается чипсетами Intel® 915G, 915P и 925X Express. Что-ж, лиха беда начало…

А что же конкуренты? Похоже, AMD сделал ставку не на ту лошадку. Поначалу, заморочив головы с кодированием-декодированием в Dolby Digital, аудио от AMD (точнее, от NVIDIA, родоначальницы чипсета nForce), не долго поражало воображение покупателей. Помнится, года два назад NVIDIA грозилась сделать «лучший в мире звук на РС». Полная аппаратная поддержка DirectSound и DirectX 8.0, конечно, хорошо, но для долговременного успеха явно не достаточно. Например, кодирование в реальном времени в DolbyDigital с хорошим качеством выходящего сжатого звука в случае шести каналов требует прорву вычислительных ресурсов даже для 16 битного сигнала. А слабо 24 бит 96 кГц в DTS сжать? Какое конкретно качество после сжатия в состоянии обеспечить nForce, так и осталось тайной. Фирма не удосужилась поведать, а журналисты слепо поверили на слово. Это надо же было такое придумать: сжимать непонятно как, чтобы ради одного цифрового шнурка передавать многоканальный сигнал на внешний Hi-Fi ресивер! Короче, идея фикс. На сегодняшний день продвинутое аудио как таковое в списке перспективно-приоритетных направлений NVIDIA не значится. Возможно, какие-то замыслы держатся в строжайшей тайне, хотя серьёзных предпосылок для этого не видать. Было бы что по существу держать в секрете!

Краткий справочник (вместо теории)

АЦП
(ADC)

Преобразователь аналогового сигнала в цифровой. Передаваемый (а также хранимый где-либо) цифровой сигнал представляется в двоичном виде как упорядоченная последовательность нулей и единиц. Один нолик (или единичка) эквивалентен одному биту. Кстати, количество информации измеряется битах, а восемь бит дают один байт.

Разрядность АЦП (ADC bits)

Количество бит (иными словами, разрядов) у АЦП фиксировано. Чем больше бит, тем бОльшая по значению амплитуда может быть представлена, и тем больше динамический диапазон (см далее). Следует различать линейные (ещё их называют мультибитными) и однобитные (типа дельта-сигма и т.п.) преобразователи. В однобитном преобразователе прибегают к передискретизации (см далее), тем самым косвенно наращивая число бит в формируемом цифровом сигнале. Не все разряды мультибитного АЦП вносят одинаковый вклад в формирование цифрового сигнала. Как правило, крайние биты у силу принципиальных ограничений работают в полсилы, что приводит к сокращению количества эффективных бит. Поэтому, например, у 20 битного АЦП эффективных бит может оказаться около 16, а у какого-нибудь разрекламированного 24 битного АЦП (на самом деле однобитного дельта-сигма) случается к.п.д. и того меньше. Чем выше количество эффективных бит, тем лучше у АЦП реальный динамический диапазон (см далее), соотношение сигнал шум и т.д.

Частота дискретизации
(sampling frequency)

Частота, с которой при получении цифрового сигнала выхватываются в аналоговом сигнале отдельные уровни амплитуды (дискреты), переводимые тем или иным способом в численные значения. Чтобы корректно озвучить цифровой сигнал (т.е. преобразовать его обратно в аналоговый), необходимо знать величину частоту дискретизации, при которой происходила «оцифровка».

Передискретизация (oversampling)

Упрощенно говоря, захват дополнительных точек (дискрет) в промежутках между временнЫми отсчётами, задаваемыми частотой дискретизации. Используется для повышения точности цифрового сигнала при искусственно заниженной разрядности (вплоть до 1) преобразователей.

Искажения
(distortions)

Искажения подразделяются на нелинейные, переходные, амплитудно-частотные и фазово-частотные. Нелинейные искажения, в свою очередь, делятся на гармонические (когда при подведении одной частоты возникают и другие частоты, кратные подводимой, назваемые гармониками) и интермодуляционные (когда при подведении двух разных частот возникают частоты, являющиеся суммой или разностью подводимых частот). Нелинейные искажения оцениваются посредством разнообразных придуманных коэффициентов.

Так, THD (total harmonic distortion) отличается от THD+N тем, что для оценки отбираются лишь гармоники, а широкополосные шумовые составляющие не учитываются. Следовательно, THD+N характеризует нелинейные искажения какого-либо преобразователя более полно, но смешивает в одну кучу гармоники и шум. Коэффициент интермодуляционных искажений обозначается как IMD (inter modulation distortion) и свидетельствует о том, как одна частотная компонента (например, 10 кГц) влияет на другую (1 кГц).

Какие искажения наиболее ощутимы на слух, зависит как от значения частоты, так и от комбинации множества факторов. Например, так любимые эстетами звука лампы в усилительных каскадах дают чётные (более заметные на слух) и нечётные гармоники, причём очень мощные, хотя и ослабевающие экспоненциально по мере роста частоты. Многие гитарные distortion эффекты превносят кучу гармоник, но на слух это в целом воспринимается позитивно. Так что оценки величины нелинейных искажений указывают на потенциальные неточности воспроизведения/записи звука, но мало говорят о том, насколько приятен или неприятен будет звук на слух.

ЦАП
(DAC)

Преобразователь цифрового сигнала в аналоговый. В принципе, выполняет все процедуры намного быстрее и проще, чем АЦП, поэтому дешевле в разработке и производстве. Чем выше текущая частота звуковых составляющих в цифровом сигнале, тем сложнее ЦАПу восстановить истинную форму в выдаваемом аналоговом сигнале.

Кодек
(codec)

  • Совмещённый АЦП/ЦАП.
  • Программное (реже аппаратное) кодирование-сжатие и декодирование видео- или аудиопотоков.

Разрядность цифрового сигнала (Bit depth)

В отличие от разрядности, ЦАП и АЦП однозначно свидетельствует о динамическом диапазоне цифрового сигнала как такового. При этом динамический диапазон равен максимально возможному. Например, для 8-битного сигнала это 48 дБ, для 16-битного – 96 дБ, для 24-битного 144 дБ (предел человеческого слуха ~120 дБ), а для 32-битного – аж страшно подумать – 192 дБ. Цифровые сигналы с такими диапазонами могут быть созданы лишь искусственно, т.е. на компьютере (или другом цифровом устройстве) с процессором, имеющим более высокую точность. Например, для 24-битного сигнала желательна точность в 32 бита для целых чисел, иначе проявятся искажения, превносимые дискретностью.

Динамический диапазон
(dynamic range)

Разница между самым «тихим» и самым «громким» сигналами, воспроизводимыми (записываемыми) с допустимыми искажениями. Выражается в децибелах (dB): 20*log (AMPLITUDE_max / AMPLITUDE_min).

Сигнал/шум
(SNR)

Упрощённо говоря, обратное отношение максимального неискаженного сигнала к фоновому шуму, фиксируемому в отсутствии этого сигнала. Выражается в дБ. Всегда имеет отрицательное значение из-за того, что логарифм от числа меньше единицы – отрицательный. На практике превышает динамический диапазон по абсолютному значению. При обработке фонового шума стандартизованным взвешивающим фильтром, учитывающим восприятие на слух человеком, указывают dBA.

Битрейт
(bitrate)

Поток цифрового звука, измеряемый в килобитах в секунду (kbps). Обычно употребляется в отношении звука, закодированного со сжатием с потерями качества. Например, поток несжатого 16-битного стереосигнала с частотой дискретизации 44100 Гц составляет: 16*2*44100/1000=1411.2 кбит/с, что равно 176.4 кбайта/с. При сжатии с битрейтом 128 кбит/с получаем теоретический выигрыш по объёму в 1411.2/128=11.025 раза. На практике эффективность сжатия зависит от спектрального состава музыкального материала и от способа (по сути, алгоритма) сжатия. Для каждого алгоритма существует свой предел оптимальности сжатия/качества. Выигрыш по сжатию ещё не означает пропорциональный проигрыш по качеству. Некоторые люди замечают на слух ухудшение качества при битрейте ниже 128, другие – при 256.

Существует сжатие с переменным битрейтом, в этом случае его величина "пляшет" на усмотрение кодера вокруг величины задаваемого изначально битрейта. Такое сжатие время от времени должно допускать незначительное ухудшение качества по мере необходимости (когда сигнал наиболее насыщен разными частотными составляющими), тем самым обеспечивая более плотную упаковку в среднем при достаточно высоком качестве. Однако в силу несовершенства алгоритмов резкое изменение качества во времени иногда заметно на слух.

Диапазоны рабочих и слышимых частот

Система слуха среднестатистического человека реагирует на сигнал чистого тона (одной фиксированной частоты, генерируемой искусственно) от 16–20 Гц до 16–20 кГц. Возникает закономерный вопрос, а зачем лезть в неслышимый ультразвук за 20 кГц? Тем более, что на высоких частотах человек воспринимает не изменение звукового давления как таковое, а его огибающую во времени? Кстати, именно последнее спасает сидюшную дискретизацию в 44.1 кГц, при которой на один период самых высоких частот приходится всего лишь чуть более 2 точек (сэмплов), тогда как для правдоподобного "геометрического" отображения волны надо бы как минимум 5 точек.

Измерения звуков реальных инструментов показывают, что ощутимые по амплитуде субгармоники простираются вплоть до 100 кГц, хотя основная по мощности гармоника может не превышать 1 кГц. Правда, амплитуда субгармоник стремительно уменьшается по мере роста частоты, что естественным путем делает весьма приличным звучание в ставшем нормой для Hi-Fi рабочем диапазоне 20 Гц–20 кГц. Природа восприятия звука пока не разгадана, и какую роль играют самые высокочастотные компоненты ученым неведомо. Отдельные проведённые эксперименты свидетельствуют, что ультразвуковые компоненты, оставаясь по отдельности неслышимыми для человека, лишь СТИМУЛИРУЮТ восприятие слышимых звуков. Также известно, что для точной передачи в цифре ударно импульсных сигналов запас по частоте дискретизации очень даже не помешает. Факт остается фактом: расширение рабочего диапазона частот до 50–100 кГц делает звучание более реалистичным. Только вот заметить это суждено далеко не всем: у каждого из «гомо-сапиенс» система слуха работает по-разному, а большинство людей не обладает тонким слухом.

Практические аспекты на примере CMI 9880/8 CH  Azalia Audio Codec от C-Media

Сам по себе кодек – это ещё полдела. Качество звука в немалой степени обеспечивается за счёт развязки аналоговых цепей (прежде всего питания) от цифровых, а также фильтров на звуковых выходах. Тем не менее, если кодек с его ЦАПами и АЦП «убогий», то хорошего звука ждать неоткуда, как ни упирайся с передовыми алгоритмами обработки.

Кодек расхваливаемой Azalia влепили в материнку, сэкономив на конденсаторах
Увеличить

Кодек расхваливаемой Azalia влепили в материнку, сэкономив на конденсаторах?

Некоторые технические характеристики кодека
(по сведениям производителя)

ЦАП, 8 каналов

Соотношение сигнал шум >95 дБ (при 192/96/48 кГц для 24/20/16 bits )

АЦП, 4 канала

Соотношение сигнал шум >85 дБ (при 96/48/44.1 кГц для 16 bits )

S/PDIF Output:

192/96/48 кГц with 24/20/16 bits

S/PDIF Input:

96/48/44.1 кГц with 24/20/16 bits

Выход на наушники

32 Ом


На материнке Gigabyte цифровые S-PDIF вход и выход выполнены в виде коаксиальных RCA-разъёмов

На материнке Gigabyte цифровые S-PDIF вход и выход выполнены в виде коаксиальных RCA-разъёмов


Аналоговые аудиовыходы хоть и обозначены, но могут переназначаться программно

Аналоговые аудиовыходы хоть и обозначены, но могут переназначаться программно

Фишка в том, что наушники, колонки и даже микрофон теперь можно подключать не глядя, воткнув штекер в любое первое попавшееся гнездо. Система сама поймёт, что именно подключено, и попытается активизировать соответствующий порт (при необходимости можно поправить вручную). Действительно удобно, ведь системный блок обычно стоит на полу, в нише стола и т.д., и добраться до тыльного гнезда иногда не так просто. Однако за удобство подключения приходится расплачиваться качеством звука. Боюсь, на аудиовыходы правильные фильтры (в частности, с хорошими конденсаторами) поставить будет уже крайне проблематично и накладно.


Автор
V_A_N

Комментарии