Преодолевая звуковой барьер

Антон Балабан, 

Среди пользователей компьютеров о цифровом звуке сложилось множество легенд и мифов — часто из-за непонимания основ, а часто из-за "маркетингового шума" производителей. Развеять их и призван данный материал.

Сегодня можно с уверенностью говорить, что практически вся музыка, доносящаяся до наших ушей, так или иначе была оцифрована. Компакт-диски, MP3, DVD уже прочно вошли в нашу жизнь, вытеснив винил и аудиокассеты, и даже голос ди-джея модной радиостанции, доносящийся из радиоприемника, в большинстве случаев предварительно проходит через цифровой эфирный процессор. При записи музыки тоже трудно обойтись без цифровой обработки, даже если продюсер предпочитает «все аналоговое». В компьютерной сфере, по понятным причинам, альтернативы цифровому звуку просто не существует.

В то же время среди пользователей компьютеров о цифровом звуке сложилось несколько легенд и мифов — часто из-за непонимания основ, а часто из-за, мягко выражаясь, маркетингового шума производителей программного и аппаратного обеспечения. Распространено, например, заблуждение, будто аналоговый звук лучше цифрового… Нет, с субъективными оценками я спорить не стану, но объективности ради замечу, что претензии к цифровому звуку, как правило, вызваны его неграмотным использованием. О заблуждениях и поговорим.

 

Чтобы не путаться в терминологии, кратко рассмотрим основы оцифровки звука. Поступающий на вход аналогово-цифрового преобразователя (АЦП) электрический сигнал измеряется через равные промежутки времени. Частота, с которой происходит измерение, называется частотой дискретизации (для компакт-диска таких измерений производится 44100 в секунду, или 44,1 кГц). Каждое измерение называется цифровым отсчетом, или сэмплом. Измеренное значение представляется в виде числа с определенным количеством бит (для CD их 16); для описания количества бит в цифровом слове я буду использовать термин разрядность (иногда используют термин битность, но он мне не очень нравится, все равно что вес называть «граммажностью»). Чем чаще мы измеряем (чем выше частота дискретизации), тем лучше оцифрованный сигнал передает исходную форму волны. Чем больше бит в цифровом слове, тем точнее измерение. Разница между реальным сигналом и его измеренным значением называется шумом квантования (иногда говорят ошибка квантования). Чем выше разрядность, тем, естественно, шума квантования будет меньше. Отношение сигнал/шум для данной разрядности можно подсчитать по формуле:

Сигнал/Шум [дБ] = 6 Ч Разрядность [бит] + 2

Соответственно для 16-битного кодирования динамический диапазон составляет около 98 дБ. Так как у цифрового звука всегда существует верхний порог громкости (максимальное число, которое можно записать данным количеством бит; для 16 это 65536), то этот порог принимается за ноль, а все уровни громкости отсчитываются уже от него «вниз» (напомню, что децибел всегда единица относительная, 1 дБ = 20(lg V1/V2), где V1 — измеряемое напряжение, а V2 — то, относительно чего оно измеряется, в нашем случае — напряжение, соответствующее максимальному значению 16-битного слова).

sampling.gif

quant.gif

Сэмплирование сигнала

Шум квантования

ОК — ошибки квантования, звездочками помечены возможные значения сэмпла выше/ниже измеренного. Из рисунка понятно, что чем выше уровень сигнала, тем меньше шум квантования относительно него (для наглядности показан очень низкий уровень, около -90-96 дБ).

 

Начнем с так называемого CD-качества. Прежде всего, этим словосочетанием иносказательно обозначают разрешение 16 бит/44,1 кГц, и всплывает эта формулировка преимущественно при рекламировании той или иной звуковой карты или аудиоредактора. Только так эту фразу и стоит понимать, то есть карта способна принять и воспроизвести звук с означенным разрешением, а при записи выдать 16/44 записывающей программе. Не стоит ожидать от карты с надписью «CD Quality» такого же качества воспроизведения, как у хорошего CD-проигрывателя, или записи, сопоставимой с высококачественными музыкальными компакт-дисками. Реально качество воспроизводимого/записываемого звука зависит от особенностей конструкции аналоговой и цифровой части звуковой карты, и оценить его можно либо самостоятельно, либо положившись на впечатления внушающих доверие людей. Для аналоговой части компьютерных аудиокарт одним из важнейших параметров является хорошая изоляция от внешних помех (например, создаваемых блоком питания и видеокартой) и качество собственно аналогово-цифровых и цифро-аналоговых преобразователей (о том, что характеризует качественные АЦП/ЦАП, смотрите ниже). От цифровой части нужна только честность — что пришло, то и выдано. Эта простая с виду задача (честность при работе с цифрой) до сих пор не реализована в большинстве любительских и очень многих полупрофессиональных аудиокартах. Так, притчей во языцех является построение цифровой части звуковой карты SB Live! от Creative (впрочем, это касается и других производителей). Дело в том, что чип, отвечающий за ввод-вывод звука, работает только на частоте 48 кГц (иногда применяющейся в профессиональной работе со звуком) и не может подстраиваться под внешние входящие частоты. Поэтому если вы проигрываете на компьютере звуковой файл с частотой дискретизации 44,1 кГц, карта благосклонно ее принимает, но на входе в чип пересчитывает в 48 кГц. То есть к имеющимся в сигнале отсчетам добавляются новые, чтобы увеличить количество сэмплов в секунду с исходных 44100 до 48000. То же самое и на выходе. Эта операция (ее еще называют ресэмплингом) вносит в звук довольно много искажений еще до или уже после аналоговой части карты. Из-за ресэмплинга совершенно теряют смысл цифровые входы/выходы: например, вход может принимать только 48 кГц, причем все равно ресэмплирует входящий цифровой сигнал. Дело в том, что у любых двух цифровых приборов рабочие частоты, даже если они номинально совпадают, немного отличаются (на десятые доли процента), поскольку невозможно сделать два идентичных тактовых генератора. SB Live не может подстраиваться под входящую частоту и просто ресэмплирует поступающий звук под свой генератор. Если этого не делать, в сигнале время от времени будут проскакивать щелчки из-за лишних или недостающих сэмплов (если частота внешнего источника немного больше или меньше собственной рабочей частоты карты). По правде говоря, я не понимаю, что побудило разработчиков выбрать рабочую частоту 48 кГц. Из бытовых приборов с этой частотой работают только DAT-магнитофоны, а на 44,1 кГц работают самые распространенные источники музыки в наших домах — проигрыватели компакт-дисков и мини-дисков. В принципе, чтобы перейти из 48 в 44,1 кГц (если бы рабочей частотой была последняя), необходимо затратить немного больше усилий (читай, денег), в преобразователь частот нужно встраивать дополнительные фильтры… Но все равно не понимаю.

Другая область, где широко употребляется термин CD-качество, — разнообразные схемы сжатия звука (MP3 и ему подобные). Обычно утверждается, что при определенном битрейте «по результатам тестирования» или «прослушивания независимыми экспертами» сжатый звук неотличим от несжатого оригинала на компакт-диске. Сколько-нибудь доверять таким тестам можно, только выяснив методику их проведения. Скажем, как вы отнесетесь к результатам тестирования, проведенного на кухне через динамик трехпрограммника «Маяк» с престарелой слушательницей в качестве эксперта? Придраться тут вроде не к чему: эксперт действительно независимый, в хорошо знакомой акустической обстановке (кухня + «Маяк»), на знакомом музыкальном материале («Риорита» с патефонной пластинки 1940-х годов, переписанная на компакт-диск через саундбластер) не смог отличить сжатый с битрейтом 12 кбит/с звук от компакт-диска. Конечно, это экстремальный пример, но очень часто тестирования, ангажированные производителем исследуемого продукта, проводятся примерно таким же образом. Пример тому — недавние тесты SDMI, показывающие, что их метку не слышно в музыкальном сигнале. На самом деле многие специалисты (да и обычные слушатели) могут отличить музыку с внедренным «водяным знаком» от «немеченной», но «кто девушку ужинает», тот и получает нужные ему результаты. Даже привлечение действительно квалифицированных экспертов не всегда прибавляет релевантности таким тестам: всегда можно развернуть результаты в нужную сторону подбором воспроизводящей системы, музыкального материала, методикой, да и просто атмосферой тестирования.

Отдельно хочется сказать о доморощенных независимых тестах, часто публикуемых на страницах компьютерных журналов. Как правило, они проводятся с применением рядовой звуковой карты (помните об SB Live?) и в лучшем случае HiFi-акустики среднего пошиба с соответствующим усилителем, а то и пластиковых компьютерных колонок. Аргументы тестирующих в данном случае таковы: зачем нам референсные АС, комната с тщательно выверенной акустикой и профессиональные звуковые карты, если наши читатели все равно слушают все это на обычных колонках и через стандартную звуковуху в своей спальне? Дело в том, что сжатие звука порождает целый букет искажений, причем чем выше битрейт, тем они менее выражены. Основное же назначение HiFi-аппаратуры — звучать красиво, то есть искажения прятать. Причем каждая модель ведет себя по-своему, какая-то прячет одно, но подчеркивает другое или наоборот. Со звуковыми картами примерно то же: MP3-искажения на высоких битрейтах — просто бальзам на уши по сравнению со звуковой молотилкой ресэмплинга в SB Live или шумом от видеокарты, бережно ретранслируемым десятидолларовым изделием из Тайваня. Поэтому результаты такого доморощенного тестирования показывают исключительно то, что на данной звуковой карте, на данном оборудовании, в данном помещении и для данного индивидуума А звучит лучше (хуже, равноценно), нежели для Б. Как А соотносится с Б в вашей гостиной, на ваших колонках и прочем — из такого тестирования выяснить невозможно. Недостатки, успешно маскируемые системой тестирующего, могут проявиться у вас во всем цвете (и наоборот, вы можете не услышать того, что показалось неприемлемым автору), даже если техника у вас одного класса. Отличие референсных систем (я имею в виду не HiEnd, а профессиональные высококлассные мониторные АС и усилители) от домашних состоит в том, что они предназначены для работы1, а не получения удовольствия от музыки, и соответственно выявляют малейшие недостатки в звучании. Причем если не все, то большую часть искажений или артефактов на них можно услышать (при условии, что помещение тоже акустически обработано, не вносит своих «поправок» в звучание и не «замыливает» звуковую картину). То же самое, разумеется, относится и к звуковой карте или иному воспроизводящему устройству. На такой референсной системе, где слышно практически все, переменным элементом остается только сам материал, и получение адекватных результатов зависит уже исключительно от ушей тестирующего и, естественно, вещества, расположенного между этими ушами. Соответственно результаты такого теста будут хорошо транслироваться на большинство домашних систем, и даже если вы у себя дома не заметите некоторые из недостатков того же сжатия, то, скорее всего, вылезут другие, да и вообще, как говорится, лучше перебдеть, чем недобдеть.

Так что же, не доверять тестам? Тут каждый решает сам. Я лично считаю, что на тесты, подготовленные производителем тестируемого продукта, ориентироваться не стоит (хотя иногда стоит принять их во внимание), «наколенные» исследования можно читать в качестве беллетристики и пропускать мимо ушей; имеет смысл всерьез прислушиваться к результатам, полученным авторитетными людьми на серьезной технике, а лучше всего тестировать аппаратуру самому. Например, с битрейтами это сделать очень просто, и вы получите результат для вашей системы и ваших ушей, что ценнее сотни прочитанных на эту тему статей. И ничего страшного, если вы не услышите разницу между MP3 на 64 кбит/с и компакт-диском, — значит, так сложилось (с колонками, звуковой картой или со слухом, это уже не важно), ну и не надо тогда тратить место на диске под безумные битрейты. Лично у меня дома на компьютере через динамики, встроенные в монитор, MP3 с битрейтом от 160 кбит/с звучат лучше компакт-диска. Видимо, ЦАП на CD-приводе намного хуже такового на звуковой карте.

Еще одно распространенное заблуждение: если звук уже оцифрован, его можно как угодно обрабатывать (в том числе и на компьютере) без потери качества. К сожалению, любая обработка (даже простое изменение громкости) приводит к деградации звука. Причем степень деградации зависит от качества применяемых алгоритмов. Кстати, вот еще один миф: многие считают, что если обработка (например, эквалайзер) цифровая, то она заведомо высококачественная. Это не так, во многих случаях аналоговая модификация сигнала даже предпочтительнее цифровой2. Как пример устройства, позволяющего выполнить цифровую обработку звука с высоким качеством, приведу эквалайзер фирмы Weiss, который несмотря на свою довольно высокую стоимость (около трех тысяч долларов) широко используется в мастеринг-студиях3 всего мира. Зачем, казалось бы, покупать такой дорогой прибор, если цифровой эквалайзер доступен в виде плагина за 50 долларов? Даже если ради этого плагина специально купить компьютер, все равно будет дешевле. Смею вас уверить, мастеринг-инженеры знают о существовании дешевых плагинов и с удовольствием бы их использовали, но… Приборы Дэниела Вейса покупают именно за их высокое качество, а вовсе не из снобизма: вот, мол, у нас тут эквалайзер за три штуки стоит, — те же люди при изготовлении мастер-дисков, отправляемых на завод, используют самые обычные «Плексторы» и болванки Verbatim и Tayio Yuden, не гнушаясь тем, что они «бытовые». Если продукт обеспечивает должное качество и удобство работы, то не важно, профессиональный он или бытовой, а если он еще и дешевый, то вообще замечательно.

Одним из показателей качества цифровой обработки является избыточная разрядность преобразований. В принципе для современной музыки вполне достаточно 16-битного кодирования звука. В этом можно убедиться, послушав качественно записанные и качественно изготовленные компакт-диски на достойной стереосистеме. И наращивание разрядности до, скажем, 24 бит практически не дает субъективного улучшения звучания на среднестатистической HiFi-системе. Конечно, тут не все так однозначно: для классической музыки с большим динамическим диапазоном разница будет более заметна, а для хип-хопа и подобных жанров вполне достаточно 12-14 бит. К тому же современные АЦП/ЦАП просто не могут обеспечить преобразование с точностью более 20-22 бит. Например, преобразователи фирмы dCS, являющиеся одними из самых лучших среди профессиональных приборов подобного класса (и довольно дорогих: цена двухканального АЦП или ЦАП составляет более 10 тыс. долларов), по утверждению производителя (!), имеют реальную точность не более чем 22 бита (и это очень оптимистическая оценка). Так что можете себе представить, какую реальную разрешающую способность имеют преобразователи, встраиваемые в обычную бытовую звуковоспроизводящую технику или компьютерные аудиокарты. И не обольщайтесь многообещающими надписями типа «24 bit converter» — это относится к микросхеме преобразователя, а не к его реальному разрешению. То есть на самом деле такая надпись означает, что преобразователь может принять (для ЦАП) или выдать (для АЦП) 24-битный цифровой поток. Всё, больше она ни о чем не говорит. Часто бывает, что и в очень хорошем (дорогом), и в посредственном (дешевом) АЦП или ЦАП стоят одни и те же чипы преобразования, а по звуку они отличаются на километр. Это происходит потому, что реальное качество преобразователей зависит прежде всего от дизайна их аналоговой части, хорошей защиты от наводок (как внешних, так и внутренних) и стабильности генератора частоты дискретизации. Разумеется, обеспечить все это с высоким уровнем качества сложно и дорого (да и места требуется много), поэтому для компьютерной звуковой карты или недорогого CD-проигрывателя неприемлемо.

Итак, зачем нам избыточная разрядность, если вроде бы 16 бит вполне достаточно? Рассмотрим простой пример. Единственным способом обработки цифрового звука является изменение громкости сэмпла, или цифрового отсчета по определенному алгоритму4. Больше с ним просто ничего нельзя сделать. Допустим, мы имеем сэмпл со значением громкости, равным 32527. И по имеющемуся у нас алгоритму надо его увеличить в 1,2201 раза (не думайте, что ситуация надуманная, — этот коэффициент соответствует повышению уровня на 1 дБ с точностью до четвертого знака после запятой). В результате у нас получается число 39686,1927. Куда девать то, что оказалось после запятой? Округлить? Тогда как округлить? Просто отбросить? Любое из этих решений вносит нелинейные искажения, причем они коррелируют с обрабатываемым сигналом. И хотя по уровню искажения невелики (значительно меньше аналоговых, а особенно ламповых, нелинейных), человеческий слух, в частности и из-за корреляции, к ним очень чувствителен. Субъективно эти искажения воспринимаются как «уплощение» или «омертвение» звука, он становится «цифровым», в плохом смысле этого слова. А ведь таких операций в цепочке обработок может быть несколько, и каждая при игнорировании знаков после запятой вносит свою лепту в «убивание» звука. Выход из ситуации один: попытаться сохранить максимальное количество знаков после запятой на всех промежуточных стадиях обработки, а на последнем этапе (например, перед записью 16-битного музыкального компакт-диска) корректно от них избавиться. Чтобы не отбрасывать «лишние» знаки, применяется повышенная разрядность: если внутренняя математика алгоритма, скажем, 32-битная, то перед обработкой исходный 16-битный сигнал переводится в 32 бита, затем в этом формате обрабатывается, а на выходе его разрядность корректно понижается до 16 бит. Среди корректных способов понижения разрядности одним из самых распространенных является dither (в переводе с английского — шум, в русской транскрипции мне попадались варианты дитер, дизер и даже дифер, так что во избежание путаницы я буду использовать англоязычное написание этого термина). Перед понижением разрядности (а точнее — простым отрубанием лишних бит; этот процесс называется транкейтом, от английского truncate) к сигналу подмешивается шум с уровнем, соответствующим последнему значащему биту (в нашем случае шестнадцатому, то есть около -96 дБ).

SPicture1-4.jpg

Спектр тестового сигнала 1кГц с уровнем -60 дБ

Увеличить

Этот случайный шум (в самом простейшем случае используется белый шум, то есть равномерный во всей полосе частот), складываясь с полезным сигналом, случайным же образом округляет наши знаки после запятой вверх или вниз, вне зависимости от сигнала. Dither как бы заменяет собой искажения, возникающие при транкейте, превращая их из заметных и раздражающих в обычный шум, к которому ухо очень терпимо (вспомните аудиокассету, ее шипение не мешает нам наслаждаться музыкой, так как шум постоянный и не коррелирован с сигналом, ухо просто к нему привыкает, и мы его не замечаем).

Кроме повышенной разрядности, конечно, есть еще много факторов, влияющих на качество выходного сигнала. Но здесь мы их рассматривать не будем, только отмечу, что очень важным является внимание к мелочам, так как даже маленькая и вроде бы незначительная деталь может угробить звук самым неожиданным образом. Естественно, разработка хорошего цифрового прибора или плагина дело довольно дорогое, к тому же сложный алгоритм отнимает много вычислительных ресурсов у компьютера или DSP, что опять-таки — деньги. Поэтому призываю вас крайне осторожно пользоваться функциями обработки, встроенными в программы, основным предназначением которых не является работа со звуком (например, CD-писалки). В этом случае производителю важно обеспечить наличие функции (изменение громкости, допустим), а о ее качестве никто уже не заботится.

Следующим пунктом у нас идет нормалайз (normalise). Принято считать, что при составлении, например, сборника из музыкальных композиций, взятых с разных CD, «нормализируя» каждую из этих композиций, мы добиваемся того, что все они будут звучать с одинаковой громкостью. Это не так, и сейчас объясню почему. В процессе «нормализации» программа анализирует весь звуковой файл, находит в нем самый громкий (по абсолютному значению) сэмпл, затем рассчитывает, на сколько нужно поднять громкость, чтобы этот сэмпл по громкости «уперся» в ноль, и увеличивает громкость всей фонограммы на вычисленное значение. Таким образом, выравнивание происходит по пиковым значениям уровня. Но наш слух устроен так, что мы воспринимаем громкость не по пиковому, а по среднеквадратичному (RMS, Root Mean Square) уровню сигнала. Поэтому музыка со средним уровнем -12 дБ и кратковременными пиками до -2 дБ будет субъективно громче музыки с RMS = -17 дБ и пиками до 0. Соответственно, выравнивая треки по пиковым значениям, мы никоим образом не равняем их по ощущаемой нами громкости; более того, «нормализируя», мы можем еще больше увеличить разрыв по уровню между композициями (как в вышеприведенном примере: нормализуя обе композиции, мы повысим уровень первой, которая и так громче, еще на 2 дБ, а вторая останется неизменной). К тому же на большинстве выпускаемых сегодня компакт-дисков при мастеринге уровень и так подгоняют под ноль (или очень близко к нему), так что нормализация ничего не даст. Еще одним аргументом против нормализации является то, что это все-таки обработка звука, а, как мы уже выяснили, обработка бывает хорошей и плохой. Практически во всех программах (как любительских, типа «нажал кнопку и все хорошо», так и полупрофессиональных) «нормалайз» является вторичной функцией, «для галочки», поэтому выполняется она обычно с 16-битным разрешением5, со всеми вытекающими отсюда негативными последствиями для звука. Поэтому я бы советовал использовать эту функцию очень осторожно, а лучше не трогать ее совсем.

Следующее заблуждение (или даже комплекс заблуждений) — о непогрешимости передачи сигналов по цифровым интерфейсам. Например, если на вашей звуковой карте есть цифровой выход и оттуда сигнал подается на внешний ЦАП (скажем, встроенный в мини-дисковый рекордер), то качество звука-де будет зависеть исключительно от этого внешнего преобразователя. Сейчас будем выяснять, почему это не так. Здесь на сцену выходит понятие джиттер (jitter). Этот термин часто встречается в различных «околохайфайных» журналах, но из них, к сожалению, сути явления понять практически невозможно. Джиттер — это нестабильность тактовой частоты цифрового сигнала. То есть она в принципе 44,1 кГц, но временные интервалы между сэмплами немного отличаются друг от друга (на несколько пикосекунд). На слух джиттер выражается в легкой замутненности звука, «размытости», плохой локализации кажущихся источников звука и сужении стереобазы. Вызван же он может быть рядом причин. Первая — нестабильность тактового генератора передающего устройства. Разумеется, высокостабильный генератор стоит недешево, и в недорогих приборах обычно ставят «лишь бы играло». Еще одна причина — помехи. Если в обычном CD-проигрывателе источником сильных помех может быть только блок питания (при недостаточной изоляции от цифровых схем), то корпус компьютера — просто рассадник сильных высокочастотных помех: тут и блок питания, и процессор, и чипсет, и видеокарта, и еще бог знает что. Все это расшатывает и без того не самую стабильную частоту тактовых импульсов на звуковой карте. Из-за этих неустранимых помех, кстати, все профессиональные компьютерные системы записи генерируют тактовые импульсы не на карте, вставленной в компьютер, а во внешних интерфейсах, на которых и расположены цифровые входы/выходы. Последняя (и одна из самых главных) причин возникновения джиттера — плохие и/или не согласованные с приемником/передатчиком цифровые кабели. Для коаксиального SPDIF-соединения должны использоваться коаксиальные же 75-омные кабели, для оптического — специальный провод (он, кстати, пластиковый, а не стеклянный, как думают многие). Поэтому если у вас нет возможности купить готовый коаксиальный SPDIF-провод, то лучше не использовать первый попавшийся «тюльпан-тюльпан», а взять антенный кабель (он как раз коаксиальный с сопротивлением 75 Ом) и напаять на него соответствующие разъемы. Кстати, вот еще легенда: дескать, электрический SPDIF хуже оптического. Качественно сделанный коаксиальный провод, согласованный по сопротивлению с приемником и передатчиком, ничуть не хуже, а при передаче сигнала на большие расстояния (десятки метров) даже лучше оптического. Другое дело, что вместо нормального провода норовят использовать обычные «тюльпан-тюльпаны» из ближайшего ларька; с оптикой же такой фокус не пройдет, отсюда, видимо, и легенда.

jitter.jpg

Возникновение джиттера. А — чистый цифровой сигнал, Б — искаженный многочисленными помехами (схематично). X — «длительность» передаваемого бита при данной частоте дискретизации. Из рисунка видно, что хотя длительность передачи отдельных бит из-за помех изменилась, общее время передачи четырех бит осталось тем же самым. Неизменной осталась и сама передаваемая информация (биты 1, 0, 1, 0).

Итак, тем или иным способом мы получили наш джиттер. Теперь он приходит на ЦАП, и если преобразователь не имеет мощной системы джиттероподавления (а такие системы встраиваются только в очень дорогие профессиональные, вроде упомянутого dCS, или класса HiEnd ЦАПы), то вы его непременно услышите. Заметьте, что ухудшение звука из-за джиттера происходит в передающем устройстве и проводах, а не во внешнем преобразователе. Хотел бы обратить ваше внимание на то, что джиттер проявляется только в цифро-аналоговых преобразователях. На содержимое сигнала, то есть собственно биты, он не влияет. Если вы переписываете музыку, скажем, на мини-диск из своего компьютера через паршивый провод, то в момент записи, несомненно, услышите джиттер. Но когда вы будете запись слушать, то джиттера уже не будет, так как цифровой поток воспроизводится, используя внутренний генератор проигрывателя, а не расхлябанные тактовые импульсы, принесенные со звуковой карты. Если вы не поняли последней фразы, взгляните еще разок на рисунки, и после небольшого размышления вам все станет ясно.

И наконец, последнее. Бытует мнение, что компакт-диски, идентичные побитно, звучат одинаково. Почему они звучат все же по-разному, абсолютно точно, к сожалению, не известно. Но это факт, подтвержденный многими авторитетными людьми. Вероятно, тут тоже приложил свою руку джиттер, возникающий из-за нестабильной скорости считывания битов с диска. Так что имейте в виду, что отпечатанный на заводе компакт-диск и его точная копия, сделанная на вашем компьютере, по звуку могут различаться. Причем в какую сторону, заранее не известно. При некотором стечении обстоятельств (например, оригинал был отпечатан на плохом станке) копия может звучать даже лучше оригинала. Также различаются диски, записанные на разных скоростях с одного и того же файла. Обычно чем меньше скорость, тем лучше, хотя и тут есть исключения. Впрочем, эти отличия весьма невелики и заметны только на очень хороших воспроизводящих системах.

Подводя итог, хочу призвать читателя больше верить собственным ушам, чем написанному на бумаге (даже на этой). Иногда теоретические правила сильно расходятся с реальной жизнью, обычно из-за плохо спроектированного прибора или программы. Например, совершенно справедливо утверждение, что при прочих равных запись, сделанная через цифровой вход магнитофона, предпочтительнее записи, сделанной через аналоговые входы (лишняя переоцифровка). Но я имел дело с MD-рекордером, опровергавшим это правило: записанное в него через аналог звучало гораздо лучше «цифры» (один и тот же материал с CD). Вероятно, на цифровых входах этого аппарата был такой же ресэмплинг, как и в SB Live, только еще худшего качества (спрашивается, зачем там защита от цифрового копирования SCMS?). Так что теоретические знания — это одно, а жизнь, благодаря изобретательным производителям, намного богаче, слушайте и услышите.

P. S. Желающим углубить свои знания о цифровом звуке могу порекомендовать сайт www.digido.com. Там хотя и на английском, но очень хорошо все изложено.


1. Почти все звукорежиссеры себе домой ставят обычные HiFi-стереосистемы (хотя имеют возможность обзавестись и профессиональными колонками), так как слушать музыку дома через мониторные АС удовольствие ниже среднего — слышишь не музыку, а огрехи в записи или исполнении. [вернуться]

2. Меня, например, очень смущает цифровой «мегабасс» в некоторых плейерах или цифровое изменение громкости в иных системах. Очевидно, что это не шаг к качеству, а просто — маркетинговый ход. [вернуться]

3. Мастеринг — это процесс подготовки фонограмм для издания на некотором носителе (CD, DVD, MP3). В мастеринг обычно входит «подгонка» композиций в альбоме по громкости, частотному балансу (тут и используют эквалайзеры) и динамическому диапазону. [вернуться]

4. Исключениями из этого правила являются обработка типа изменения длительности или высоты звука (time stretch и pitch shift), когда происходит добавление новых, не имевшихся в фонограмме сэмплов, или удаление «лишних», по мнению алгоритма, отсчетов. Сюда же относится и ресэмплинг. [вернуться]

5. А если и с большим (24 или 32 бита), то зачастую разрядность понижается некорректно, без dither‘а, простым транкейтом. [вернуться]


Автор
Антон Балабан

Комментарии