Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Цифровое представление звука



Основные понятия

Фундаментом цифровой звукозаписи является преобразование непрерывного аналогового сигнала в последовательность чисел, называемых отсчетами и отображающих его амплитуду, измеряемую через равные промежутки времени. Такая процедура называется аналого-цифровым преобразованием, а устройство для ее реализации - аналого-цифровым преобразователем (АЦП).

Числа, полученные в результате аналого-цифрового преобразования, выражаются в двоичной системе исчисления, т.е. в виде комбинаций всего двух цифр - "нулей" (0) и "единиц" (1).

Процесс преобразования непрерывного аналогового сигнала в последовательность его мгновенных значений (выборок) называется дискретизацией (рисунок 1, б).

Определение численного значения величины выборки (отсчета) называется квантованием. Для этого весь диапазон возможных изменений амплитуды преобразуемого сигнала делится на множество уровней квантования, количество которых определяется разрядностью используемого при этом двоичного числа. Чем больше число разрядов квантования, тем меньше расстояние между уровнями квантования (шаг квантования) и тем выше получается точность преобразования.

В процессе квантования за величину выборки (отсчет) принимается номер ближайшего уровня квантования (рисунок 1, в).

В большинстве ныне существующих цифровых звуковых форматов используется 16-разрядное квантование. Это позволяет получить точность преобразования 1/216 = 1/65536.

С числом разрядов квантования N физически связан динамический диапазон D звукового сигнала:

D=6N+1,8=6х 16+1,8=98 дБ

Следовательно, для цифровых систем звукозаписи с 16-разрядным квантованием:

D»6х16+2= 98 дБ

Скорость следования отсчетов в секунду называется частотой дискретизации, а расстояние между двумя соседними отсчетами - периодом дискретизации.

Выбор частоты дискретизации в общем случае определяется известной теоремой Котельникова (теоремой отсчетов).

При этом минимально возможная частота дискретизации Fд = 2fm называется частотой Найквиста Fн.

Fн=2fm

На практике частота дискретизации Fд = (2,1 - 2,4)fm.

В зарубежной литературе в аналогичных случаях ссылаются на теорему Шеннона, которая, по сути, имеет тот же смысл, что и теорема Котельникова.

Дальнейшие рассуждения будут более понятными, если взглянуть на полную схему тракта аналого-цифрового преобразования, показанную на рисунке 2.

Чаще всего требуемая полоса звуковых частот ограничивается 20-22 кГц, а частота дискретизации при этом выбирается равной 44,1 или 48 кГц.


 
 

Рисунок 2 Схема структурная. Блок АЦП

Это связано с тем, что между наивысшей частотой звукового диапазона fm и половиной частоты дискретизации Fд/2 должен быть некоторый интервал, в который нужно поместить срез амплитудно-частотной характеристики (АЧХ) фильтра низких частот (ФНЧ), расположенного на входе блока аналого-цифрового преобразования. Этот ФНЧ, который называется анти-элайсинг фильтром, нужен для того, чтобы ни одна составляющая спектра выше Fд/2 не попала на преобразователь. Дело в том, что спектр дискретизованного сигнала обладает периодической структурой. Кроме низкочастотной части, отображающей сам звуковой сигнал, он имеет еще и высокочастотные компоненты в виде боковых полос с центрами в точках, кратных частоте дискретизации (рисунок 3). Если спектр звукового сигнала перед преобразованием не ограничить, то его высокочастотная часть может наложиться на смежную боковую полосу. При этом в преобразованном сигнале возникнут неустранимые искажения субдискретизации в виде паразитных высокочастотных составляющих (рисунок 3, б). Звучание фонограммы будет безнадежно испорчено.

Поскольку в процессе квантования отсчеты могут принимать только значения, кратные шагу квантования D, то при оценке истинного значения выборки неизбежно будет возникать некоторая ошибка q (рисунок 4). Очевидно, что величина ошибки равна половине шага квантования и не зависит от уровня квантуемого сигнала. Функцию q(t) принято называть шумом квантования. Шум квантования будет тем ниже, чем меньше шаг квантования, или что то же самое, чем больше число разрядов квантования.

Очевидно также, что влияние шума сильно зависит от уровня преобразуемого аналогового сигнала. Если его амплитуда мала, то возникают характерные искажения, обусловленные появлением высших гармоник из-за зубчатой формы шума квантования. Причем, на слух это воспринимается именно как искажения, а не как шум.

Ослабить влияние таких искажений можно - как ни парадоксально это звучит - с помощью добавления другого шума. Если подмешать во входной сигнал так называемый "белый" шум (шум, амплитуда которого практически постоянна в широком диапазоне частот), то корреляция (связь) между шумами квантования и амплитудой сигнала нарушается. При этом воспроизведенный сигнал уже не будет выглядеть искаженным Добавление такого шумоподобного маскирующего сигнала (дифера) является весьма важной частью процесса преобразования.

Назначение еще одного элемента тракта аналого-цифрового преобразования - устройство выборки и хранения (УВХ) ясно из его названия (рисунок 2). Оно предназначено для удержания значения квантуемого сигнала на время преобразования.

До сих пор речь шла о таком виде аналого-цифрового преобразования, когда расстояние между уровнями квантования одинаково во всем диапазоне изменения амплитуды преобразуемого сигнала.

Этот вид квантования называется линейным или квантованием с постоянным шагом (рисунок 1). Однако иногда для преобразования используют нелинейное квантование или квантование с переменным шагом. В этом случае шаг квантования увеличивается с увеличением уровня преобразуемого сигнала. Для слабых сигналов шаг квантования маленький, для сильных сигналов - большой. При прочих равных условиях такой вид квантования позволяет лучше передавать слабые сигналы, поскольку отношение сигнал/шум в этом случае будет выше, чем в случае линейного квантования.

Кроме того, нелинейное квантование позволяет значительно повысить плотность записи (или скорость передачи информации), так как малым числом разрядов можно передавать большой динамический диапазон сигнала.

Преобразование линейной характеристики в нелинейную осуществляется после АЦП с помощью специального цифрового кодирующего устройства. Обратное преобразование в воспроизводящем (или приемном) устройстве реализуется декодером с характеристикой, представляющей собой зеркальное отражение характеристики кодера относительно линейной характеристики.

Однако, при всех своих достоинствах, нелинейное квантование имеет один очень существенный недостаток. Слабые сигналы (или обертоны) на фоне сильного сигнала (на участках характеристики с широким шагом квантования) могут сильно искажаться или даже исчезать совсем. Поэтому качество звука при нелинейном квантовании всегда хуже, чем при линейном.

Процесс обратного преобразования последовательности отсчетов в аналоговый сигнал называется цифро-аналоговым преобразованием, а устройства для его осуществления - цифро-аналоговыми преобразователями (ЦАП) (рисунок 6).

На выходе ЦАП получается ступенчатый аналоговый сигнал, величина ступенек которого равна численному значению соответствующих отсчетов. Чтобы из ступенчатого сигнала получить гладкую кривую, его необходимо пропустить через ФНЧ с характеристикой, аналогичной той, которую имел ФНЧ на входе АЦП (рисунок 3). Здесь так же важно, чтобы спектр звукового диапазона не перекрывался со спектром ближайшей боковой полосы, ибо это также приведет к появлению искажений.

Для этого характеристика ФНЧ должна иметь достаточно крутой срез так же, как в случае анти-элайсинг фильтра при аналого-цифровом преобразовании. Порядок такого ФНЧ должен быть не ниже 12-го. Однако построение фильтров высокого порядка связано с известными трудностями. Здесь требуется применение прецизионных пассивных элементов и высококачественных операционных усилителей с хорошей температурной и временной стабильностью. Причем, поскольку все это предназначено для использования в бытовом аппарате небольших размеров, все компоненты должны быть к тому же малогабаритными.

Кроме того, всякий фильтр высокого порядка обладает нелинейной фазовой характеристикой. А это приводит к заметным на слух искажениям звуков с крутыми перепадами уровня - барабанов, тарелок, рояля и пр.

Чтобы облегчить требования к фильтрации преобразованного сигнала, перед ЦАП устанавливается цифровой фильтр. Выполнить такой фильтр с нужными характеристиками значительно проще, чем аналоговый. Он может иметь достаточно высокий порядок и при этом обладать линейной фазовой характеристикой.

Однако, характеристика цифрового фильтра, как и спектр цифрового сигнала, тоже имеет периодическую структуру и тоже повторяется на частотах, кратных частоте дискретизации. Поэтому, если цифровой фильтр будет работать на частоте дискретизации Fд, то подавить высокочастотные компоненты все равно не удастся.

Проблема может быть решена путем искусственного увеличения частоты дискретизации Fд в несколько раз. При этом недостающие значения сигнала вычисляются по известным значениям методами интерполяции (рисунок 7). Схема блока цифро-аналогового преобразования в этом случае приобретет вид, показанный на рисунке 8.


Передискретизация позволяет значительно снизить требования к характеристике аналогового ФНЧ. Даже удвоение Fд дает возможность сделать срез егоАЧХ довольно пологим (рисунок 9 а). А при увеличении частоты дискретизации в четыре, восемь и более раз, требования к аналоговому ФНЧ снижаются до вполне заурядных (рисунок 9 б, в). За счет этого отношение сигнал/шум, а следовательно, и динамический диапазон, можно сделать даже большим, чем определяемая 16-разрядным квантованием величина в 98 дБ.


2 Формат «компакт-диск»

Рассмотрим наиболее известный и распространенный формат CD. При этом достаточно будет обратить внимание только на то, что впрямую влияет на качество звука, не углубляясь в работу систем автоматики, синхронизации и обработки служебной информации.

Вся процедура отображения состоит из трех основных этапов (рисунок 10). Первый — это аналого-цифровое преобразование, во время которого непрерывный аналоговый сигнал приобретает вид последовательности 16-разрядных двоичных чисел. Второй — это помехоустойчивое кодирование, защищающее цифровую информацию от воздействия всякого рода искажений. И, наконец, третий этап — это канальная модуляция полученного двоичного потока кодом EFM.

Квадрат с надписью «Блок АЦП» на рисунок 10 означает не только само аналого-цифровое преобразование, но и предшествующую ему фильтрацию звукового сигнала фильтрами низких частот (ФНЧ), необходимую для устранения из спектра преобразуемого сигнала всех частотных составляющих выше 20 кГц.

Помехоустойчивое кодирование включает в себя два этапа непосредственно самого кодирования информации кодами Рида-Соломона и три этапа перемежения. Вся эта система в целом носит название CIRC (Cross Interleave Reed-Solomon Code).

Канальная модуляция нужна для того, чтобы преобразовать полученный ранее цифровой поток к виду, удобному для записи на носитель с высокой плотностью и последующего считывания с высокой достоверностью. Код модуляции носит название EFM (Eight to Fourteen Modilation), потому что основан на преобразовании 8-разрядных двоичных групп (символов) в 14-разрядные группы.

Рисунок 10 Преобразование звукового сигнала перед записью на носитель

Это что касается процесса преобразования звука перед записью на носитель. При воспроизведении все будет происходить наоборот (рисунок 11). Сначала считанный сигнал демодулируется (т. е. преобразуется из 14-разрядной формы в 8-разрядную). Затем производится декодирование помехоустойчивого кода; позволяющее обнаружить и исправить искажения в считанном сигнале. И, наконец, в блоке цифро-аналогового преобразования двоичный поток приобретает форму непрерывного аналогового сигнала, который можно подать на усилитель и услышать звук. Показанный на рисунке 11 блок ЦАП также, кроме самого преобразователя цифра/аналог, содержит в себе аналоговые и цифровые ФНЧ и может содержать фильтры передискретизации и модуляторы дельта-сигма.

Рисунок 11 Преобразование считанного с носителя цифрового звукового сигнала.

Как известно, преобразование аналогового звукового сигнала в цифровой осуществляется путем кодирования мгновенных значений его амплитуды (отсчетов) 16-разрядным двоичным кодом. Поскольку система стереофоническая, то такому преобразованию подвергаются оба стереоканала.

Затем 16-разрядные выборки обоих каналов делятся пополам на 8-разрядные кодовые символы, и объединяются в одну последовательность (поочередно), каждые 24 последовательных символа образуют один кадр информации. После этого, с целью защиты от возможных искажений при воспроизведении, над ними дважды производится операция кодирования кодами Рида-Соломона и трижды — перемежения.

На каждом из этапов кодирования кодами Рида-Соломона, по имеющимся в пределах одного кадра информационным символам вычисляются по четыре так называемых проверочных символа. Кадр в том случае будет называться кодовым словом. Проверочные символы содержат в себе данные обо всех информационных символах кодового слова и друг о друге. При воспроизведении, с помощью этих символов можно будет установить, достоверны ли символы данного кодового слова. И если это так, и среди них оказались искаженные, то узнать, какие именно и восстановить их первоначальные значения.

В каждом кодовом слове (кадре) таких проверочных символов получается восемь. Значит, вместе с 24-мя информационными всего получается 32.

Перемежение (перемещение символов на другие позиции в цифровом потоке) также является одним из способов защиты информации от искажений. Дело в том, что коды, обнаруживающие и исправляющие ошибки (коды Рида-Соломона), могут откорректировать не более двух искаженных символов на кадр. А если повреждение будет более или менее длинным, то в один кадр попадет значительно больше ошибок, и исправить их будет невозможно. Если же информацию перед записью перемещать так, чтобы символы одного кадра прераспределились между символами других кадров на достаточно длинном участке дорожки, то даже очень сильное повреждение не сможет испортить более одного-двух символов на каждый кадр. И, после того, как порядок следования будет восстановлен, корректирующие коды легко справятся с такими ошибками.

После выполнения операций помехоустойчивого кодирования и перемежения, к каждому кадру добавляется еще один — 33-й символ. Он является служебным и содержит информацию, необходимую для управления работой проигрывателя. Кроме того, добавляется синхрогруппа, которая определяет границу между соседними кадрами (рисунок 13).

После этого полученный цифровой поток модулируется канальным кодом EFМ и записывается на оптический диск с помощью лазера.

На компакт-диске — записанный сигнал имеет вид спиральной дорожки, состоящей из микроуглублений — «пит» — и промежутков между ними. Длина пит колеблется от 0,9 до 3,3 мкм, ширина— 0,6— 0,8мкм и глубина— 0,1мкм.Длина промежутков — такая же, как и у самих пит.

Рисунок 13 Построение кадра информации.

Шаг дорожки — 1,6мкм. Питы и промежутки между ними соответствуют «единицам» и «нулям» записанного на диске двоичного кода. При считывании информации лучом полупроводникового лазера, питы рассеивают падающий на них свет, а промежутки — отражают назад в объектив. Разница между интенсивностью попадающего в объектив света при рассеянии на питах и отражении от промежутков соответствует «единицам» и «нулям» цифрового кода.

Информационный слой компакт-диска находится со стороны этикетки, а считывание информации осуществляется со стороны прозрачной основы, т. е. через всю толщину диска, которая составляет 1,2 мм.

Таким образом, записанная информация защищена от повреждений с одной стороны материалом самого компакт-диска, с другой — слоем прочной пластмассы с этикеткой. Поскольку при считывании луч лазера фокусируется только на самой дорожке, то мелкие царапины и пылинки на поверхности диска не особенно влияют на качество воспроизведенного сигнала.





Дата публикования: 2014-12-11; Прочитано: 829 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.011 с)...