Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Особенности стандарта MPEG–2 ISO/IEC 13818



MPEG-2 Standart ISO/IEC 13818-3 (принят в марте 1994 г.) рас­ширяет и дополняет MPEG-1 Standart ISO/IEC 11172-3 до возможно­сти формирования в едином цифровом потоке пяти отдельных звуко­вых каналов и дополнительно канала сверхнизких частот (LFE – Low Frequence Enhancement) с высоким качеством и низкой суммарной ско­ростью их передачи. Тем самым становится возможным передать в ци­фровой форме по каналам связи, записать и воспроизвести в помещении прослушивания (комната радиослушателя, видеозал, кинотеатр и т.п.) всю совокупность конфигураций форматов воспроизведения, предусмо­тренных Документом 10/63Е ITU-R (см. разд. 9.16 и табл. 9.5).

В MPEG-2 стандарте может быть организована передача любой кон­фигурации ЗС: 3/2, 3/1, 3/0, 2/2, 2/1, 2/0, 1/0, а также общего канала сверхнизких частот с полосой до 150 Гц (система звукопередачи 5+1). Напомним, что сформированный в ТФП пятиканальный ЗС перед коди­рованием подвергается матрицированию с целью выполнения требова­ний совместимости и лишь после этого цифровой обработке для сокра­щения избыточности. Для компактного цифрового представления ЗС в данном случае используется метод кодирования MUSICAM, но в отли­чие от MPEG-1 в этом новом стандарте расширен состав применяемых кодеков и используемых частот дискретизации: 16, 22,05 и 24 кГц (до­полнительно к ранее предусмотренным значениям: 32, 44,1 и 48 кГц). Стандарт MPEG-2 позволяет передавать одновременно: стереофониче­ские сигналы в двух конфигурациях (3/0 и 2/0); стереофоническое зву­чание и дополнительно речь на двух языках; моносигнал и дополни­тельно до семи комментаторских каналов с более низким качеством, используя дополнительные частоты дискретизации 16, 22,05 и 24 кГц. В этом новом формате декодер ISO/IEC 11172-3 (MPEG-1) может вос­станавливать два канала без дополнительной многоканальной части, а декодер MPEG-1 ISO/IEC 13818–3 расшифровывать поток данных фор­мата 111723, как устройство более высокой иерархии.

Итак, для пары основных сигналов стереопары Л = Т0 и П = Т1 выполнено требование как прямой, так и обратной совместимости при декодировании (рис. 12.38).

Алгоритм декодирования дополнительных сигналов многоканаль­ного расширения Т2, Т3, T4, иной, достаточно гибкий, ориентированный на максимально допустимое сокращение скорости цифрового потока при их передаче. Кроме того, длина фрейма в MPEG-2 составляет 48 мс вме­сто 24, поэтому для распознавания нового формата ID-бит в MPEG-1 принимает значение 0 (см. разд. 12.14).

В зависимости от вида кодирования декодер MPEG-2 ISO/IEC 13818-3 может декодировать либо чистую стереоинформацию [сигналы Л и П, см. (9.48)] или смесь сигналов нескольких каналов.

Заметим, что пространственные сигналы LS и RS имеют полосу частот 100... 7000 Гц, как это принято в системе " Dolby-Surround ", Полоса частот сигнала С ограничивается значением 9 кГц, лишь два сигнала L и R имеют полную полосу частот.

Матрица кодирования и декодирования исходного пятиканального сигнала МРЕG-2 стандарта представлена на рис. 12.39. На передающей стороне системы звукопередачи исходный пятиканальный сигнал пре­образуется в новую совокупность в соответствии со следующим алгорит­мом (это преобразование выполняется для того, чтобы удовлетворить требованию совместимости, см. гл. 9):

То = Л = a L + ab С + g aLS,

T1 = П = aR + ab С + g aRS, (12.49)

Т2=abС,

Т3 = agLS,

Т4 = g aRS,

где a, b, g – постоянные коэффициенты, которые могут иметь различ­ные значения (табл. 12.1) в зависимости от режима работы.

Последняя строка в этой таблице соответствует режиму работы, ко­гда исходная совокупность сигналов без матрицирования прямо дово­дится до пользователя. Далее, чтобы избежать возможной перегрузки уровни сигналов Т0, T1, Т2, Т3, Т4 при передаче понижаются на зна­чение а. Режим 2 соответствует передаче сигналов системы «Dolby-Surround», поэтому при их дематрицировании для выделения простран­ственных сигналов должен выполняться поворот фазы сигналов Л и П соответственно на ±90°.

На рис. 12.40 изображена в упрощенном виде структура МРЕG-2 кодера для многоканальной звукопередачи. Исходными здесь являются входные сигналы LS,L,C,R,RS. Сигнал С центрального фронтального канала ограничивается по полосе сверху значением 9 кГц, а его более высокочастотные компоненты распределяются на левый L и правый R фронтальные каналы.

Режим Коэффициенты матрицирования
a b g
  1/(1+2) 1/(1.5+0,5х2) 1/(1+2) 1/2 1/2 1/2 1/2 (см. рис. 12.41) 1/2 (см. рис. 12.41) 1/2 (для сигналов Л и П сдвиг по фазе ±90°) 1 (без матрицирования)

Все исходные сигналы анализируются с учетом психоакустической модели. Кроме того, с помощью банка фильтров, как и ранее в МРЕG-1 стандарте, каждый из сигналов разделяется на 32 по­лосные составляющие, а затем дискретизируется с различной частотой дискретизации, но кратной системной тактовой частоте fs.

Сигналы С, LS, RS дополнительных каналов квантуются до коди­рования, чтобы уменьшить ошибки при их матрицировании. Далее все сигналы "взвешиваются" (a, b, g), после чего поступают на сумматоры (+) для получения совместимых сигналов обычной стереофонии Л = Т0 и П = Т1. Эта основная пара сигналов дополняется тремя дополнитель­ными сигналами T2, Т3, Т4, которые должны по возможности иметь при передаче как можно меньший суммарный поток аудиоданных.

В МРЕG-2 стандарте для получения максимально возможной ком­прессии общего цифрового потока при кодировании дополнительного многоканального расширения (сигналы Т2, Т3, Т4 учитываются также и степень корреляции между основными Т0, Т1 и дополнительными T2, Т3, Т4.) сигналами. Если корреляция сильная, то от передачи данных по дополнительным каналам можно отказаться и передавать лишь раз­личия по отношению к сигналам основных каналов. Для этой цели служит адаптивное предсказание, которое используется в МРЕG–2 ко­дере при передаче дополнительных сигналов. Более того, сам состав передаваемых сигналов в дополнительных каналах не постоянен.

Воз­можны следующие восемь их комбинаций с соответствующим переклю­чением в кодере:

Т0 Т1 Т2 Т3 T4

Л П С LS RS

Л П L LS RS

Л П R LS RS

Л П С L RS

Л П С LS R

Л П С L R

Л П R L RS

Для уменьшения скорости передачи данных в МРЕG-1 предусма­тривается режим "Joint-Stereo" ("объединенное стерео"), в котором для области верхних частот в левом и правом каналах передаются только ко­эффициенты масштаба, сами же сигналы этой области остаются моно­фоническими. При более двух передаваемых сигналах можно исходить из того, что не каждый из них одновременно нуждается в максимальном потоке данных при его передаче. Для восприятия ЗС не требуется пол­ная передача всей информации в каждом из них. Как правило, вся необ­ходимая для полноценного восприятия информация в текущий момент времени содержится не более чем в двух-трех сигналах, остальные же из них в этот момент времени являются как бы "фоновым дополнением". Например, если в текущий момент явно ощущается какое-то приоритет­ное направление в пеленгации КИЗ, то значительная доля информации в паре сигналов, определяющих его восприятие, идентична. В этой связи в МРЕG-2 стандарте предусматривается значительно более гибкий метод для компрессии общего потока данных – так называемое динамическое переходное затухание между каналами, что позволяет экономить значи­тельное число бит при передаче.

Таблица 12.2

Номер группы полосных сигналов                        
Номер полосной состав­ляющей исходного сигнала                 8, 9 10, 11 12-15 16-31

Для одного, двух или трех каналов передаются, как и при режиме "Joint-Stereo", лишь коэффициенты мас­штабирования, с помощью которых после декодирования меняется лишь соотношение уровней данной группы сигналов, остающихся одинаковы­ми по структуре (монофоническими, точнее говоря изоморфными).

Иначе говоря, все значения отсчетов для таких групп частотных полос остаются общими и одинаковыми, кроме значения уровня. Оди­наковыми и общими после декодирования являются и сами эти сигналы, наблюдаются лишь отличия в их уровне, необходимые для пеленгации (локализации) источника звука. В этой ситуации требуется лишь пере­дать коэффициенты масштаба, а сами значения отсчетов восстанавли­ваемого сигнала берутся из другого канала. Таким образом, корреляция сигналов различных каналов используется здесь для дополнительной компрессии данных.

И еще одно замечание – при передаче многоканального расши­рения субполосные сигналы объединяются в 12 групп (табл. 12.2) для их последующего анализа и обработки с целью управления значением динамического переходного затухания между каналами многоканально­го расширения. В выходной части кодера все множество разделенных цифровых данных форматируется в соответствии с определенными пра­вилами в единый цифровой поток.

Изложенное позволяет говорить о существенном отличии алгоритма обработки сигналов многоканального расширения в кодере MPEG-2 по сравнению с MPEG-1. Это отличие базируется на еще более тонком уче­те как структуры многоканального сигнала, так и свойств слуха при его восприятии, и преследует только одну цель – обеспечить максималь­но возможное сокращение избыточности передаваемой информации, а значит, и уменьшение скорости цифрового потока при его передаче.

На рис. 12.41 изображена упрощенная структурная схема MPEG-2 декодера. Входной цифровой поток данных разделяется во входной ча­сти устройства на сигнальные и управляющие составляющие, а затем восстанавливаются первоначальные значения отсчетов ЗС. Декодиро­ванные ЗС подвергаются обратному преобразованию в матрице в каждой из 32 полос. И наконец, различные полосные составляющие каждого из сигналов вновь объединяются в инверсном банке фильтров. На выходе декодера получается исходная совокупность восстановленных сигналов Л, П' и LS', L', С', R', RS'.





Дата публикования: 2015-01-23; Прочитано: 386 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.008 с)...