Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Формат MPEG Layer 3. Его основные характеристики



Для эффективного кодирования аудиоданных применяются наиболее прогрессивные методы, в основе которых свойство их универсальности и независимости от качества исходного звукового фрагмента, равно как и результирующего, в зависимости от установок, применяемых в ходе сжатия. В настоящее время наиболее известны mp3, wma и divx audio. Все они используют кодирование для восприятия (perceptual coding), при котором из звукового сигнала удаляется информация, малозаметная для слуха. В рез-те, несмотря на изменение формы, и спектра сигнала, его слуховое восприятие практически не меняется, а степень сжатия оправдывает незначительное уменьшение качества. Такое кодирование относится к методам сжатия с потерями, когда из сжатого сигнала уже невозможно точно восстановить исходную волновую форму.

Приемы удаления части информации базируются на особенностях человеческого слуха, называемой маскированием: при наличии в спектре звука выраженных пиков (преобладающих гармоник) более слабые частотные составляющие в непосредственной близости от них на слух практически не воспринимаются (маскируются).

При кодировании весь звуковой поток разбивается на мелкие кадры, каждый из которых преобразуется в спектральное представление и делится на ряд частотных полос.

Внутри полос происходит определение и удаление маскируемых звуков, после чего каждый кадр подвергается адаптивному кодированию прямо в спектральной форме. Все эти операции позволяют в несколько раз уменьшить объем данных при сохранении качества, приемлемого для большинства слушателей. Описанные методы кодирования хар-ся скоростью битового потока, с которой сжатая информация должна поступать в декодер при восстановлении звукового сигнала. Декодер преобразует серию сжатых мгновенных спектров сигнала в обычную цифровую волновую форму.

Информация в MPEG-файле записана последовательными блоками — кадрами (frames), которые последовательно считываются, а затем декодируются. Чем больше поток, тем большее количество информации остается в файле => тем большее представление об оригинальном звуке в нем содержится. Аудиоинф-ия, сжатая по данной схеме, может передаваться потоком (streaming), а может храниться в файлах формата MP3 или WAV- MP3(наличие дополн-го заголовка WAV- файла => при наличии MP3-кодека в системе для работы с таким файлом можно использовать стандартные средства Windows).

Наиболее важную роль в передаче звукового сигнала играют вершины

огибающей, в то время как переходами вблизи нулевой отметки можно пожертвовать. После такой обработки звуковая выборка без труда сжимается с помощью обычных алгоритмов кодирования LZ или Huffman.

Также для снижения уровня потерь на низких потоках применяются особые виды техники, главный из которых – режим кодирования объединенного стерео (joint stereo).

Использование минимального порога слышимости: наибольшей чувствительностью (2-4 дБ) органы слуха обладают в среднем диапазоне частот порядка 2-5 кГц. На других частотах порогом чувствительности может стать значение громкости звука в 40 дБ,т.е, звуки, лежащие за порогом чувствительности, нет смысла сохранять.

На основании подобных эффектов создается так называемая психоакустическая модель, разбивающая весь частотный спектр на части, в которых уровень звука примерно одинаков, после чего удаляет звуки, не воспринимаемые человеком.

3 уровня audio MPEG для сжатия стереофонических сигналов:

· коэффициент сжатия 1:4 при допустимом потоке данных 384 Кбит/с;

· 1:6..1:8 при 256..192 Кбит/с;

· 1:10..1:12 при 128..112 Кбит/с.

В Layer 3 части разбитого спектра намного меньше, чем в первых двух, поэтому сжатие этим методом является наиболее продуктивным, а коэффициент его достигает 1:12 без заметной на слух потери качества. => столь широкое распространение mp3.

Для получения звука с качеством CD необходима компрессия с потоком 256 Кбит/с, но для большинства слушателей вполне достаточно 128 Кбит/с (по 64 Кбит/с на канал). Среди великого множества кодеров MP3-файлов следует отметить немногие, позволяющие сжимать звуковой ряд с переменным потоком (variable bitrate), обеспечивая, таким образом, максимальное качество и экономя дисковое пространство.

Основа: использование в каждый момент времени определенного значения потока и, как следствие, изменяющейся во времени природы звукового сигнала (частоты и амплитуды звуковых колебаний). Для сжатия речи с отличным качеством вполне достаточно 24 или 32 Кбит/с.





Дата публикования: 2015-02-03; Прочитано: 698 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2025 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.847 с)...