Главная \| Случайная страница \| Контакты \| Мы поможем в написании вашей работы!

Тамбов 2010

1 2 3 4 5 6 7 8 9 Следующая ⇒

Кафедра Информационные системы

Дисциплина Теория информации

Тема №4: Оптимальное (эффективное) кодирование источников.

Лекции №№6-8

специальность 230201 «Информационные системы и технологии»

3 курс

Преподаватель: проф. Дидрих Валерий Евгеньевич

Тамбов 2010

Тема №4: Оптимальное (эффективное) кодирование источников.

4.1. Понятие кодирования. Кодовое дерево.

В процессе кодирования каждая буква исходного алфавита представляется различными последовательностями, состоящими из кодовых букв (цифр). Если исходный алфавит содержит m букв, то для построения равномерного кода с использованием D кодовых букв необходимо обеспечить выполнение следующего условия:

где n- количество элементов кодовой последовательности.

Для построения равномерного кода достаточно пронумеровать буквы исходного алфавита и записать их коды как n-разрядное число в D-ичной системе счисления.

Заметим: понятие равномерного кода означает, что каждая буква исходного алфавита m кодируется кодовой последовательностью одинаковой длины n.

Пример: код длины n=S в двоичной системе счисления D=2 позволяет представить 32 буквы русского алфавита пятиразрядными двоичными числами.

Очевидно, что при различной вероятности появления букв исходного алфавита равномерный код является избыточным, так как энтропия, характеризующая информационную емкость сообщения максимальна при равновероятных буквах исходного алфавита:

Т.е. информационные возможности кода используются не полностью.

Пример: Для двоичного пятиразрядного кода букв русского алфавита информационная емкость составляет 5 бит, =4,35 бит.

Устранение избыточности достигается применением неравномерных кодов, в которых буквы, имеющие наибольшую вероятность, кодируются более короткими кодовыми последовательностями, а более длинные комбинации присваиваются редким, имеющим меньшую вероятность буквам.

Если i-ая буква, вероятность которой p_i, получает кодовую комбинацию длины n_i, то средняя длинна кода (кодового слова) равна:

Введем понятие кодового дерева, которым часто пользуются при рассмотрении кодов.

Известно, что любую букву (событие), содержащиеся в алфавите (сообщении) источника, можно разложить на последовательности двоичных решений с исходами «да»=1 и «нет»=0 без потери информации.

Таким образом, каждой букве исходного алфавита может быть поставлена в соответствие (приписана) некоторая последовательность двоичных символов – «0» или «1», а такую последовательность называют кодовым словом. При этом потери информации не происходит, так как каждое событие может быть восстановлено по соответствующему кодовому слову.

C₁,C₂, C₃,C₄ – дерево кодов имеет разную длину кода (кодового слова).

12 3 4 5 6 7 8 9 Следующая ⇒

Дата публикования: 2014-11-03; Прочитано: 386 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!

studopedia.org - Студопедия.Орг - 2014-2025 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.498 с)...