Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Вероятностный подход



Определяет количественную связь между вероятностью появления некоторого события (р) и количеством информации в сообщении о наступлении этого события, учитывающую возможную неодинаковую вероятность сообщений в наборе:

i = log2(1/p).

Для задач такого рода американский учёный Клод Шеннон предложил в 1948 г. следующую формулу определения количества информации:

I = – (p1 log2 p1 + p2 log2 p2 +... + pN log2 pN),

где pi – вероятность наступления i – го события из набора, в котором может быть N событий.

Заметим, что при равных вероятностях p1,..., pN, каждая из них равна 1/N, и формула Шеннона превращается в формулу Хартли.

Пример. В коробке 50 шаров: 40 белых и 10 черных. Определить количество информации в сообщении о том, что при первой попытке выбран черный шар.

Решение.

Вероятность попадания при выборе черного шара p = 10/50 = 0,2.

Количество информации

i = log2(1/0,2) = log25=2,32.

Обобщенный пример. В алфавите 4 буквы (А,В,С,D), один знак препинания «.» и один разделитель (пробел). В тексте 10000 знаков, из них:

букв A – 4000,

букв B – 1000,

букв C – 2000,

букв D – 1500,

точек – 500,

пробелов – 1000.

Какой объем информации в тексте?

Если считать, что частотный алфавит определен для любого текста на этом языке, то можно найти вероятность каждого символа текста и его информационный вес:

A: 4000/10000 = 0,4; iA = log2(1/0,4) = 1,32;

B: 1000/10000 = 0,1; iB = log2(1/0,1) = 3,19;

C: 2000/10000 = 0,2; iC = log2(1/0,2) = 2,32;

D: 1500/10000 = 0,15; iD = log2(1/0,15) = 2,73;

точка: 500/10000 = 0,05; iточка = log2(1/0,05) = 4,32;

пробел: 1000/10000 = 0,1; iпробел = log2(1/0,1) = 3,19.

Общий объем информации в книге вычисляется по формуле суммы произведений информационного веса каждого символа на число повторений этого символа:

I = iA*nA + iB*nB + iC*nC + iD*nD + iточка* nточка + iпробел* nпробел =

1,32 * 4000 + 3,19 * 1000 + 2,32 * 2000 + 2,73 * 1500 + 4,32 * 500 + 3,19 * 1000 = 22841,84 бита.

Вопросы для самопроверки

1. Какие существуют способы для измерения информации?

2. В каких случаях можно вычислить количество информации, содержащейся в сообщении?

3. Почему в вероятностных формулах за основание логарифма взято число 2?

4. При каком условии формула Шеннона переходит в формулу Хартли?

5. Что определяет термин «бит» в теории информации и в вычислительной технике?

6. Приведите примеры сообщений, содержащих один (два, три) бит информации.

Упражнения

1. Сколько информации в сообщении о том, что на светофоре горит красный цвет.

2. Пусть голосуют 3 человека (голосование "да"/"нет"). Запишите все возможные исходы голосования, сколько из них победных?

3. Поезд находится на одном из восьми путей. Сколько бит информации содержит сообщение о том, где находится поезд?

4. Сколько существует различных двоичных последовательностей из одного, двух, трех, четырёх, восьми символов?

5. Каков информационный объём сообщения "Хакер Вася молодец" при условии, что один символ кодируется одним байтом и соседние слова разделены одним пробелом?

6. Определите приблизительно информационный объём:

а) одной страницы книги;

б) поздравительной открытки.

7. Сколько бит необходимо, чтобы закодировать четыре значения оценок: «неудовлетворительно», «удовлетворительно», «хорошо» и «отлично»?

8. Сколько различных символов, закодированных байтами, содержится в сообщении: 11010011 00011100 11010011 00011100 01010111?

9. Сколько байт памяти необходимо, чтобы закодировать изображение на экране монитора, который может отображать 1280 точек по горизонтали и 1024 точек по вертикали при 256 цветах?

10. При угадывании целого числа в диапазоне от 1 до N получено 7 бит информации. Чему равно N?

11. Решите уравнение: 8x (бит) = 32 (Кбайт).





Дата публикования: 2015-11-01; Прочитано: 897 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.007 с)...