Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Алфавитный подход к измерению информации



Все множество используемых в языке символов (знаки препинания, цифры, скобки) будем называть алфавитом.

Полное число символов алфавита принято называть мощностью алфавита. Будем обозначать эту величину буквой N. Мощность алфавита из русских букв и дополнительных символов равна 54.

В каждой очередной позиции текста может появиться любой из N символов. Каждый символ несет i бит информации; число i можно определить из уравнения: 2i=N.

Для N = 54, используя таблицу из предыдущих занятий, получаем i = 5,755 бит. Теперь для того, чтобы найти количество информации во всем тексте, нужно посчитать число символов в нем и умножить на i.

Возьмем с книжной полки какую-нибудь книгу и посчитаем количество информации на одной ее странице. Пусть страница содержит 50 строк. В каждой строке – 60 символов. Значит, на странице умещается 50 * 60 = 3000 знаков. Тогда объем информации будет равен 5,755 * 3000 = 17265 бит.

При алфавитном подходе к измерению информации количество информации от содержания не зависит. Количество информации зависит от объема текста (то есть от числа знаков в тексте) и от мощности алфавита.

Отсюда следует, например, что нельзя сравнивать информационные объемы текстов, написанных на разных языках, только по объему. У них отличаются информационные веса одного символа так как мощность алфавитов разных языков – различные.

Для того чтобы измерить количество информации, содержащееся в символьном сообщении, равно К*i, где К – число символов в тексте сообщения, а i – информационный вес символа, который находится из уравнения 2i=N, где N – мощность используемого алфавита.

Удобнее всего измерять информацию, когда мощность алфавита N равна целой степени числа 2.

Ограничение на максимальную мощность алфавита теоретически не существует. Однако есть алфавит, который можно назвать достаточным. Этот алфавит мощностью 256 символов (соответствует стандарту ASCII). В таком алфавите можно использовать практически все необходимые символы: латинские и русские буквы, цифры, знаки арифметических операций, скобки, знаки препинания. В такой алфавит помещают даже значки, с помощью которых можно чертить рамки, таблицы. Их называют знаками псевдографики.

Поскольку 256=28, то один символ алфавита “весит” 8 бит. 8 бит – это настолько характерная величина, что ей присвоили свое название – байт.

1 байт = 8 бит

Сегодня для набора писем, статей и др. используют текстовые редакторы. Они позволяют включать в текст буквы разных алфавитов, математические значки, дают возможность чертить таблицы.

Компьютерные редакторы работают с алфавитом мощностью 256 символов. В этом случае легко подсчитывать объем информации в тексте. Если один символ алфавита несет 1 байт информации, то надо просто сосчитать число символов; полученное значение даст информационный объем текста в байтах.

Например, книжка содержит 150 страниц; на каждой странице – 40 строк, в каждой строке – 60 символов. Значит страница содержит 40 * 60=2400 байт информации.

Объем всей информации в книге: 2400 * 150 = 360 000 байт.

Байт очень мелкая единица для измерения большого количества информации.

В любой системе единиц измерения существуют основные единицы и производные от них.

1 килобайт = 1 Кб = 210 байт = 1024 байта

1 мегабайт = 1 Мб = 210 Кб = 1024 Кб

1 гигабайт = 1 Гб = 210 Мб = 1024 Мб

1 Терабайт (Тбайт) = 1024 Гбайт = 240 байт,

1 Петабайт (Пбайт) = 1024 Тбайт = 250 байт.





Дата публикования: 2015-11-01; Прочитано: 445 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.007 с)...