Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Все множество используемых в языке символов (знаки препинания, цифры, скобки) будем называть алфавитом.
Полное число символов алфавита принято называть мощностью алфавита. Будем обозначать эту величину буквой N. Мощность алфавита из русских букв и дополнительных символов равна 54.
В каждой очередной позиции текста может появиться любой из N символов. Каждый символ несет i бит информации; число i можно определить из уравнения: 2i=N.
Для N = 54, используя таблицу из предыдущих занятий, получаем i = 5,755 бит. Теперь для того, чтобы найти количество информации во всем тексте, нужно посчитать число символов в нем и умножить на i.
Возьмем с книжной полки какую-нибудь книгу и посчитаем количество информации на одной ее странице. Пусть страница содержит 50 строк. В каждой строке – 60 символов. Значит, на странице умещается 50 * 60 = 3000 знаков. Тогда объем информации будет равен 5,755 * 3000 = 17265 бит.
При алфавитном подходе к измерению информации количество информации от содержания не зависит. Количество информации зависит от объема текста (то есть от числа знаков в тексте) и от мощности алфавита.
Отсюда следует, например, что нельзя сравнивать информационные объемы текстов, написанных на разных языках, только по объему. У них отличаются информационные веса одного символа так как мощность алфавитов разных языков – различные.
Для того чтобы измерить количество информации, содержащееся в символьном сообщении, равно К*i, где К – число символов в тексте сообщения, а i – информационный вес символа, который находится из уравнения 2i=N, где N – мощность используемого алфавита.
Удобнее всего измерять информацию, когда мощность алфавита N равна целой степени числа 2.
Ограничение на максимальную мощность алфавита теоретически не существует. Однако есть алфавит, который можно назвать достаточным. Этот алфавит мощностью 256 символов (соответствует стандарту ASCII). В таком алфавите можно использовать практически все необходимые символы: латинские и русские буквы, цифры, знаки арифметических операций, скобки, знаки препинания. В такой алфавит помещают даже значки, с помощью которых можно чертить рамки, таблицы. Их называют знаками псевдографики.
Поскольку 256=28, то один символ алфавита “весит” 8 бит. 8 бит – это настолько характерная величина, что ей присвоили свое название – байт.
1 байт = 8 бит
Сегодня для набора писем, статей и др. используют текстовые редакторы. Они позволяют включать в текст буквы разных алфавитов, математические значки, дают возможность чертить таблицы.
Компьютерные редакторы работают с алфавитом мощностью 256 символов. В этом случае легко подсчитывать объем информации в тексте. Если один символ алфавита несет 1 байт информации, то надо просто сосчитать число символов; полученное значение даст информационный объем текста в байтах.
Например, книжка содержит 150 страниц; на каждой странице – 40 строк, в каждой строке – 60 символов. Значит страница содержит 40 * 60=2400 байт информации.
Объем всей информации в книге: 2400 * 150 = 360 000 байт.
Байт очень мелкая единица для измерения большого количества информации.
В любой системе единиц измерения существуют основные единицы и производные от них.
1 килобайт = 1 Кб = 210 байт = 1024 байта
1 мегабайт = 1 Мб = 210 Кб = 1024 Кб
1 гигабайт = 1 Гб = 210 Мб = 1024 Мб
1 Терабайт (Тбайт) = 1024 Гбайт = 240 байт,
1 Петабайт (Пбайт) = 1024 Тбайт = 250 байт.
Дата публикования: 2015-11-01; Прочитано: 445 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!