Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Кодирование информации



Определение. Кодирование информации — что процесс преобразования информации из одной формы представления в другую. Декодирование — это воспроизведение закодированной информации.

В ЭВМ информация может быть представлена в двух формах — аналоговой и цифровой.

Аналоговая форма представляет непрерывный сигнал, который меняется пропорционально изменению информации, то есть информация кодируется изменяющимся во времени напряжением или током. Такое представление информации используется в аналоговых вычислительных машинах (АВМ). Однако эти машины не получили дальнейшего развития, в основном, из-за невысокой точности вычислений,

Цифровая форма представления информации используется в цифровых вычислительных машинах (ЦВМ). В этих машинах информация кодируется цифрами. В виде цифр представляются различные виды информации: числа, буквы, звук, изображение. В ЦВМ применяется двоичная система счисления. В этой системе используются только две цифры: О и 1, Имеются и другие системы счисления; восьмеричная, десятичная, шестнадцатиричная и др. Но двоичная система отличается от них высокой надежностью представления информации. Распознать два состояния (О или 1) значительно проще, чем, например, десять состояний. В живых системах, также, для передачи информации используется двоичное кодирование информации в виде потенциала покоя и потенциала действия, биологический О и 1. В двоичной системе счисления можно выполнять все математические действия, как и в привычной нам, десятичной системе счисления.

В ЦВМ для кодирования двоичных знаков используется два уровня напряжения. Обычно, единица — это высокий уровень напряжения, порядка 5 В, а низкий уровень (меньше 0,8 В) — ноль.

Имеются специальные устройства для преобразования

аналоговой формы в цифровую, и наоборот. Такие устройства называются соответственно аналого-цифровой преобразователь (А ЦП) и цифро-аналоговый преобразователь (ЦАП).

Процесс преобразования непрерывных сигналов в цифровую форму состоит из трех этапов: дискретизации, квантования и кодирования.

Дискретизация — это процесс разбиения сигнала на отдельные составляющие, взятые через равные промежутки времени, величина которых зависит от частоты дискретизации (рис. 8.2а).

Квантование — измерение дискретной величины сигнала в моменты времени ~1, ~2, ~з и т.д. и представление их с определенной точностью. Точность определяется уровнями квантования, то есть количеством уровней разбиения величины сигнала у.

Кодирование — перевод значения уровня квантования в двоичную систему счисления.

Полученная цифровая информация называется дискретной.

В ЦАП происходит обратное преобразование информации — из цифровой формы в аналоговую (рис. 8.2б).

   

Этапы дискретизации и обратного преобразования информации из цифровой формы в аналоговую.

Кодирование чисел. Информация в ЦВМ представлена в двоичном коде, то есть последовательностью цифр из 0 и 1. Каждая цифра называется разряДом, или битом (англ. binary digit, или сокращенно bit). Последовательность из 8 бит называется байтом, В байте может быть представлено десятичное число от О до 255, так как 28=256. При увеличении количества разрядов до 16 бит можно закодировать целые числа от О до 65535 (2=65536).

Числа в ЦВМ представлены в виде двух форм: числа с фиксированной запятой и числа с плавающей запятой (нормальная форма). В числах с фиксированной запятой целая часть числа отделяется от дробной с помощью запятой, например: 25,386; — 0,0025, Такая форма применяется при вводе и выводе числовой информации.

Форма с плавающей запятой позволяет представить число более компактно, избежать написание нулей до и после запятой и, следовательно, расширить диапазон используемых чисел. В нормальной форме число представлено в виде:

N= +- М* 10+-k,

где М — мантисса числа; k — порядок числа.

Тогда приведенные выше числа будут выглядеть следующим образом:

+0,25386 102; — 0,25 102

Кодирование текста. Любая буква или символ в компьютере представлены в виде двоичного кода. Наиболее распространенным является код ASCII, который используется для внутреннего представления символьной информаций в операционной системе MSDOS, в Блокноте операционной системы WINDOWS, а также для кодирования текстовых файлов в Интернете. Структура кода представлена в таблице 8,1 (обозначения столбцов и строк выделены полужирно).. Таким образом может быть закодировано 256 символов.

Данная таблица делится на две части: столбцы с номерами от О до 7 составляют стандарт кода — неизменяемую часть; столбцы с номерами от 8 до Р являются расширением кода и используются, в частности, для кодирования символов национальных алфавитов. В столбцах с номерами О и 1 находятся управляющие символы, которые используются, в частности, для управления принтером. Столбцы с номерами от 2 до 7 содержат знаки препинания, арифметических действий, некоторые служебные символы, а также заглавные и строчные буквы латинского алфавита. Расширение кода включает символы псевдографики, буквы национальных алфавитов и другие символы.

В приведенной таблице в качестве национального выбран русский алфавит. Пустые ячейки означают, что они не используются, а ячейки с многоточием содержат символы, которые умышленно не показаны.

+ ПРИМЕР. С помощью таблицы ASCII-кодов закодировать сообщение «группа», используя шестнадцатиричное представление кода.

Результат; А3 ЕО Е3 АР АЕ АО (для простоты коды символов разделены пробелами), а в двоично-десятичном коде сообщение будет иметь вид:

1010 0011; 1110 0000; 1110 0011; 1010 1111; 1010 1111; 1010 0000.

В настоящее время введен новый стандарт на основе 16-разрядного универсального международного кода UNICODE, который позволяет кодировать 65536 различных символов.

Кодирование графической информации. Изображение на экране монитора образуется за счет свечения точек, которые называются пикселями. Всё множество точек изображения называют растром. Количество пикселей на экране опреде ляет разрешающую способность монитора и может находиться в пределах от 640 х 480 до 1б00 х 1200, Качество изображения зависит от размеров пикселей и расстояния между ними. Расстояние между двумя соседними точками на экране называется зерном, чем оно меньше, тем лучше изображение. Мониторы высокого качества имеют размер зерна до 0,18 мм, В черно-белых мониторах каждая точка (пиксель) может иметь 256 градаций серого цвета (от белого до черного), то есть для кодирования яркости каждой точки достаточно одного байта видеопамяти.

В основе создания цветного изображения лежит принцип декомпозиции, позволяющий получать любой цвет за счет смешения трех цветов: красного (red), зеленого (green) и синего (blue). Для получения цветного пикселя в одну точку направляется три цветных луча. Такая система кодирования получила название RGB по первым буквам используемых цветов. Если для кодирования яркости каждого основного цвета использовать 8 двоичных разрядов, а, следовательно, на одну точку три байта, то можно получить 16,5 млн различных цветовых оттенков, что близко к чувствительности человеческого глаза. Такой режим представления цветной графики называется полноцветными (True Со1ог). Учитывая, что полноцветный режим требует больших объемов памяти, используются и другие подходы, которые хотя и хуже передают цвет, но требуют меньше памяти. Так в режиме Н1ян Со1ог (англ. — богатый цвет) для передачи цвета одного пикселя используется 2 байта, что позволяет передать более 65 тысяч цветовых оттенков. Используется также индексный режим, в котором код каждого пикселя хранит не цвет, а его индекс в специальной таблице цветовых оттенков. В этом режиме используется всего один байт памяти.

Кодирование звуковой информации. Звук представляет собой непрерывные колебания и относится к аналоговым сигналам. Для ввода аналоговых сигналов в ЭВМ исполь

зуется АЦП (см. выше). Для более качественной записи сигнала необходимо, чтобы частота дискретизации превышала наибольшую частоту сигнала в два раза. Учитывая, что наибольшая частота, воспринимаемая человеческим ухом, лежит в диапазоне 20 кГц, выбирают частоту дискретизации порядка 44 кГц, Точность измерения амплитуды преобразуемого сигнала зависит от разрядности преобразования или уровней квантования сигнала; чем больше разрядов, тем точнее оцифровка сигнала. На практике используется разрядность 8,16 и 24 бит. Описанные принципы кодирования звука используются в формате WAV

Кодирование видеоинформации. Видеоинформация представляет поток последовательности изображений. Необходимо оцифровать и запоминать большой объем информации, который связан с кодированием состояния каждого пикселя экрана и одновременной записью звукового сопровождения. Поэтому используют высокоскоростные устройства обмена информацией, накопители с большим объемом памяти, Для уменьшения объема информации используют специальное кодирование, характеризующееся коэффициентом сжатия. Чем выше коэффициент сжатия, тем меньший объем может занимать информация, но ниже качество изображения. Имеется несколько технологий сжатия изображения. В качестве стандартов используются разработки, предложенные MPEG (Monitor Picture Expert Group) группа экспертов по движущимся изображениям). В 1999 году был разработан стандарт МРЕG-4, который позволяет записать полнометражный цветной фильм на обычном компакт-диске.

8,3. Измерение информации

В теории информации имеется несколько подходов к измерению количества информации. Так, Клод Шеннон- один из основоположников теории информации предложил вероятностный подход, основанный на измерении уменьшения неопределенности состояния системы на основании полученной информации. При таком подходе за единицу количества информации принимается информация, содержащаяся в сообщении, что произошло одно из двух равновероятных событий. Единица информации имеет название бит. Таким образом, в сообщении, что при подбрасывании монеты выпал «орел», содержится один бит информации, так как выпадение «орла» и «решки» есть равновероятные ' события. Аналогичное количество информации содержится и в сообщении о поле рожденного ребенка, так как вероятности рождения мальчика или девочки примерно одинаковы. Учитывая, что вероятность появления О или 1 в любом разряде памяти ЭВМ есть события равновероятные, можно сказать, что один разряд цифрового двоичного кода содержит один бит информации,

Подсчет количества информации по количеству двоичных разрядов относится к объемному подходу измерения информации. Следует отметить, что между вероятностным и объемным количеством информации имеется неоднозначное соответствие. Так, буквы русского языка кодируются одинаковым количеством разрядов, а именно в коде ASCII используется 8 разрядов, и, следовательно, количество информации в каждой букве одинаково. Но вероятность появления каждой буквы различна. Например, для буквы «0» она равна 0,09, а для буквы «Ф» — 0,002, и, следовательно, количество информации, которое содержится в этих буквах, будет различным.

В информатике принят объемный подход измерения количества информации. Наименьшей единицей такого подхода является бит — двоичный разряд. Группа разрядов, состоящая из 8 бит, называется байт, Байт является общепринятой единицей измерения информации в информатике и вычислительной технике. Это связано с тем, что, как сказано выше, для кодирования алфавита, цифр, символов, используется 8 разрядов. Однако переход кодирования к системе UNICODE потребовал использования 16 разрядов, которые в информатике называются словом. Группа из четырех взаимосвязанных байтов (32 разряда) называется удвоенным словом, а из восьми байтов (64 разряда) — учетверен ны)и словом.

Учитывая, что в вычислительной технике используется двоичная система счисления, то крупные единицы измерения данных удобно представлять в виде степени двойки, тогда их обозначение образуется с добавлением префиксов кило-, беги-, гига-, тера-:

1 Кбайт = 2'о байт = 1024 байт;

1 Мбайт = 22О байт = 1024 Кбайт;

1 Гбайт = 2ЗО байт = 1024 Мбайт;

1 Тбайт = 24о байт = 1024 Гбайт.

Для сравнения можно отметить, что одна страница машинописного текста содержит около 2 Кбайт.





Дата публикования: 2014-10-25; Прочитано: 1742 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.009 с)...