![]() |
Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | |
|
1 байт = 8 біт.
Однією з перших систем кодування літер латинського алфавіту, арабських цифр, розділових знаків, знаків арифметичних дій і деяких інших символів є таблиця кодування ASCII (англ. ASCII - American Standard Code for Information Interchage - Американський стандартний код для обміну інформацією).
Згодом на основі цієї таблиці кодування були створені інші, які містять літери алфавітів різних мов, а також деякі інші символи. Вони збігалися у першій частині (символи з кодами від 00000000 (0) до 01111111 (127)) і відрізнялися в другій частині (символи з кодами від 10000000 (128) до 11111111 (255)). Звичайно, були створені таблиці, які містять літери українського і російського алфавітів.
У першій частині цих таблиць містяться:
· спеціальні символи (номери кодів від 0 до 31);
· знак пропуску, розділові знаки, знаки арифметичних дій та інші (номери кодів від 32 до 47);
· арабські цифри (номери кодів від 48 до 57);
· знаки рівності, нерівності, круглі дужки та інші символи (номери кодів від 58 до 64);
· великі літери латинського алфавіту (номери кодів від 65 до 90);
· квадратні дужки, похилі риски та інші символи (номери кодів від 91 до 96);
· малі літери латинського алфавіту (номери кодів від 97 до 122);
· інші символи (номери кодів від 123 до 127).
У другій частині цих таблиць містяться літери алфавіту певної мови (або кількох мов) та інші символи (номери кодів від 128 до 255).
Зазначимо, що у різних таблицях, які містять літери російського й українського алфавітів, одні й ті самі символи, що розташовані в другій частині таблиці, можуть мати різні коди. Останнім часом серед таблиць кодування, які містять українські літери, найпоширенішими є КОІ8-U і Windows—1251.
Кілька років тому виникла ідея створити універсальну таблицю кодування, в яку увійшли б літери алфавітів найбільш поширених мов, ієрогліфи східних мов (японська, китайська, корейська та інші), всі символи, які використовуються при роботі з комп'ютером.
Оскільки кількість символів у такій таблиці значно перевищує 256, тому вирішили кожний символ кодувати не одним байтом, а двома, тобто кожний символ цієї таблиці має не 8-бітовий, а 16-бітовий код. Шістнадцятьма бітами (двома байтами) можна закодувати 216 = 65 536 символів. Така таблиця дістала назву Unicode.
В інформатиці використовують і більші за 1 байт одиниці вимірювання довжини двійкового коду повідомлення. Запам'ятайте:
1 Кбайт = 210 байт = 1024 байт
1 Мбайт = 210Кбайт = 220 байт = 1 048 576 байт
1 Гбайт = 210Мбайт = 220 Кбайт = 230байт
1 Тбайт т 210 Гбайт - 220Мбайт = 230Кбайт = 240 байт
Ви, напевно, помітили, що префікси кіло, мега, гігаі тера використовуються в інформатиці дещо в іншому значенні, ніж це прийнято в математиці та фізиці, де вони відповідно означають тисяча (1 км = = 1000 м), мільйон (1 мегатонна = 1000000т), мільярд і трильйон. Це пов'язано з тим, що в математиці і фізиці рахують степенями числа 10, а в інформатиці - степенями числа 2, оскільки для кодування даних в ЕОМ використовують не 10 цифр, а лише 2.
Якщо кожен символ кодувати одним байтом, то середня довжина двійкового коду одного рядка тексту цього підручника дорівнює 60 байт, однієї сторінки - приблизно 3 Кбайти, а всього підручника - приблизно 1 Мбайт. Зауважимо, що всі ці дані можуть розміститися на одному гнучкому диску.
У сучасних ЕОМ графічні, звукові, відеодані також кодуються двійковим кодом. Так, довжина двійкового коду чорно-білого зображення на екрані монітора дорівнює приблизно 60 Кбайт, а кольорового — приблизно 1,4 Мбайт.
8. Вимірювання інформації.
Питання вимірювання інформації досить складне і остаточно не розв'язане навіть у наукових колах. Різні вчені-інформатики мають свій погляд на цю проблему.
У чому ж полягає ця проблема? її суть у самому понятті інформація.
Нагадаємо, що інформація - це відомості про об'єкти і явища, які підвищують рівень обізнаності об'єкта, який сприймає цю інформацію.
Але підвищення рівня обізнаності є більше якісною характеристикою, ніж кількісною.
Одна й та сама інформація може по-різному підвищувати рівень обізнаності різних людей. Це залежить від попередніх знань людини, її здатності сприйняти цю інформацію саме в даний момент і ще від багатьох об'єктивних і суб'єктивних факторів.
І все ж таки деякі вчені (Роберт Хартлі, Клод Шенон) запропонували формули для визначення кількості інформації. Вони пов'язані з поняттями ймовірності і логарифма, які ви вивчатимете в курсі математики.
Зазначимо, що й ці формули не можна вважати універсальними. Адже ніякими формулами не оцінити підвищення рівня обізнаності тварини, рослини, автоматичного пристрою, комп'ютера.
Як і не можна дати відповідь на запитання: «Яка кількість інформації міститься в тексті роману Олеся Гончара "Собор", у фресках Мікеланджело, в сигналах дзвонів, у генетичному коді людини?».
Очевидно, що розглянуті вище одиниці вимірювання довжини двійкового коду повідомлення (біти) не можуть бути застосовані для вимірювання кількості інформації. Адже повідомлення може бути закодоване, але не містити інформації (шум). Довге повідомлення може містити значно менше інформації, ніж коротке. Можна повторити одне й те саме повідомлення кілька разів: інформації від цього не стане більше, а довжина двійкового коду збільшиться. Можна, навіть, закодувати абсолютно безглузде повідомлення, наприклад «Бамбарбія кергуду», яке має певну довжину свого двійкового коду, але не несе ніякої інформації.
Дата публикования: 2015-09-18; Прочитано: 395 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!