![]() |
Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | |
|
Использованы материалы книги [Проскурин Г.В. Принципы и методы защиты информации. Учебное пособие. Московский государственный институт электроники и математики. 1977].
Устойчивые закономерности открытого текста и их использование при дешифровании шифров простой замены и перестановки. Возможность дешифрования какого либо шифра в значительной мере зависит от того, в какой степени криптографические преобразования разрушают вероятностно-статистические закономерности, присутствующие в открытом содержательном тексте. Так в осмысленных текстах любого естественного языка различные буквы встречаются с разной частотой, при этом относительные частоты букв в различных текстах одного языка близки между собой. То же самое можно сказать и о частотах пар, троек букв открытого текста. Кроме того, любой естественный язык обладает так называемой избыточностью, что позволяет с большой вероятностью «угадывать» смысл сообщения, даже, если часть букв в сообщении не известна.
Таблица относительных частот букв алфавита русского языка.
а – 0,062 | л – 0,035 | ц – 0,004 | |||
б – 0,014 | м – 0,026 | ч – 0,012 | |||
в – 0,038 | н – 0,053 | ш – 0,006 | |||
г – 0,013 | о – 0,090 | щ – 0,003 | |||
д – 0,025 | п – 0,023 | ы – 0,016 | |||
е,е – 0,072 | р – 0,040 | ъ,ь – 0,014 | |||
ж – 0,077 | с – 0,045 | э – 0,003 | |||
з – 0,016 | т – 0,053 | ю – 0,006 | |||
и – 0,062 | у – 0,021 | я – 0,018 | |||
й – 0,010 | ф – 0,002 | – 0,175 | |||
к – 0,28 | х – 0,009 |
Подобные таблицы приводятся в разных книгах. Они получены на основе подсчетов частот на больших объемах открытого текста. Учитывая, что для экспериментов берется различный исходный материал, значения вероятностей несколько отличаются между собой.
Если упорядочить буквы по убыванию вероятностей, то мы получим вариационный ряд
О,Е,А,И,Н,Т,С,Р,В,Л,К,М,Д,П,У,Я,З,Ы,Б,Ь,Г,Ч,Й,Х,Ж,Ю,Ш,Ц,Щ,Э,Ф.
В слове СЕНОВАЛИТР содержатся 10 наиболее частых букв.
Частоты знаков алфавита зависят не только от языка, но и от характера текста. Так в тексте по криптографии будет повышена вероятность букв Ф, Ш (из-за часто встречающихся слов «шифр», «криптография»). В некоторых математических текстах может быть завышена частота буквы Ф (из-за слов «функция». «функционал» и т.п.). В стандартных текстовых файлах наиболее частым является символ «пробел». Частотная диаграмма содержательных текстов является устойчивой характеристикой текста. Из теории вероятностей следует, что при достаточно слабых ограничениях на вероятностные свойства случайного процесса справедлив закон больших чисел, т.е. относительные частоты знаков сходятся по вероятности к значениям их вероятностей
.
Шифры перестановки и простой замены не полностью разрушают вероятностно-статистические свойства, имеющиеся в открытом сообщении.
При дешифровании текста, зашифрованного шифром простой замены, используют частотные характеристики открытого текста. Именно, если подсчитать частоты встречаемости знаков в шифрованном тексте, упорядочить их по убыванию, и сравнить с вариационным рядом вероятностей открытого текста, то эти две последовательности будут близки. В Скорее всего на первом месте окажется пробел, далее будут следовать буквы О, Е, А, И.
Конечно, если текст не очень длинный, то не обязательно полное совпадение. Может оказаться на втором месте О, а на третьем Е, но в любом случае в первых и вторых рядах одинаковые буквы будут располагаться недалеко друг от друга, и чем ближе к началу (чем больше вероятность знаков), тем меньше будет расстояние между знаками.
Аналогичная картина наблюдается и для пар соседних букв (биграмм) открытого текста (наиболее частая биграмма русского открытого текста – СТ). Однако для получения устойчивой картины длина последовательности должна быть существенно больше. На сравнительно небольших отрезках открытого текста эта картина как-то смазана. Более устойчивой характеристикой биграмм является отсутствие в осмысленном тексте некоторых биграмм, как говорят, наличие запретных биграмм, имеющих вероятность равную практически 0.
Видели ли Вы когда-нибудь в открытом тексте биграмму ЪЬ, или биграммы вида: «гласная» Ь; «пробел» Ь? Знание и использование указанных особенностей открытого текста значительно облегчает дешифрование шифра перестановки и замены.
Дата публикования: 2015-02-22; Прочитано: 502 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!