Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Частотные характеристики



Наиболее важная характеристика – избыточность открытого текста (подробно рассматривается в разделе надежности шифров).

Более простые:

· повторяемость букв, пар букв (биграмм), m -грамм;

· сочетаемость букв друг с другом (гласные-согласные и пр).

Такие характеристики устанавливаются на основе эмпирического анализа текстов достаточно большой длины.

Эксперимент по оценке вероятности появления в тексте фиксированных m -грамм (для небольших m).

Подсчет чисел вхождений каждой из nm возможных биграмм в достаточно длинных открытых текстах T = t 1 t 2t l, составленных из букв алфавита { a 1, a 2,…, a n}. При этом просматриваются подряд идущие m -граммы текста:

t 1 t 2tm, t 2 t 3tm +1, …, t 1- m +1 tl - m +2tl.

Если - число появлений m -граммы в тексте T, а L – общее число подсчитанных m -грамм, то при достаточно больших L:

При анализе сочетаемости букв друг с другом используют понятие условной вероятности (зависимость появления буквы в тексте от предыдущих букв).

Для условных вероятностей выполняются неравенства:

А. А. Марковым отмечена устойчивая закономерность чередования гласных и согласных. Зависимость появления букв текста вслед за несколькими предыдущими ощутима на глубину в 30 знаков, после чего практически отсутствует.

Вероятностная модель m -го приближения.

Пусть P ( m )(A) – массив, состоящий из приближений для вероятностей p (b 1 b 2bm) появления m -грамм b 1 b 2b m в открытом тексте, m Î N, A = { a 1,…, an }- алфавит открытого текста, bi Î A, . Тогда источник "открытого текста" генерирует последовательность c 1, c 2,…, ck, ck +1,… знаков алфавита A, в которой m -грамма c 1 c 2c k появляется с вероятностью

p (c 1 c 2cmP ( m )(A).





Дата публикования: 2014-11-02; Прочитано: 694 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.006 с)...