Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Наиболее важная характеристика – избыточность открытого текста (подробно рассматривается в разделе надежности шифров).
Более простые:
· повторяемость букв, пар букв (биграмм), m -грамм;
· сочетаемость букв друг с другом (гласные-согласные и пр).
Такие характеристики устанавливаются на основе эмпирического анализа текстов достаточно большой длины.
Эксперимент по оценке вероятности появления в тексте фиксированных m -грамм (для небольших m).
Подсчет чисел вхождений каждой из nm возможных биграмм в достаточно длинных открытых текстах T = t 1 t 2… t l, составленных из букв алфавита { a 1, a 2,…, a n}. При этом просматриваются подряд идущие m -граммы текста:
t 1 t 2… tm, t 2 t 3… tm +1, …, t 1- m +1 tl - m +2… tl.
Если - число появлений m -граммы в тексте T, а L – общее число подсчитанных m -грамм, то при достаточно больших L:
При анализе сочетаемости букв друг с другом используют понятие условной вероятности (зависимость появления буквы в тексте от предыдущих букв).
Для условных вероятностей выполняются неравенства:
А. А. Марковым отмечена устойчивая закономерность чередования гласных и согласных. Зависимость появления букв текста вслед за несколькими предыдущими ощутима на глубину в 30 знаков, после чего практически отсутствует.
Вероятностная модель m -го приближения.
Пусть P ( m )(A) – массив, состоящий из приближений для вероятностей p (b 1 b 2… bm) появления m -грамм b 1 b 2… b m в открытом тексте, m Î N, A = { a 1,…, an }- алфавит открытого текста, bi Î A, . Тогда источник "открытого текста" генерирует последовательность c 1, c 2,…, ck, ck +1,… знаков алфавита A, в которой m -грамма c 1 c 2… c k появляется с вероятностью
p (c 1 c 2… cm)Î P ( m )(A).
Дата публикования: 2014-11-02; Прочитано: 694 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!