Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Критерии распознавания открытого текста



Строятся на основе моделей открытого текста двумя методами:

· на основе различения статистических гипотез;

· на основе ограничений по запретным или ожидаемым сочетаниям букв (ЪЪ и прочие).

Первый подход:

Открытый текст – реализация независимых испытаний случайной величины, значениями которой являются буквы алфавита A = { a 1,…, an }, появляющиеся в соответствии с распределением вероятностей P (A) = (p (a 1),…, p (an)). Требуется определить, является ли случайная последовательность c 1 c 2cl букв алфавита A открытым текстом или нет.

Пусть H 0 – гипотеза, состоящая в том, что данная последовательность – открытый текст, H 1 – альтернативная гипотеза. В простейшем случае последовательность c 1 c 2cl можно рассматривать при гипотезе H 1 как случайную и равновероятную либо реализация независимых испытаний некоторой случайной величины, значениями которой являются буквы алфавита A = { a 1,…, a n}, появляющиеся в соответствии с распределением вероятностей Q (A) = (q (a 1),…, q (an)).

Наиболее мощный критерий различения двух простых гипотез – лемма Неймана-Пирсона. Также может использоваться и теорема Фробениуса.

Возможны ошибки двух родов:

Ø ошибка первого рода (открытый текст принят за случайный набор знаков) ее вероятность ;

Ø ошибка второго рода (случайный набор знаков принимается за открытый текст) ее вероятность .

Второй подход:

Критерий запретных m -грамм. Устроен просто. Отбирается некоторое число s редких m -грамм, которые объявляются запретными. Теперь последовательно просматривая все m -граммы анализируемой последовательности c 1 c 2cl, мы объявляем ее случайной как только в ней встретится одна из запретных k -грамм. Весьма эффективны не смотря на простоту.

Распознавание открытого текста производится также на основе особенностей нетекстовых сообщений (файловые метки и пр.).





Дата публикования: 2014-11-02; Прочитано: 1570 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.007 с)...