![]() |
Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | |
|
Число признаков объектов, используемых в классификаторе, определяет мерность пространства реализаций. Любая точка в пространстве реализаций - вершина N-мерного вектора, где N - число координат, представляющих собой значения признаков соответствующего объекта в выбранных единицах измерения. Если множества значений Ai признаков для различных объектов пересекаются, то недостаточно пользоваться геометрическим разделением пространства реализаций. B этом случае пользуются дополнительной информацией, когда каждой точке множества соответствует вероятность появления определенного объекта i-го класса. Пространство реализаций с определенной на нем вероятностной мерой является пространством эталонов.
Обозначим множество точек x пространства эталонов, соответствующих реализациям объектов i -го класса, через Ai, координатную ось пространства эталонов - через Хk, k=1,2,...,N. Вероятностную меру можно задать, определив на каждом из множеств Ai распределения вероятностей значений признаков соответствующих классов. Плотность распределения на Ai, i= 1,2,...,k, запишется как
(4.123)
Вероятность предъявления для распознавания хотя бы одного из объектов, относящихся к i -му классу (априорная вероятность класса), равна P(Ai) или Рi. Перед классификатором стоит задача статистического peшения, к какому из классов отнести объект. Эта задача может быть решена безошибочно, если множества Ai, i =1,2,...,k, не пересекаются в пространстве эталонов. В противном случае всегда имеются ошибки, и в зависимости от относительной значимости ошибок выбираются различные правила решения. Очевидно, что для классификации желательно так ограничить число признаков, чтобы при заданной мощности пространства эталонов его информативность была максимальной. Для того чтобы характеризовать свойства объектов алфавита независимо от их принадлежности к конкретным классам, пользуются понятием обобщенных эталонов. Разница между обобщенными признаками и признаками классов состоит в том, что первые описывают свойства всего заданного множества классов, а вторые - характерные особенности каждого конкретного класса. Возможны три случая описания признаков:
-признаки классов изменяются по случайным законам;
-признаки классов детерминированы, но результаты измерения значений признаков носят случайный характер;
-признаки классов и их измерения детерминированы, неопределенность происходит из-за незнания, какой объект предъявлен для распознавания.
Качественно признаки классов можно разбить на три группы:
- признаки, имеющие тождественно равные распределения для всех классов заданного алфавита;
- признаки, значения которых распределены на одинаковых интервалах, но по-разному для различных классов;
- признаки, принимающие свои значения на частично или полностью различных интервалах для разных классов.
Очевидно, что распознавание по признакам 1-й группы бессмысленно, по признакам 2-й группы возможно лишь вероятностное распознавание, а по признакам 3-й группы возможно абсолютное распознавание, если интервалы возможных значений одинаковых признаков различных классов не пересекаются. В большинстве практических случаев имеют место задачи с признаками 2-й группы, и возникает задача выбора признаков, позволяющих с наибольшей надежностью разделить классы конкретного алфавита.
Статистический подход в задачах распознавания заключается в получении по обучающим выборкам плотностей вероятностей в многомерном пространстве признаков, а затем в проведении разделяющей поверхности в простейшем случае в точках равенства плотностей, соответствующих различным классам (если появление представителей разных классов равновероятно и матрица потерь симметричная). В системах с обучением проведение разделяющей поверхности в пространстве признаков по параметрам обучающей выборки осуществляется по команде "учителя"; самообучающие системы строят эту поверхность самостоятельно. В системах с обучением принадлежность представителей обучающей выборки к тому или иному классу известна с вероятностью, равной единице, а при самообучении эта вероятность обратно пропорциональна числу классов и в простейшем случае с двумодальным распределением равна 0,5.
Выражение для совместного закона распределения вероятностей Р(Х, ) сигнала Х(n), соответствующего последовательности образов, и сигнала
указания принадлежности образов к классам в режиме обучения двум классам образов имеет вид:
(4.124)
где P1 и P2 - априорные вероятности появления I-го и 2-го классов; p1(X) и p2(X) - законы распределения сигналов Х1(n) и X 2(n), представляющих образы 1-го и 2-го классов.
В режиме самообучения выражение для закона f(X, ) имеет вид:
(4.125)
Эти режимы работы систем распознавания образов являются основными, применяемыми на практике в настоящее время.
При распознавании К классов образов выражение (4.124) будет иметь вид:
(4.126)
Дата публикования: 2014-11-03; Прочитано: 755 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!