Главная \| Случайная страница \| Контакты \| Мы поможем в написании вашей работы!

Регуляризация задачи распознавания

⇐ Предыдущая 11 12 13 14 151617 18 19 20 Следующая ⇒

В соответствии со стратегией Байеса, если у распознаваемого объекта со измеренное значение признака х = х⁰, то

(4.47)

Хотя решение задачи х=х₀ и обеспечивает минимум среднего (байесовского) риска, т. е. , такое решающее правило (4.47) при наличии ошибок измерения является неустойчивым.

Если значение признака х измеряется с некоторой точностью 8х, то для диапазона его изменения (х₀—dх, х₀+dх) решение, принятое по измеренному значению х=х⁰ (выбранный класс), может отличаться от того, которое соответствует истинному значению признака х. Поэтому область значений признака (х₀—dх, х₀+dх) может быть названа областью неустойчивости стратегии минимизации среднего риска (стратегии Байеса). Величина dх имеет вполне определенный физический смысл. В качестве dх можно рассматривать, например, среднеквадратичную или максимальную ошибку измерения [18].

Общий подход к некорректным задачам, имеющим неустойчивые решения, предложенный академиком А. Н. Тихоновым, состоит в их регуляции, т. е. в таком изменении постановки, при котором вновь полученная задача является приближенной к исходной и обладает свойством устойчивости.

Применительно к рассматриваемой задаче распознавания этот подход можно реализовать следующим образом.

Трансформируем решающее правило (4.47) так, что в пределах зоны неустойчивости (х₀ — dх, х + dх) алгоритм отказывается от принятия решения. Если у объекта w измеренное значение признака х-х⁰, то

(4.48)

Использование такого алгоритма распознавания исключает неустойчивые решения задачи за счет того, что появляются такие значения признака х=х₀±dх, в пределах которых алгоритм распознавания не дает ответа на вопрос о том, к какому классу следует отнести распознаваемый объект.

Регуляризация задачи распознавания приводит к тому, что ошибки первого и второго рода уменьшаются:

(4.49)

(4.50)

Уменьшается регуляризованное значение среднего байесовского риска:

(4.51)

При этом

(4.52)

Оценим вероятность отказа системы от установления класса, к которому можно отнести распознаваемый объект. Искомая вероятность отказа

(4.53)

зависит непосредственно от точности измерения признака распознаваемого объекта.

Если функции плотности f₁(х) и f₂(х) подчинены нормальным законам распределения N(m₁ d₁) и N(m₂, d₂), то Q^p₁ и Q^p₂ равны:

(4.54)

(4.55)

где F[×] — функция Лапласа. Таблицы функций Лапласа приведены в [16]. Вероятность отказа системы от распознавания

(4.56)

При построении систем распознавания нужно стремиться по возможности минимизировать область неустойчивости стратегии Байеса, т. е. минимизировать дипазон значений признаков, в пределах которого система распознавания не обеспечивает решений. Это может быть достигнуто за счет уменьшения величин dx_j, j=l,..., N. Однако в общем случае это сопряжено с увеличением расходов ресурсов, величина которых не может быть безгранична. Возникает вопрос: точность какого (каких) измерителя следует в первую очередь повышать?

Как показано в [19], информативность признаков — величина не абсолютная, а условная, поэтому ответа на поставленный вопрос, по-видимому, не существует. Однако эвристическая рекомендация прикладного характера может состоять в следующем. Прежде всего необходимо найти наиболее информативный признак рабочего словаря признаков в предположении, что он определяется на первой стадии экспериментов. Целесообразно обеспечить максимально возможную точность измерения этого признака (например х _l, 1=1,..., N). Далее следует определить такой признак х_k, k=1,...,И,k¹ l, измерение которого вносит в систему распознавания наибольшее количество информации в предположении, что на предыдущем шаге определен признак х _l т. е.

В этом уравнении количество информации подсчитывают при всех возможных значениях признаков х_k, x_l х_j, k, l, j=1,..., N, k¹ l ¹j. Затем процедура повторяется, т. е. определяют

Как правило, определение уже нескольких признаков оказывается достаточным для решения интересующего нас вопроса. Именно между измерителями, предназначенными для определения признаков х _l, х_k, х_r, целесообразно распределить основную часть ресурсов, предназначенных для аппаратурного обеспечения системы распознавания, повысить их точностные характеристики, а значит, уменьшить области неустойчивых решений задачи распознавания при использовании именно этих признаков.

В тех ситуациях, когда при разработке системы распознавания нет выбора в применении тех или других измерителей, предназначенных для определения конкретных признаков, следует крайне внимательно относиться к вопросу о предпочтении использования того или иного признака. Важно проводить детальный анализ ситуаций путем моделирования работы системы. При наличии альтернатив (например, признак х_k информативнее x _l но ошибка измерения х_k больше ошибки измерения признака x _l) можно оценить, какое решение представляется более рациональным: использовать признак х_k или x _l а может быть, и тот и другой. В связи с отсутствием в настоящее время формального решения этой задачи интересующий нас ответ может быть получен только путем моделирования ситуаций.

⇐ Предыдущая 11 12 13 14 151617 18 19 20 Следующая ⇒

Дата публикования: 2014-11-19; Прочитано: 396 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!

studopedia.org - Студопедия.Орг - 2014-2026 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.32 с)...