Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Алгоритм управления процессом распознавания



Рассмотренные понятия позволяют построить алгоритм управления процессом распознавания в виде правила последовательного поиска решений, обеспечивающего разработку оптимального плана проведения экспериментов. Смысл подобного алгоритма в том, что он на основе предыстории экспериментирования, а также на основе информации, полученной в результате предыдущих экспериментов, определяет оптимальный план дальнейшего проведения экспериментов, все последующие стадии экспериментов, т. е. определяет на каждом шаге, какие очередные технические средства должны быть использованы и какие признаки объекта с помощью этих средств должны быть выявлены.

Общая запись алгоритма, обеспечивающего последовательное планирование экспериментов, может быть представлена в виде

(9.5)

где свидетельствуют о том, что алгоритм строится с учетом системы ограничений Г.

Наличие в алгоритме члена z0i означает, что окончательное решение о том, что объект принадлежит классу Ωi, принимается без проведения экспериментов. В этом случае все операции (a1,..., аk; z1i,..., zki) отсутствуют. Если в алгоритме z0i отсутствует, то назначается проведение экспериментов а1первой стадии. Если на основе признаков объекта, определенных по информации экспериментов первой стадии, принимается окончательное решение о его принадлежности какому-либо классу z1ia1), то все операции, обозначаемые в алгоритме а2,..., аk; z0i, z2i,...,..., zki, отсутствуют.

Наличие в алгоритме члена ak(xa1,..., хаk-1) означает, что на основе изучения признаков распознаваемого объекта, полученных в результате исходов экспериментов ха1,..., хak-1, принято решение о проведении экспериментов аkÎАГk стадии л.

Наличие в алгоритме члена zлiа1,..., хл) означает, что после получения исходов хв1,..., х„к экспериментов аи..., ак, проведенных согласно правилу R, принимается окончательное решение о принадлежности распознаваемого объекта к классу Ωi и дальнейшие эксперименты не проводятся. Порядок планирования экспериментов проводится в соответствии с алгоритмом (9.5), изображенным на рис. 9.1.

Алгоритм работает следующим образом. Пусть на вход системы распознавания поступил объект w. Установлено, что принимать окончательное решение без проведения экспериментов z0i нецелесообразно и для определения его признака решено провести эксперимент а1 (из каких соображений принимаются подобные решения, будет показано ниже). Положим, что возможные исходы эксперимента будут xa1¢ и хa1¢¢. Эти исходы анализируются в блоке анализа результатов экспериментов БАРЭ. При этом если исход эксперимента а1 будет хa1¢¢, то, например, принимается окончательное решение z1i(xa1¢), а если исход эксперимента будет xa1¢¢, то принимается решение провести новый эксперимент а2 (xa1¢). Пусть его возможные исходы будут xa1¢, xa2¢¢ и xa3¢¢¢. Тогда их анализ может привести, например, к таким решениям: если исходы эксперимента a2(xa1¢) будут xa1¢ или xa3¢¢¢, то следует принять окончательные решения z2q(xa1¢, xa2¢) или z2q(xa1¢, xa2¢¢¢), i, q, g=l,..., т, а если исход xa2¢¢, то необходимо провести эксперимент а3 (xa1¢, xa2¢¢). Исходы xa3¢ и xa3¢¢ этого эксперимента вновь анализируются, и разрабатывается план дальнейшего развития экспериментов.

Рис. 9.1

Алгоритм работает как система с обратной связью. Действительно, всякий раз результаты эксперимента используются для корректировки плана проведения последующих экспериментов.

Построение алгоритма. Уравнение (9.5) определяет множество всех возможных последовательных правил поиска решений. В этом множестве должно быть определено правило, оптимальное с точки зрения минимизации затрат на проведение процесса распознавания. Для отыскания этого правила введем в рассмотрение карту штрафов Сwa1,..., хаk; zki {xa1,..., хk)], согласованную с системой последовательных ограничений Г. Величина Cw[xa1,...,..., хаk; zki (xa1,..., хаk)] означает штраф, уплачиваемый в случае, когда подвергается распознаванию объект w. Для определения признаков объекта w проведены эксперименты а1,..., аk с исходами xa1,..., хаk и принято окончательное решение zki(xa1,..., хаk). Как правило, имеет место такая ситуация, когда расходы на проведение экспериментов с помощью технических средств Тb суммируются и не зависят от объектов со и конкретных исходов ха1,..., хаk экспериментов. В этом случае

(9.6)

где Cw[zki (xa1,..., хаk)] — ущерб от принятия окончательного решения о том, что w=Ωi, после проведения к стадий экспериментов.

Для каждого объекта w и выбранного последовательного правила R значение среднего убытка `Uw(R) равно математическому ожиданию от величины Сw:

(9.7)

где математическое ожидание подсчитывается в соответствии с распределением Р.(хаk+1½xa1,..., хаk), которое определяет вероятность исхода хаk+1 эксперимента аk+1 при условии, что проведенные эксперименты а1..., аk дали исходы xa1,..., хаk по всем возможным цепочкам развития эксперимента — до принятия окончательного решения в алгоритме R. Средний убыток, вычисляемый по всем возможным цепочкам исхода алгоритма R, оканчивающимся принятием окончательного решения zki, может быть определен иначе так:

(9.8)

где n — число всех возможных цепочек развития экспериментов, Pi(xa1,..., хаk) — вероятность реализации цепочки экспериментов, закончившихся исходами xa1,..., хаk; она может быть выражена следующим образом:

(9.9)

Так как алгоритм (9.5) должен носить массовый характер и заранее не известно, какого класса объект будет подвергаться распознаванию в каждой из конкретных ситуаций, то значение убытка `Uw(R) следует усреднить с помощью априорной вероятности появления объектов соответствующих классов P(Ωi) и каждый алгоритм характеризовать функцией убытка, функцией риска

(9.10)

Теперь появилась возможность, подобно тому, как это осуществляется в теории последовательных статистических решений, методологические вопросы выбора приемлемого правила поиска последовательных решений рассматривать как игру двух сторон с функцией убытка UP(R). В качестве одной стороны выступает «вероятный противник», чистые стратегии которого — все объекты w из Ωi в качестве второй стороны — система распознавания, чистые стратегии которой — совокупность последовательных правил R из RГ. Это, в свою очередь, позволяет рассматривать вопросы существования чистых минимаксных стратегий, смешанных минимаксных стратегий и байесовых стратегий. Класс байесовых стратегий оказывается в некотором смысле полным, т. е. для любой небайесовой стратегии найдется лучшая (или, во всяком случае, не худшая) байесова стратегия. Исходя из этого, в дальнейшем будем придерживаться именно байесова подхода к решению задачи.

Оптимальным байесовым последовательным правилом назовем такой алгоритм Ř, который минимизирует значение убытка UP(R). Это означает, что UP(Ř)£UP(R) для всех возможных алгоритмов RÎRГ. При реализации системы распознавания целесообразно использовать оптимальные байесовы алгоритмы. Принципиальная возможность построения таких алгоритмов, рассчитанных заранее до начала функционирования системы распознавания, определяется рекуррентными уравнениями для функций риска. Введем в рассмотрение следующие определения.

Риском прекращения экспериментов после цепочки исходов xa1,..., хаk назовем величину

(9.11)

где P(Ωi½xa1,..., xak) — апостериорная вероятность, вычисляемая с помощью формулы Байеса по априорной вероятности появления объектов данного класса Р(Ωi)и априорным вероятностям вида Pi [xak+l½xa1,..., хаk].

Частный случай риска прекращения экспериментов после цепочки исходов xa1,..., хak — риск r00 принятия окончательного решения без проведения экспериментов, который равен

(9.12)

Риск прекращения экспериментов после проведения экспериментов аa1..., аk с цепочкой исходов хa1,..., хak определяется расходами на проведение этих экспериментов и наименьшими потерями, которые несет система распознавания от принятия окончательного решения о принадлежности распознаваемого объекта соответствующему классу на основе полученной информации

Риском продолжения экспериментов после цепочки исходов xa1,..., xak назовем величину

(9.13)

где inf берется по всем возможным последовательным правилам R(xa1,..., xak), которые в соответствии с системой последовательных ограничений Г можно построить с помощью экспериментов, принадлежащих соответственно AГk+1 AГk+2,...стадиям. Риск продолжения экспериментов после проведения экспериментов аи..., ак с цепочкой исходов хa1,..., хаk определяется расходами на дальнейшее проведение экспериментов (k+1)-й стадии, спланированных на основе оптимального последовательного правила Ř. В соответствии с (9.7) расходы определяются как затратами на проведение собственно экспериментов (k+ 1)-й стадии, так и наименьшими потерями, которые несет система распознавания от принятия окончательного решения о принадлежности распознаваемого объекта к соответствующему классу на основе полученной информации xa1,..., xak, хаk+1.

Риском после цепочки исходов хa1,..., хаk называется

(9.14)

Приведенные определения позволяют записать следующее рекуррентное уравнение:

(9.15)

где вероятность исхода xak+1 эксперимента аk+1.

При планировании процесса распознавания количество стадий экспериментирования можно ограничить некоторым числом N. Тогда для любой цепочки экспериментов xa1,..., xaN будет иметь место равенство

(9.16)

Рекуррентное уравнение (9.15) с учетом (9.16) позволяет на основе использования рекурсии от N к N— 1, N—2 и т. д. и данных о значениях r0k после каждой стадии проведения экспериментов от первой до N-й восстановить значения функций риска при всех значениях k=1,..., N.

Порядок расчета таков. После установления количества стадий экспериментов определяются значения r00, r01a1),..., r0N (xa1,..., хaN). По величине rN(xa1,..., хaN) = r0Na1,..., xaN) в соответствии с (9.15) находится величина Из сопоставления величин и в соответствии с (9.14) определяется величина Это в свою очередь на основе (9.15) позволяет найти величину ..., N-кратное повторение описанной процедуры расчетов дает возможность определить величины и т. д. вплоть до риска проведения экспериментов первой стадии.

Нахождение значений функций риска продолжения и прекращения экспериментов после каждой из стадии позволяет осуществлять оптимальное последовательное планирование проведения экспериментов: эксперименты последовательно проводятся до тех пор, пока Как только (после цепочки исходов xa1,...,..., хаk) значение риска продолжения эксперимента становится больше или равно значению риска прекращения экспериментов, эксперименты следует прекратить и принять решение zki (xa1,..., хаk), при котором

(9.17)

Порядок управления экспериментами (до тех пор, пока их выгодно продолжать) определяется с помощью функции риска продолжения экспериментов: в качестве аk+1a1,...,..., хаk) в байесовом правиле следует выбирать такой эксперимент ak+1ÎAГk+1(xa1,..., хаk), на котором достигается inf в правой части рекуррентного уравнения для риска (9.15).

Таким образом, реализация оптимального уравнения процессом распознавания связана с выполнением следующих расчетных работ.

1. На основе карты штрафов, априорных вероятностей появления объектов соответствующих классов и условных законов распределения значений признаков по классам в соответствии с (9.1) определяются значения рисков прекращения экспериментов после каждой стадии:

2. Из физических соображений определяется предельное количество N стадий экспериментирования.

3. На основе (9.15) рассчитываются значения рисков продолжения экспериментов для всех стадий от N— 1 до первой.

4. Из сравнения величин r0k и для всех возможных исходов экспериментов определяется оптимальное количество стадий экспериментирования*.

*В первом издании настоящей книги (1977) на конкретном примере проиллюстрировано применение рассмотренной методологии оптимального планирования процесса накопления апостериорной информации.





Дата публикования: 2014-11-19; Прочитано: 410 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.014 с)...