Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Задача селекции объектов и явлений



В процессе анализа и изучения различных объектов и явлений часто возникает задача селекции (от лат. selectio — выбор, отбор). Так, при анализе потоков элементарных частиц неоднократно приходится решать задачи отбора, селекции именно данной частицы; в химических смесях — молекул конкретного вещества или элемента; при исследованиях биологических образований — клеток, обладающих определенными свойствами, и т. п. Особую роль приобрели задачи селекции в биотехнологии и генной инженерии в современных системах вооружений.

Принято считать, что задачу селекции можно решать последовательно, применяя алгоритмы распознавания к объектам наблюдаемого множества. Это действительно так, если признаки наблюдаемых объектов измеряются без ошибок, а соответствующие различным классам области значений признаков не пересекаются. Однако в статистической постановке решения такого рода оказываются не оптимальными по критерию минимума среднего риска. Более того, при любом правиле проведения разделяющих границ между областями значений признаков всегда возможны такие ситуации, когда в область пространства, соответствующую объектам селектируемого класса, либо не попадает ни одна реализация, либо попадает более одной. В этих случаях принятие определенного решения невозможно. Это означает, что решающие правила, обычно применяемые при распознавании, в задачах селекции решающими в собственном смысле этого слова не являются.

Мы рассмотрели задачу распознавания. В статистической трактовке она формулируется следующим образом: при известных распределениях значений признаков объектов различных классов и априорных вероятностях появлений этих объектов необходимо по измеренным значениям признаков наблюдаемого объекта принять решение о том, к какому классу он относится.

Задачу селекции можно сформулировать так: при известных отличиях между распределениями значений признаков объектов различных классов и составе конкретной выборки объектов по измеренным значениям признаков всех наблюдаемых объектов принять решение о том, какой именно из этих объектов относится к интересующему классу. Уже в самой постановке задачи селекции имеются следующие особенности:

а) известны не сами распределения значений признаков, а соотношение между этими распределениями. Например, объект интересующего нас класса по геометрическим размерам превосходит объекты других классов; решение задачи селекции оказывается возможным и тогда, когда известно только распределение значений признаков для интересующего нас класса и даже тогда, когда ни одно из этих распределений априори неизвестно, однако постулируется сам факт существования таких отличий;

б) известны не статистические свойства генеральной совокупности объектов, характеризуемые априорными вероятностями появления объектов различных классов, а состав конкретной выборки наблюдаемых объектов;

в) решения принимают не по каждому объекту в отдельности, а по выборке в целом на основе всей совокупности информации.

Постановку задачи селекции рассмотрим сначала применительно к простейшей, довольно распространенной на практике ситуации, когда в выборке из и объектов находится ровно один объект первого класса, который и надлежит отселектировать, а все остальные (n—1) объекты относятся к нулевому фоновому классу [20].

Предположим, что плотности распределения значений признака х первого f1(х) и нулевого f0(х) классов известны. В ходе дальнейшего анализа уточним, какого рода априорная информация необходима для решения задачи селекции, и проведем некоторые обобщения первоначальной постановки.

Пусть в результате измерения значений признака х для каждого из n объектов получены значения xi где i — номер объекта (i=1,..., n). При наличии этой информации проверяемые статистические гипотезы сформулируем следующим образом: гипотеза Hi состоит в том, что именно i-й объект относится к первому классу и, следовательно, все остальные объекты относятся к нулевому классу. Задача синтеза алгоритма селекции состоит в том, чтобы определить наилучшее с точки зрения некоторого критерия эффективности решающее правило, в соответствии с которым следует принимать одну из гипотез Нi.

При распознавании в качестве критериев эффективности обычно рассматривают условные вероятности ошибочных решений. Так, в двухальтернативном варианте — это ошибки первого и второго рода. Например, при решении задачи обнаружения это «пропуск цели», если она есть, и «ложная тревога», когда цели нет. В общем случае при числе альтернатив n количество видов ошибочных решений составляет n (n — 1). При селекции правильное и все виды ошибочных решений образуют полную группу несовместных событий, причем, какой именно из объектов фоновой группы принять в качестве истинного объекта, существенного значения не имеет. Вероятности правильного и всех видов ошибочных решений в сумме составляют единицу. Отсюда следует, что полный апостериорный средний риск при любом соотношении между стоимостями правильного и ошибочных решений будет минимальным, если решения в пользу той или иной из гипотез приняты по критерию максимума апостериорной вероятности.

Рассмотрим задачу синтеза алгоритмов селекции.

Плотность вероятности получения выборки х^{х1,..., хi,..., хn} при условии, что гипотеза Hi верна, можно представить в виде

(4.57)

где li=f1(xi)/f0(xi) — отношение правдоподобия.

Апостериорную вероятность гипотезы Hi при условии получения выборки х‚ рассчитывают по формуле Байеса:

(4.58)

Если решения принимают по критерию максимума апостериорной вероятности, то решающее правило имеет вид

(4.59)

Это правило в отличие от решающего правила, применяемого при распознавании, пороговым не является.

В более общем случае, когда наблюдателю известны априорные вероятности Рi гипотез Hi решающее правило имеет вид:

(4.60)

Приведем два примера применения правила (4.59). Пусть измеренные значения признака х для обоих классов объектов распределены по нормальному или экспоненциальному закону, т. е.

(4.61)

или

(4.62)

Тогда с точностью до независящих от х сомножителей

или

соответственно.

Если m1>m0, то из-за монотонности экспоненциальной функции

(4.63)

Это означает, что для решения задачи селекции достаточно располагать сведениями о соотношении между математическими ожиданиями распределений (4.61) или (4.62), а вид этих распределений и даже некоторые их параметры (например, s2) существенного значения не имеют.

Иногда для решения задачи селекции достаточно располагать данными о параметрах распределения признаков только одного из классов — селектируемого.

Пусть, как и ранее,

а математическое ожидание значений признака х для объектов фонового класса отличается от т на Dm>0 в большую или меньшую сторону, причем оба эти случая равновероятны. Это позволяет рассматривать f0 (х) как смесь двух соответствующих распределений, т. е.

Тогда с точностью до независящих от х множителей

откуда из-за монотонности зависимости функции гиперболический косинус от модуля ее аргумента следует решающее правило вида

(4.64)

При этом параметры Dm и s2 существенного значения не имеют.

Решение задачи селекции оказывается возможным даже тогда, когда вообще отсутствуют какие бы то ни было априорные сведения о виде и параметрах распределений f1(х) и f0(х). Постулируется лишь сам факт существования отличий между ними. Если провести ранжировку выборки х‚{х1..., xi..., хn} в порядке возрастания значений xi то при m1>m0 в соответствии с правилом (4.59) наиболее вероятной будет гипотеза Нn, а при m1<m0 — гипотеза Н1. Можно показать, что из двух гипотез Нn и Н1 более вероятна та, для которой измеренное значение признака х дальше отстоит от центра рассеяния остальных элементов выборки. Соответствующее этому случаю решающее правило имеет вид

(4.65)

Решение задачи селекции при наличии столь малых априорных сведений оказалось возможным благодаря тому, что имелась информация о составе конкретной выборки наблюдаемых объектов.

Рассмотренная методология синтеза алгоритмов селекции допускает обобщение, когда число объектов, которые следует отселектировать от фоновых, больше 1, и задается не детерминиро-ванно, а соответствующим распределением вероятности.

Характер статистических решающих правил при селекции определяет методологию оценки эффективности. Адекватным математическим аппаратом оценки эффективности селекции является теория порядковых статистик [21].

Вычислим вероятность Фn-1(х) того, что все (n— 1) случайных величин с плотностью распределения f0(x) окажутся меньше некоторого значения х¢. Если — функция распределения, то

(4.66)

Это следует непосредственно из определения функции распределения. Заметим, что Фn-1(х¢) представляет собой функцию распределения наибольшей из (n—1) случайных величин, распределенных по закону f0(x), т. е. функцию распределения так называемой наибольшей порядковой статистики.

При использовании решающего правила (4.59) правильное решение по селекции будет принято в том случае, если случайная величина х с плотностью распределения f0(х) окажется больше случайной величины х', распределенной по закону (4.66). Вероятность этого события

(4.67)

Для распределений вида (4.62) в результате вычеслений по формуле (4.67) имеем

(4.68)

где Г(х) — гамма-функция.

Проверить это можно методом математической индукции.

При m0/m1®1 распределения f0(х) и f1(x) сближаются между собой, селекция становится невозможной и Р(n)®1/n. При m1/m0®0 отличия между указанными распределениями становятся существенными Р(n)®1. Эти факты согласуются с интуитивно ожидаемыми результатами.

Для распределений вида (4.61) при n = 2 по формуле (4.67) имеем

где

В справедливости последнего результата можно убедиться, рассматривая случайную величину z=y—x=y + (—х), где у и х имеют плотности распределения:

Тогда распределение величины z является композицией распределений f1(у) и f0(х) и, следовательно, имеет плотность распределения

Правильное решение по селекции будет принято при условии z>0, т. е.

Заметим, что в этих же условиях при использовании критерия идеального наблюдателя вероятность правильного распознавания

откуда Ррасп<Р(2).

Применяя рассмотренный метод для вероятности правильной селекции, получим следующее выражение:

где z=y-x;

(4.69)

композиция распределений f1(y) и jn-1(—x); jn-1 (x)=Фn-1 (х) — плотность распределения наибольшей порядковой статистики в выборке объема (n— 1) из распределения f0(x).

Математическое ожидание `z и дисперсию D{z} величины z рассчитаем по формулам:

(4.70)

(4.71)

Само распределение g(z) мало отличается от нормального.

В (4.70) и (4.71) mn-1 и S2n-1— математическое ожидание и дисперсия наибольшей порядковой статистики в выборке объема (n— 1) из распределения с плотностью

Значения параметров mn и S2n приведены в табл. 4.1.

Таблица 4.1

При сделанных допущениях

(4.72)

Результаты расчетов, проведенных по точной (4.69) и приближенной (4.72) формулам, приведены в табл. 4.2.

Таблица 4.2

Сопоставление этих результатов показывает, что абсолютная погрешность вычислений по формуле (4.72) не превышает 3 • 10-3Этого вполне достаточно для практических приложений.

В заключение отметим, что общей методологической основой распознавания и селекции является теория статистических решений. Однако формальное применение методов теории распознавания к решению задач селекции неправомерно и логически противоречиво. Отличия между этими задачами касаются практически всех сторон процесса решения: постановки задачи, способов задания априорной информации, формулируемых статистических гипотез, применяемых решающих правил, критериев эффективности и методов ее оценки.

Глава 5 РАБОЧИЙ СЛОВАРЬ ПРИЗНАКОВ СИСТЕМ РАСПОЗНАВАНИЯ ОБЪЕКТОВ И ЯВЛЕНИЙ

Разработка словаря признаков, используемого при построении системы распознавания,— самостоятельная и сложная задача. При ее решении приходится сталкиваться со следующими ограничениями: 1) в словарь включают только признаки, относительно которых может быть получена априорная информация, необходимая для описания классов на языке этих признаков (будем называть словарь признаков, построенный с учетом этого ограничения, априорным словарем)- 2) некоторые из признаков нецелесообразно включать в априорный словарь ввиду того, что они малоинформативны; 3) некоторые из признаков, как правило, наиболее информативные, не могут быть определены ввиду отсутствия соответствующих измерителей, а ресурсы, ассигнованные на создание системы распознавания, ограничены. Именно поэтому априорный словарь признаков в общем случае может быть применен лишь в качестве основы для построения реально используемого в системе распознавания рабочего словаря, включающего лишь признаки, которые, с одной стороны, наиболее информативны, а с другой __могут определяться имеющейся или специально созданной измерительной аппаратурой.

Таким образом, задача разработки рабочего словаря признаков системы распознавания в общем случае сводится к тому, чтобы в пределах выделенных ресурсов определить перечень технических средств, наблюдений, создание которых обеспечивает измерение наиболее информативных признаков априорного словаря. Построенный таким образом рабочий словарь признаков, в свою очередь, в принципе позволяет реализовать максимально возможную эффективность системы распознавания.

§ 5.1. Построение рабочего словаря детерминированных признаков при ограниченных ресурсах

Постановка задачи. Пусть в результате классификации все множество объектов Ω= {w разбито на непересекающиеся подмножества Ω1,Ω2,..., Ωm, каждое из которых и будет составлять соответствующий класс. Обозначим объекты, относящиеся к каждомуклассу, следующим образом:

Если признаки объектов обозначить xj, j=l, 2,..., N, то каждый объект в N-мерном пространстве признаков может быть представлен в виде вектора х = (x1 х2,..., xN), координаты которого характеризуют свойства объекта.

Для определения меры близости или подобия между объектами в iV-мерном векторном пространстве признаков необходимо ввести метрику. Выбор метрики произволен, необходимо лишь, чтобы она удовлетворяла обычным аксиомам расстояний d(a, b)=d(b, a); d(a, c)£d(a, b)+d(b, с); d(a, b)³0; d(a, b) = 0 тогда и только тогда, когда а = b. Далее, не нарушая общности рассуждений, будем пользоваться эвклидовой метрикой

..., k l где xjpk есть значения j-гo признака k-го объекта р-гo класса, т. е. объекта wpk; xjql — значение j-гo признака l -го объекта q-го класса, т. е. объекта wql.

В дальнейшем понадобится рассматривать меру близости между всеми объектами данного класса и меру близости между всеми объектами данной пары классов.

В качестве меры близости между объектами данного класса Ωp, р=1, 2,..., m будем использовать величину

(5.1)

которую назовем среднеквадратичным разбросом класса или среднеквадратичным разбросом объектов внутри класса ΩР.

В качестве меры близости между объектами данной пары классов ΩР и Ωq, p, q = 1,..., m будем использовать величину

(5.2)

которую назовем среднеквадратичным разбросом объектов классов Ωр и Ωq.

Совокупность признаков объектов, используемых в рабочем словаре, можно описать iV-мерным вектором (l=l1 l2,..., lN), компоненты которого принимают значения 1 или 0 в зависимости от того, имеется или отсутствует возможность определения соответствующего признака объекта, т. е. lj={10 учетом l квадратрасстояния между объектами wрк и wql составит

Следовательно, среднеквадратичные разбросы класса Ωр и объектов классов Ωр и Ωq могут быть записаны соответственно так:

(5.3)

(5.4)

Будем исходить из того, что затраты на создание технических средств наблюдений пропорциональны их информативности, т. е. пропорциональны тому количеству признаков объектов, которые с их помощью могут быть определены. Это предположение (оставляем в стороне вопрос о точностных характеристиках средств наблюдений) носит достаточно общий характер. Таким образом, затраты на создание средств наблюдений

(5.5)

где Сj — затраты на создание технического средства, обеспечивающего определение j-го признака.

В качестве критерия эффективности проектируемой системы распознавания рассмотрим функционал, зависящий в общем случае от функций S(Ωp), R(Ωp, Ωq) и решающего правила L(w, {wg}), т. е.

(5.6)

Пусть величина L(w, {wg}) — мера близости между распознаваемым объектом w и классом Ωg, g=l, 2,..., m, заданным своими объектами {wg}:

(5.7)

Эта величина является среднеквадратичным расстоянием между объектом w и объектами класса Ωg

Решающее правило состоит в следующем wÎΩg, если L(w, {wg}) =

Уменьшение S(Ωp), т. е. «сжатие» объектов, принадлежащих каждому данному классу, при одновременном увеличении R(Ωp, Ωq), т. е. «разведении» объектов, принадлежащих разным классам, обеспечивает в конечном счете улучшение эффективности системы распознавания. Поэтому повышение эффективности системы будем связывать с достижением экстремума функционала J.

Задача может быть сформулирована следующим образом. Пусть все множество объектов подразделено на классы Ωi, i = 1,..., m, априорно описаны все классы на языке признаков xj, j= 1,..., N, и на создание технических средств наблюдений выделены ресурсы С0. Требуется, не превышая величины С0*, построить рабочий словарь признаков, обеспечивающий максимально возможную эффективность системы.

*Следует заметить, что в конкретных ситуациях ресурсные ограничения могут относиться к массе измерительной аппаратуры, ее габаритам, потребляемой мощности, финансовым, временным и другим затратам на ее разработку и т. д.

Таким образом, задача сводится к нахождению условного экстремума функционала вида (5.6), т. е. к определению l0 реализующего при

(5.8)

Изложенная постановка задачи имеет геометрический смысл. Однако если учесть, что функция S(Ωp) характеризует эмпирический ряд распределения объектов в р-м классе, а функция R (Ωp, Ωq) — взаимное расположение эмпирических статистических радов, соответствующих классам р и q(p, q=1,..., m), то обнаруживается связь рассматриваемого подхода со статистическим подходом к распознаванию объектов.

Частные виды функционала (5.6). Если требуемая эффективность системы распознавания может быть достигнута за счет более компактного расположения объектов каждого класса при соблюдении некоторых условий относительно R (Ωp, Ωq), то задача сводится к нахождению

(5.9)

при

Если требуемое значение критерия эффективности системы может быть достигнуто за счет «удаления» друг от друга объектов, принадлежащих разным классам при соблюдении некоторых условий относительно S(Ωi), i=1,..., m, то задача сводится к нахождению

(5.10)

при

Если же значение этого критерия эффективности системы может быть достигнуто только за счет увеличения отношения расстояний между классами к среднеквадратичным разбросам объектов внутри классов, то задача сводится к нахождению

(5.11)

при

Возможны и другие постановки задачи и соответствующие им виды функционалов.

Метод решения задачи.

1. Решим задачу определения набора признаков, максимизирующего минимальное расстояние между парами классов при ограничении на общую сумму стоимостей технических средств измерения признаков.

Квадрат расстояния между парой классов

(5.12)

где lj= 1, если j-й признак используется в словаре признаков, или lj= 0 в противном случае.

Все пары из т классов можно перенумеровать, вводя индекс г=1,..., n, где

Если выражение в квадратных скобках (5.12) обозначить pjr (где r — номер пары классов, j — номер признака), то квадрат расстояния для r-й пары

(5.13)

где рjr — информативность j-го признака для r-й пары классов.

Теперь задачу можно записать в следующем виде:

(5.14)

при

где

Таким образом, решение задачи сводится к нахождению максмина с ограничением дискретной функции. В простейших случаях, когда Nn сравнительно невелико, задача может быть решена методом простого перебора. В противном случае для ее решения может быть применен метод штрафных функций, позволяющий приближенно свести задачу к безусловному экстремуму непрерывной функции.

2. Метод штрафных функций состоит в замене задачи отыскания относительного максимума функции F(x) при условиях ji(х) = 0, i=l,..., m, задачей отыскания абсолютного максимума функции

(5.15)

где Li — некоторые положительные постоянные; — штрафные функции.

Если условия связи выполнены, то F(х) = Ф(х), в противном случае второе слагаемое в правой части (5.15) характеризует меру отклонения точки от поверхности ji(х) = 0.

Если для отыскания максимума функции Ф(х) применить градиентный метод, т. е. использовать рекуррентное соотношение

где t — шаг, то второе слагаемое будет компенсировать дефект в выполнении условий связи. Чем больше Li, тем больше штраф за нарушение условий связи.

Во втором издании настоящей книги подробно изложена техника применения метода штрафных функций к рассматриваемому классу оптимизационных задач.

В рассмотренной постановке задачи определения оптимального словаря признаков предполагалось, что априорная вероятность появления объектов различных классов неизвестна. Если Р(Ωi), i=l,..., m известна, естественно считать оптимальным такой набор признаков рабочего словаря системы распознавания, который обеспечивает не максимальное гарантированное значение критерия эффективности системы, а максимальное значение математического ожидания критерия эффективности.

Пусть априорные вероятности появления объектов классов Ωp и Ωq, р, q = l,..., m соответственно равны F(Ωp) и P(Ωq). Тогда априорная вероятность появления объектов обоих классов в предположении независимости этих событий Pr=P(Ωp)P(Ωq), r=1,..., n, и n = С2m. Математическое ожидание квадрата среднеквадратичного расстояния между всеми парами классов

(5.16)

Условие задачи, записанное в виде (5.14), при наличии дополнительной информации относительно величины P(Ωi) может быть сформулировано следующим образом: в условиях заданных ограничений на ресурсы, выделяемые для разработки измерительной аппаратуры, реализующей признаковое пространство, необходимо определить такой состав рабочего словаря признаков системы распознавания, который обеспечивает максимальное значение критерия эффективности — математического ожидания величины Rr2, т. е. следует найти такой вектор l0[Р(Ωi)], который обеспечивает

(5.17)

при

Наличие дополнительной априорной информации позволяет более рационально выбрать признаковое пространство, что приводит к увеличению критерия эффективности системы распознавания.

Сформулированная задача — задача нелинейного программирования. Для ее решения может быть, в частности, использован также метод штрафных функций.

§ 5.2. Построение рабочего словаря признаков с учетом вероятности их определения

Релизация предложенного выше метода построения пространства признаков системы распознавания обеспечивает в пределах выделенных ресурсов на создание технических средств, с помощью которых должно осуществляться определение признаков, максимальное значение критерия качества функционирования системы распознавания. Одно из предположений, на котором базируется данный метод, заключается в том, что создание каждого технического средства наблюдения системы распознавания автоматически обеспечивает определение соответствующего признака объекта или явления. Метод, таким образом, не предусматривает учета того факта, что любое техническое средство лишь с определенной вероятностью (отличной от единицы) обеспечивает измерение соответствующих признаков распознаваемых объектов или явлений. При этом под вероятностью определения j-го признака, распознаваемого объекта или явления Pj,j= 1,…, N, будем подразумевать вероятность факта измерения значения этого признака при данных условиях проведения эксперимента (опыта).

Значение вероятности зависит от характеристик измерительных устройств, например, надежности, чувствительности, разрешающей способности, стабильности тех или других параметров и т. д. Именно поэтому (1—Pj) — вероятность неопределения j-го признака вследствие недостаточной надежности измерительного устройства, его малой чувствительности, низкой разрешающей способности, ограниченной дальности действия и т. д.

При построении измерительной аппаратуры систем распознавания, основанной практически на любых физических принципах, имеет место ситуация, при которой качество измерительной информации (в частности, вероятность нахождения измеряемого параметра) определяется значениями параметров измерительного устройства, зависящими в общем случае от стоимости, затраченной на его создание.

Рассмотрим один из возможных методов выбора пространства признаков системы распознавания, учитывающий указанную зависимость и предусматривающий в пределах выделенных ресурсов на разработку измерительной аппаратуры их оптимальное распределение на создание каждого измерителя. Реализация подобного распределения на практике доставляет экстремальное значение критерию качества функционирования системы распознавания.

Постановка задачи. Пусть все множество объектов, для распознавания которых предназначается проектируемая система, подразделено на классы Ω1..., Ωm, в априорном словаре системы содержатся признаки хj, j=1,..., Na, ресурсы на создание технических средств измерения признаков составляют С0. Обозначим Cj затраты на создание технического средства Tj, предназначенного для определения j-го признака, а Рj(Cj) — вероятность определения этого признака с помощью данного средства. При этом будем исходить из естественного предположения о том, что Pj(Cj) монотонно возрастает, т. е. [dPj(Cj)/dCj)]>0. Кроме того, Pj(Cj=0) = 0, Рjj= ¥) = 1 и Pj(Cj)<1 для любого конечного значения затрат Сj.

Признаки объектов, принадлежащие множеству признаков априорного словаря системы распознавания, определение которых становится возможным благодаря созданию соответствующих технических средств, образуют рабочий словарь признаков xj, j=1,..., Np, системы распознавания. При построении реальных систем распознавания объем рабочего словаря существенно меньше объема априорного словаря, т. е. Np£Nt. При создании сложных систем распознавания после определения признакового пространства основное — разработка и создание технических средств — аппаратуры, предназначенной для измерения признаков. Например, при построении систем медицинской диагностики едва ли не самая сложная задача — создание высококачественной диагностирующей аппаратуры (электрокардиографов, электроэнцефалографов, рентгеновской аппаратуры и т. д.).

В качестве критерия качества системы распознавания используем математическое ожидание квадрата среднеквадратичного; расстояния между объектами классов Ωр, Ωq, p, q=1,..., m. Все пары из m классов перенумеруем, вводя индекс r= 1,..., n. Тогда с учетом зависимости Рjjj) квадрат расстояния для r-й пары классов

(5.18)

где

Здесь xjpk — значение j-го признака у k-го объекта р-го класса, xjql — значение.j-го признака у l-го объекта q-гo класса, kр и kq — количество объектов в р- и q-м. классах объектов, соответственно.

Величина pjr характеризует разделительные свойства (разрешающую способность) j-го признака для r-й пары классов. Легко заметить, что R2r — математическое ожидание квадрата среднеквадратичного расстояния между объектами данной пары классов в признаковом пространстве (х1..., xNp).

Пусть компоненты вектора С= {C1..., CNp) определяют затраты ресурсов на создание каждого технического средства Tj. Тогда критерий качества функционирования системы распознавания

(5.19)

Задача состоит в том, чтобы найти такое распределение затрат на создание технических средств получения апостериорной информации, при котором достигается максимальное значение указанного критерия. Это означает, что необходимо определить вектор С0, обеспечивающий

(5.20)

При этом стратегия С, для которой заведомо неоптимальна.

Метод решения задачи. Рассмотренная задача — обобщение задачи нелинейного программирования. Условия оптимальности для нее можно сформулировать следующим образом: для того чтобы вектор С0 являлся оптимальной стратегией, необходимо, а в случае вогнутости функции W(C) и достаточно, чтобы существовали скаляр l³0 и вектор m={m1..., mn}, такие, что

(5.21)

Рис. 5.1

Доказательство утверждений, содержащихся в (5.21), фактически приведено в [22]. Введение в рассмотрение скаляра l и вектора m увеличивает количество неизвестных C0j, mr и l до величины Np + n + l. Однако число уравнений равно числу неизвестных, так как для любого r либо mr = 0, либо

Таким образом, решение системы уравнений (5.21) и дает возможность определить состав признаков рабочего словаря и оптимальное распределение затрат на создание средств наблюдений системы распознавания в условиях предположения о зависимости Pj=Pj(Cj) и ограничений на велчину ресурсов, выделенных для разработки этих средств. В [22] изложены также методы последовательных приближений градиентного типа, позволяющие численно решать задачу определения оптимальной стратегии. Достаточное условие вогнутости функции W(C) по вектору С — вогнутость по Cj функций Pj=Pj(Cj), "j (рис. 5.1), т. е.

(5.22)

Вогнутость функций Pj=Pj(Cj), j=1,..., Np, имеет естественную физическую интерпретацию: с ростом вкладов Сj и приближением Pj к единице эффективность вкладов, т. е. отношение приращения Pj к приращению Сj, уменьшается, а добиться равенства Pj= 1 практически невозможно.





Дата публикования: 2014-11-19; Прочитано: 495 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.04 с)...