Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Содержательная трактовка проблемы распознавания



Процесс распознавания состоит в том, что система распознавания на основании сопоставления апостериорной информации относительно каждого поступившего на вход системы объекта или явления с априорным описанием классов принимает решение о принадлежности этого объекта (явления) к одному из классов. Правило, которое каждому объекту ставит в соответствие определенное наименование класса, называют решающим правилом. В литературе, посвященной распознаванию образов, утвердилось мнение, что суть проблемы распознавания заключается в определении решающих правил, нахождении в признаковом пространстве таких границ (решающих границ), придерживаясь которых признаковые пространства оптимальным образом, например с точки зрения минимизации ошибок распознавания, подразделяются на области, соответствующие классам. Так, в [5] сказано, что в отыскании таких решающих правил на основании заданных описаний классов и заключается проблема распознавания.

При определении решающих правил (решающих границ в признаковом пространстве) в зависимости от объема исходной априорной информации рассматриваются следующие ситуации:

1. Количество исходной информации достаточно для того, чтобы путем ее анализа и непосредственной обработки определить решающие правила (системы распознавания без обучения, см. рис. 1.4).

2. Количество исходной информации недостаточно для определения решающих правил на основе ее непосредственной обработки, в связи с чем реализуется процедура обучения (обучающиеся системы распознавания, см. рис. 1.5).

В ситуациях 1 и 2 задача отыскания решающих правил базируется на том, что алфавит классов объектов и априорный словарь признаков, предназначенных для их описаний, известны. Рассматривается также и такая ситуация, когда словарь признаков известен, но неизвестен алфавит классов. При этом, однако, определен некоторый набор правил, в соответствии с которыми на основании процедуры самообучения находится искомый алфавит классов. Затем определяются решающие правила (самообучающиеся системы, см. рис. 1.6).

Исторически сложилось так, что первые теоретические исследования и прикладные работы в области распознавания базировались на том, что признаковое пространство известно, известен также и алфавит классов. В этих условиях проблема распознавания действительно может трактоваться как проблема определения в некотором смысле наилучших решающих границ (решающих правил). В настоящее время часто при построении распознающих устройств имеет место ситуация, когда известны и алфавит классов, и словарь признаков. Однако в общем случае при построении реальных систем распознавания, требующих разработки специальных измерительных средств и целых измерительных комплексов, исходить из того, что алфавит классов и словарь признаков априорно известны, к сожалению, не приходится.

Назначение систем распознавания — получить информацию, необходимую для принятия определенных решений, о принадлежности неизвестного объекта (явления) к тому или иному классу. Именно так обстоит дело в системах медицинской и технической диагностики, геологической разведки, метеорологического прогноза, криминалистике, системах распознавания целей и т. п. Поэтому системы распознавания, являясь частью системы управления (автоматической или автоматизированной), должны строиться с учетом обеспечения наиболее эффективного использования всего набора допустимых решений. Этот факт накладывает на построение систем распознавания следующие ограничения.

1. При прочих равных условиях повышение эффективности принимаемых решений следует связывать со степенью детализации определения или назначения либо характера распознаваемого объекта или явления. Степень детализации определяется количеством классов, на которое подразделено множество объектов или явлений. Так, если система управления располагает m различными решениями, то в алфавите классов системы распознавания, учитывая сказанное, целесообразно предусмотреть m+1 классов. Тогда, если распознанный объект относится к классу Ω1 принимается решение l1, если к классу Ω2 — решение h и т. д., если же объект относится к классу Ωm+1, решение не принимается.

2. Эффективность принимаемых системой управления решений при прочих равных условиях (в том числе, естественно, при заданном алфавите классов) зависит от точности определения принадлежности распознаваемого объекта или явления к соответствующему классу. Точность же определения или ошибка распознавания при заданном по точности априорном описании классов определяется размерностью и информативностью признакового пространства, объемом и качеством апостериорной информации о значениях признаков (параметров), которыми характеризуется распознаваемый объект. Иначе говоря, расширение алфавита классов, увеличивающее степень детализации определения назначения либо характера распознаваемого объекта (явления), при неизменном словаре признаков увеличивает ошибку распознавания.

Пусть заданы три класса Ω1, Ω2 и Ω3 объектов распределениями f1(х), f2(x),f3(x) априорными вероятностями появления объектов соответствующих классов P(Ω1)=P(Ω2)=P(Ω3)=P, а также потерями c11 = c22 = с33 = 0 и с12 = с21 = c13 = с31 = с23 = с32 = с.

На рис. 2.1 представлены законы распределений. Средний (байесовский) риск (см. § 4.2)

(2.1)

Положим теперь, что объекты, относящиеся к классам Ω1 и Ω2, решено объединить в один класс Ω4, описание которого

Средний риск в данном случае в предположении неизменности границы b составит

(2.2)

Из сравнения величин Rã1 и Rã2 видно, что Rãl>Rã2 на величину

Следовательно, при заданном признаковом пространстве и прочих равных условиях уменьшение числа классов приводит

Рис. 2.1

к уменьшению ошибок распознавания и, наоборот, при увеличении числа классов системы распознавания в целях поддержания на заданном уровне или даже уменьшения среднего риска (вероятности ошибочных решений) надо расширять словарь признаков (естественно, при прочих равных условиях). В то же время расширение признакового пространства в целях уменьшения ошибок распознавания сопряжено с увеличением числа технических измерительных средств, каждое из которых обеспечивает определение соответствующего признака или группы признаков. Это, в свою очередь, требует увеличения затрат на построение системы распознавания. На величину же затрат в реальных условиях, как правило, накладываются те или другие ограничения.

Таким образом, стремление по возможности наиболее эффективно использовать набор возможных решений системы управления приводит к необходимости увеличения алфавита классов до m+1. Однако естественная ограниченность ресурсов, ассигнованных на построение измерительных средств системы распознавания или системы распознавания в целом, приводит к тому, что по мере увеличения алфавита классов ошибки распознавания растут, а это уменьшает эффективность использования возможных решений. Только некоторый компромисс между размерами алфавита классов и объемом рабочего словаря признаков системы, базирующийся на исходных данных относительно набора возможных решений и величины ресурсов, отпущенных на создание измерительной аппаратуры, реализующей словарь признаков, позволяет обеспечить решение задачи построения системы распознавания оптимальным образом.

Итак, в общем случае при построении систем распознавания приходится иметь дело со следующей ситуацией. Создается некоторая система управления, реализующая то или другое управление в зависимости от результатов оценки, существенных свойств, характера, назначения объекта или явления, его распознавания. Система управления располагает конечным числом решений. Составляющая эффективности управлений, зависящая от функционирования системы распознавания, обусловливается двумя факторами. Первый фактор связан со степенью детализации распознавания объектов или явлений, наибольшее значение которой будет в том случае, если число классов, содержащихся в алфавите классов системы распознавания, равно количеству возможных решений (плюс единица — последний класс, объекты которого не распознаются). Второй фактор — точность решения задачи распознавания. Естественно, чем она выше, тем меньше вероятность принять решение, не соответствующее особенностям данного объекта или явления. Например, применить не адекватную заболеванию стратегию лечения в случае использования системы медицинской диагностики; применить не по назначению данное средство противодействия в случае использования системы распознавания целей и т. п. Однако при заданном словаре признаков увеличение алфавита классов уменьшает точность решения задачи распознавания. Увеличение же словаря признаков в общем случае связано с разработкой новой или использованием существующей измерительной аппаратуры, что влечет за собой увеличение расходов на построение системы распознавания.

Таким образом, суть проблемы распознавания состоит в разработке таких алфавита классов и словаря признаков, которые в условиях ограниченных ресурсов на построение системы распознавания обеспечивают максимальную эффективность системы управления, принимающей соответствующее решение в зависимости от результатов решения задачи распознавания. При этом, безусловно, выбирая словарь признаков и определяя алфавит классов, следует находить наилучшие решающие правила, решающие границы между классами. Однако в общем случае не в этом состоит проблема распознавания, как не важна и как подчас не сложна задача определения оптимальных решающих правил, обеспечивающих в условиях заданных алфавита классов и словаря признаков наибольшую точность распознавания [6]. Более того, при построении логических систем распознавания, использующих либо алгоритмы распознавания, основанные на методах алгебры логики, либо структурных (лингвистических) систем (см. гл. 8), решающие правила вообще не определяются.

Таким образом, нет достаточных оснований считать справедливым суждение о том, что проблема распознавания состоит в определении решающих правил (решающих границ).





Дата публикования: 2014-11-19; Прочитано: 519 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.009 с)...