Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Агенты, действующие на основе полезности



В действительности в большинстве вариантов среды для выработки высококаче­ственного поведения одного лишь учета целей недостаточно. Например, обычно существует много последовательностей действий, позволяющих такси добраться до места назначения (и тем самым достичь поставленной цели), но некоторые из этих последовательностей обеспечивают более быструю, безопасную, надежную или не­дорогую поездку, чем другие. Цели позволяют провести лишь жесткое бинарное раз­личие между состояниями "удовлетворенности" и "неудовлетворенности", тогда как более общие показатели производительности должны обеспечивать сравнение различных состояний мира в точном соответствии с тем, насколько удовлетворенным станет агент, если их удастся достичь. Поскольку понятие "удовлетворенности" представляется не совсем научным, чаще применяется терминология, согласно ко­торой состояние Мира, более предпочтительное по сравнению с другим, рассматри­вается как имеющее более высокую полезность для агента.

Функция полезности отображает состояние (или последовательность состоя­ний) на вещественное число, которое обозначает соответствующую степень удовлетворенности агента. Полная спецификация функции полезности обеспечивает воз­можность принимать рациональные решения в описанных ниже двух случаях, когда этого не позволяют сделать цели. Во-первых, если имеются конфликтующие цели, такие, что могут быть достигнуты только некоторые из них (например, или скорость, или безопасность), то функция полезности позволяет найти приемлемый компро­мисс. Во-вторых, если имеется несколько целей, к которым может стремиться агент, но ни одна из них не может быть достигнута со всей определенностью, то функция полезности предоставляет удобный способ взвешенной оценки вероятности успеха с учетом важности целей.

Можно утверждать, что любой рациональный агент должен вести себя так, как если бы он обладал функцией полезности, ожидаемое значение которой он пы­тается максимизировать. Поэтому агент, обладающий явно заданной функцией по­лезности, имеет возможность принимать рациональные решения и способен делать это с помощью алгоритма общего назначения, не зависящего от конкретной макси­мизируемой функции полезности. Благодаря этому "глобальное" определение ра­циональности (согласно которому рациональными считаются функции агента, имеющие наивысшую производительность) преобразуется в "локальное" ограничение на проекты рациональных агентов, которое может быть выражено в виде про­стой про граммы.

Структура агента, действующего с учетом полезности, показана на рис. 14. ­

 

Рис. 14. Агент, основанный на модели и на полезности. В нем модель мира используется наряду с функцией полезности, которая измеряет предпочтения агента применительно к состояниям мира. Затем агент выбирает действие, которое ведет к наилучшей ожидаемой по­лезности. для вычисления ожидаемой полезности выполняется усред­нение по всем возможным результирующим состояниям с учетом ко­эффициента, определяющего вероятность каждого результата





Дата публикования: 2015-02-22; Прочитано: 527 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.006 с)...