Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Методы определения оптимальных стратегий



1. Простейший метод состоит в нахождении седловой точки для чис­тых стратегий. Если такая седловая точка существует, то две чистые стратегии, которые к ней приводят, являются оптимальными.

2. Для уменьшения размерности игры используется доми­ни­ро­ва­ние строк и столбцов.

Говорят, что k -я строка матрицы R доминирует i -ю строку (т.е. од­на чистая стратегия доминирует другую), если

при всех j.

Аналогично l -й столбец доминирует j -й столбец, если

при всех i.

Заметим, что доминирующая стратегия никогда не хуже, а в не­ко­то­рых случаях и лучше, чем доминируемая. Игроку невыгодно исполь­зо­вать домини­руе­мую стратегию, и она не должна войти в оптимальную смешанную страте­гию. Это позволяет при решении игры все домини­руе­мые строки и столбцы от­бросить, т.е. уменьшить размеры матрицы.

Пример

Рассмотрим игру с матрицей

.

Вторая строка доминирует третью. Исключение третьей строки приводит к матрице

.

Первый столбец в этой урезанной матрице доминирует второй. Исключе­ние второго столбца приводит к матрице

.

Найдя решение полученной игры, легко получить решение ис­ход­ной игры, приписав исключенным строкам и столбцам нулевые вероят­ности.

3. Существуют простые процедуры получения решения игр ма­лой раз­мер­­ности. Рассмотрим один из них на примере игры 2´2.

Пример

Рассмотрим игру с платежной матрицей

.

Эта игра не имеет решения в чистых стратегиях, так как

.

Будем искать решение этой игры в смешанных стратегиях.

Пусть p и q – вероятности выбора игроками А и Б, соответст­вен­но, первой чистой стратегии. Тогда и (1-q) – вероятности выбора ими вто­рой чистой стратегии.

Математическое ожидание результата .

Для определения оптимальной стратегии игрока А нужно найти

.

Сначала при фиксированном значении p необходимо найти макси­мум по q, а для этого разобьем область изменения p на два интервала [0,0.4] и [ 0.4,1] знакопостоянства выражения (5p-2) и решим эту задачу на каждом из этих интервалов.

;

Итак, мы определили, что оптимальной для игрока А будет сме­шан­ная стратегия, при которой первая чистая стратегия выбирается им с вероятностью (или частотой) 0,4, а вторая - с вероятностью 0,6. Цена игры - 3,2.

Аналогично задача решается и для игрока Б.

С ростом размерности матрицы платежей сложность задачи замет­но воз­растает.

4. Для решения больших игр предложено несколько методов. Наи­бо­лее распространенным является определение опти­маль­ной стра­те­гии мето­да­ми линейного программирования.

Теорема. Каждой матричной игре m´n с платежной матрицей Rэквивалентна следующая пара двойственных задач линейного програм­мирования:

минимизировать целевую функцию при условиях

(1)

максимизировать целевую функцию при условиях

(2)

Составляющие оптимальных смешанных стратегий игры и цена игры V связаны с компонентами оптимальных планов задачи ЛП со­от­но­шениями

(3)





Дата публикования: 2015-10-09; Прочитано: 285 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.007 с)...