Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Принцип минимакса



Рассмотрим игру mxn с платежной матрицей выше. Следует определить:

1). наилучшую стратегию игрока I среди стратегий А1, А2, …, Аi, …, Аm.

2). наилучшую стратегию игрока II среди стратегий B1, B2, …, Bj, …, Bn.

При определении наилучших стратегий игроков основой рассуждений является принцип, который предполагает, что противники, участвующие в игре одинаково разумны и каждый из них делает все для того, чтобы добиться своей цели.

Используя этот принцип, найдем наилучшую стратегию игрока I, для чего проанализируем последовательно все его стратегии. Выбирая стратегию Аi игрока I, мы должны рассчитать, что игрок II ответит на нее той из своих стратегий Bj, для которой выигрыш игрока I будет минимальным. Найдем минимальное число aij в каждой строке матрицы и, обозначив его ai (i=1,2,…,m), запишем рядом с платежной матрицей в добавочный столбец:

ai= min ai j i=1,2,…,m.

  B1 B2 …. Bn ai
A1 а11 а12 …. а1n a1
A2 а21 а22 …. а2n a2
…. …. …. …. …. ….
Am аm1 аm2 …. аmn am
bj b1 b2 …. bn- a b

Зная числа ai (свои минимальные выигрыши при применении стратегий Аi), игрок I должен предпочесть другим стратегиям ту, для которой ai максимально. Обозначим это максимальное значение через a, тогда a= max ai.. Подставив вместо ai правую часть

I

выражения предыдущего, получим a= max min aij.

I j

Величина a -гарантированный выигрыш, который может обеспечить себе игрок I, называется нижней ценой игры (максимином). Стратегия, обеспечивающая получение нижней цены игры a, называется максиминной стратегией. Если игрок I,будет придерживаться своей максиминной (перестраховочной) стратегии, то ему гарантирован выигрыш, не меньший a при любом поведении игрока II. Игрок II заинтересован уменьшить свой проигрыш или, что тоже самое, выигрыш игрока I обратить в минимум. Поэтому для выбора своей наилучшей стратегии он должен найти максимальное значение выигрыша в каждом из столбцов и среди этих значений выбрать наименьшее. Максимальный элемент в каждом столбце обозначим через bj. Эти элементы будем записывать в дополнительной строке таблицы.

Наименьшее значение среди bj обозначим b - это верхняя цена игры (минимакс), которая определяется по формуле: b= min max ai j.

J i

Стратегия игрока II, обеспечивающая “выигрыш” b, является его минимаксной стратегией. Если игрок II будет придерживаться своей минимаксной стратегии, то он гарантирован, что в любом случае проиграет не больше b.

Для нижней и верней цены игры всегда справедливо неравенство:

max min ai j ≤ min max ai j i=1,2,…,m

i j j i j=1,2,…,n

       
   


т.о.

a ≤ b

7 игр, для которых нижняя цена равна верхней, т.е. a= b. Такие игры называются играми с седловой точкой. Общее значение нижней и верхней цены игры в играх с седловой точкой называется чистой ценой игры, а стратегии А*i и В*I, позволяющие достичь этого значения, - оптимальными. Пара оптимальных стратегий (А*i, В*I) называется седловой точкой матрицы, т.к. элемент ai j является одновременно минимальным в i-ой строке и максимальным в j-ом столбце. Оптимальные стратегии и чистая цена являются решением игры. Оптимальные стратегии определяют в игре “положение равновесия”, которое заключаются в том, что каждый из игроков не заинтересован в отходе от своей оптимальной стратегии, т.к. ему это невыгодно. Чистую цену игры γ в игре с седловой точкой при условии одинаковой разумности партнеров игрок I не может увеличить, а игрок II уменьшить. Если игра имеет седловую точку, то говорят, что она решается в чистых стратегиях. Под чистой стратегией понимается такая стратегия, которая выбрана игроком сознательно, без привлечения механизма случайного выбора.





Дата публикования: 2015-03-26; Прочитано: 321 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.006 с)...