Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Мы свели игру 2 x 2 к игре 1 x 1



Задача2:

Проверяем, имеет ли платежная матрица седловую точку. Если да, то выписываем решение игры в чистых стратегиях.
Считаем, что игрок I выбирает свою стратегию так, чтобы получить максимальный свой выигрыш, а игрок II выбирает свою стратегию так, чтобы минимизировать выигрыш игрока I.

Игроки B1 B2 B3 B4 a = min(Ai)
A1 -3       -3
A2 0.3 0.4 0.1 0.2 0.1
b = max(Bi) 0.3        


Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(ai) = 0.1, которая указывает на максимальную чистую стратегию A2.
Верхняя цена игры b = min(bj) = 0.3.
Что свидетельствует об отсутствии седловой точки, так как a ≠ b, тогда цена игры находится в пределах 0.1 <= y <= 0.3. Находим решение игры в смешанных стратегиях. Объясняется это тем, что игроки не могут объявить противнику свои чистые стратегии: им следует скрывать свои действия. Игру можно решить, если позволить игрокам выбирать свои стратегии случайным образом (смешивать чистые стратегии).
2. Проверяем платежную матрицу на доминирующие строки и доминирующие столбцы.
Иногда на основании простого рассмотрения матрицы игры можно сказать, что некоторые чистые стратегии могут войти в оптимальную смешанную стратегию лишь с нулевой вероятностью.
Говорят, что i-я стратегия 1-го игрока доминирует его k-ю стратегию, если aij >= akj для всех j Э N и хотя бы для одного j aij > akj. В этом случае говорят также, что i-я стратегия (или строка) – доминирующая, k-я – доминируемая.
Говорят, что j-я стратегия 2-го игрока доминирует его l-ю стратегию, если для всех j Э M aij <= ail и хотя бы для одного i aij< ail. В этом случае j-ю стратегию (столбец) называют доминирующей, l-ю – доминируемой.
С позиции проигрышей игрока В стратегия B2 доминирует над стратегией B1 (все элементы столбца 2 больше элементов столбца 1), следовательно исключаем 2-й столбец матрицы. Вероятность q2 = 0.
С позиции проигрышей игрока В стратегия B4 доминирует над стратегией B3 (все элементы столбца 4 больше элементов столбца 3), следовательно исключаем 4-й столбец матрицы. Вероятность q4 = 0.

-3  
0.3 0.1


В платежной матрице отсутствуют доминирующие строки.
Мы свели игру 2 x 4 к игре 2 x 2.
Так как игроки выбирают свои чистые стратегии случайным образом, то выигрыш игрока I будет случайной величиной. В этом случае игрок I должен выбрать свои смешанные стратегии так, чтобы получить максимальный средний выигрыш.
Аналогично, игрок II должен выбрать свои смешанные стратегии так, чтобы минимизировать математическое ожидание игрока I.
В матрице присутствуют отрицательные элементы. Для упрощения расчетов добавим к элементам матрицы (3). Такая замена не изменит решения игры, изменится только ее цена (по теореме фон Неймана).

   
3.3 3.1

3. Находим решение игры в смешанных стратегиях.
Математические модели пары двойственных задач линейного программирования можно записать так:
найти минимум функции F(x) при ограничениях:
3.3x2 >= 1
6x1+3.1x2 >= 1
F(x) = x1+x2 → min
найти максимум функции Ф(y) при ограничениях:
6y2 <= 1
3.3y1+3.1y2 <= 1
Ф(y) = y1+y2 → max
Цена игры будет равна g = 1/F(x), а вероятности применения стратегий игроков:
pi = g*xi; qi = g*yi.
Цена игры: g = 1: 0.31313131 = 1
p1 = 1 • 0.01010101 = 0.03225806
p2 = 1 • 0.30303030 = 0.96774193
Оптимальная смешанная стратегия игрока I:
P = (0.03225806; 0.96774193)
q1 = 1 • 0.14646465 = 0.46774195
q2 = 1 • 0.16666666 = 0.53225804
Оптимальная смешанная стратегия игрока II:
Q = (0.46774195; 0.53225804)
Поскольку ранее к элементам матрицы было прибавлено число (3), то вычтем это число из цены игры.
1 - 3 = 0.19354841
Цена игры: v=0.19354841
4. Проверим правильность решения игры с помощью критерия оптимальности стратегии.
∑aijqj <= v
∑aijpi >= v
M(P1;Q) = (-3•0.46774195) + (3•0.53225804) = 0.19 <= v
M(P2;Q) = (0.3•0.46774195) + (0.1•0.53225804) = 0.19 <= v
M(P;Q1) = (-3•0.03225806) + (0.3•0.96774193) = 0.19 <= v
M(P;Q2) = (3•0.03225806) + (0.1•0.96774193) = 0.19 <= v
Поскольку из исходной матрицы были удалены и столбцы, то найденные векторы вероятности можно записать в виде:
P(0.03225806,0.96774193)
Q(0.46774195,0,0.53225804,0)





Дата публикования: 2015-01-10; Прочитано: 271 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.008 с)...