Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Задача2:
Проверяем, имеет ли платежная матрица седловую точку. Если да, то выписываем решение игры в чистых стратегиях.
Считаем, что игрок I выбирает свою стратегию так, чтобы получить максимальный свой выигрыш, а игрок II выбирает свою стратегию так, чтобы минимизировать выигрыш игрока I.
Игроки | B1 | B2 | B3 | B4 | a = min(Ai) |
A1 | -3 | -3 | |||
A2 | 0.3 | 0.4 | 0.1 | 0.2 | 0.1 |
b = max(Bi) | 0.3 |
Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(ai) = 0.1, которая указывает на максимальную чистую стратегию A2.
Верхняя цена игры b = min(bj) = 0.3.
Что свидетельствует об отсутствии седловой точки, так как a ≠ b, тогда цена игры находится в пределах 0.1 <= y <= 0.3. Находим решение игры в смешанных стратегиях. Объясняется это тем, что игроки не могут объявить противнику свои чистые стратегии: им следует скрывать свои действия. Игру можно решить, если позволить игрокам выбирать свои стратегии случайным образом (смешивать чистые стратегии).
2. Проверяем платежную матрицу на доминирующие строки и доминирующие столбцы.
Иногда на основании простого рассмотрения матрицы игры можно сказать, что некоторые чистые стратегии могут войти в оптимальную смешанную стратегию лишь с нулевой вероятностью.
Говорят, что i-я стратегия 1-го игрока доминирует его k-ю стратегию, если aij >= akj для всех j Э N и хотя бы для одного j aij > akj. В этом случае говорят также, что i-я стратегия (или строка) – доминирующая, k-я – доминируемая.
Говорят, что j-я стратегия 2-го игрока доминирует его l-ю стратегию, если для всех j Э M aij <= ail и хотя бы для одного i aij< ail. В этом случае j-ю стратегию (столбец) называют доминирующей, l-ю – доминируемой.
С позиции проигрышей игрока В стратегия B2 доминирует над стратегией B1 (все элементы столбца 2 больше элементов столбца 1), следовательно исключаем 2-й столбец матрицы. Вероятность q2 = 0.
С позиции проигрышей игрока В стратегия B4 доминирует над стратегией B3 (все элементы столбца 4 больше элементов столбца 3), следовательно исключаем 4-й столбец матрицы. Вероятность q4 = 0.
-3 | |
0.3 | 0.1 |
В платежной матрице отсутствуют доминирующие строки.
Мы свели игру 2 x 4 к игре 2 x 2.
Так как игроки выбирают свои чистые стратегии случайным образом, то выигрыш игрока I будет случайной величиной. В этом случае игрок I должен выбрать свои смешанные стратегии так, чтобы получить максимальный средний выигрыш.
Аналогично, игрок II должен выбрать свои смешанные стратегии так, чтобы минимизировать математическое ожидание игрока I.
В матрице присутствуют отрицательные элементы. Для упрощения расчетов добавим к элементам матрицы (3). Такая замена не изменит решения игры, изменится только ее цена (по теореме фон Неймана).
3.3 | 3.1 |
3. Находим решение игры в смешанных стратегиях.
Математические модели пары двойственных задач линейного программирования можно записать так:
найти минимум функции F(x) при ограничениях:
3.3x2 >= 1
6x1+3.1x2 >= 1
F(x) = x1+x2 → min
найти максимум функции Ф(y) при ограничениях:
6y2 <= 1
3.3y1+3.1y2 <= 1
Ф(y) = y1+y2 → max
Цена игры будет равна g = 1/F(x), а вероятности применения стратегий игроков:
pi = g*xi; qi = g*yi.
Цена игры: g = 1: 0.31313131 = 1
p1 = 1 • 0.01010101 = 0.03225806
p2 = 1 • 0.30303030 = 0.96774193
Оптимальная смешанная стратегия игрока I:
P = (0.03225806; 0.96774193)
q1 = 1 • 0.14646465 = 0.46774195
q2 = 1 • 0.16666666 = 0.53225804
Оптимальная смешанная стратегия игрока II:
Q = (0.46774195; 0.53225804)
Поскольку ранее к элементам матрицы было прибавлено число (3), то вычтем это число из цены игры.
1 - 3 = 0.19354841
Цена игры: v=0.19354841
4. Проверим правильность решения игры с помощью критерия оптимальности стратегии.
∑aijqj <= v
∑aijpi >= v
M(P1;Q) = (-3•0.46774195) + (3•0.53225804) = 0.19 <= v
M(P2;Q) = (0.3•0.46774195) + (0.1•0.53225804) = 0.19 <= v
M(P;Q1) = (-3•0.03225806) + (0.3•0.96774193) = 0.19 <= v
M(P;Q2) = (3•0.03225806) + (0.1•0.96774193) = 0.19 <= v
Поскольку из исходной матрицы были удалены и столбцы, то найденные векторы вероятности можно записать в виде:
P(0.03225806,0.96774193)
Q(0.46774195,0,0.53225804,0)
Дата публикования: 2015-01-10; Прочитано: 271 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!