Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Пример численного решения матричной игры



Рассмотрим пример решения игры. Пусть игра задана следующей матрицей

Применение любого численного метода для решения матричной игры необходимо начинать с определения нижней чистой цены игры a и верхней чистой цены игры b. Это позволит избежать применения численных методов решения матричных игр в тех случаях, когда решение может быть найдено в чистых стратегиях. В нашем случае имеем:

Итак, и решение матричной игры необходимо искать численным методом. Предположим, что в первой партии второй игрок выбрал свою первую стратегию, тогда, если первый игрок выберет свою первую стратегию, то он выиграет 50, если вторую - 25, если третью - 10. Сведем полученные результаты в табл. 1. Из анализа колонки ²Суммарный выигрыш первого игрока по стратегиям² следует, что первая стратегия первого игрока приносит ему наибольший выигрыш. Поэтому первый игрок и должен выбрать свою первую чистую стратегию (см. колонку ²Стратегия первого игрока²). В этом случае, если второй игрок выбирает свою первую стратегию, то он проигрывает 50, если вторую - 15, если третью - 20. Наибольший выигрыш, который может получить первый игрок в первой партии, равен 50, поскольку

Аналогично, получается наименьший возможный проигрыш второго игрока

Таблица 1

Номер партии N Стратегия второго игрока Суммарный выигрыш первого игрока по стратегиям Стратегия первого игрока Суммарный проигрыш второго игрока по стратегиям Среднее значение выигрыша v 1 первого игрока Среднее значение проигрыша. v 2 второго игрока Цена игры v
           
                      32,50
                  65/2 30/2 23,75
                  105/3 70/3 29,17
                  145/4 100/4 30,62
                  175/5 130/5 30,50
                  220/6 180/6 33,33
                  250/7 195/7 31,78
                  270/8 220/8 30,62
                  295/9 245/9 29,44
                  320/10 270/10 29,50
                  350/11 320/11 30,45
                  400/12 360/12 31,67
                  415/13 375/13 30,38
                  450/14 415/14 30,89
                  490/15 455/15 31,50
                  530/16 490/16 31,88
                  560/17 520/17 31,76
                  590/18 545/18 31,53
                  615/19 570/19 31,18
                  640/20 595/20 30,88
                  665/21 620/21 30,60
                  700/22 660/22 30,91
                  720/23 680/23 30,43
                  750/24 710/24 30,42
                  780/25 740/25 30,40

Зная и , по соотношению (3) несложно вычислить приближенное значение цены игры после первой партии: v = (50 + 15)/2 = 32,5. Поскольку лучший результат в первой партии второму игроку принесла вторая стратегия (проигрыш равен 15), то он ее и должен выбрать во второй партии. В этом случае применение первой стратегии первым игроком принесет ему выигрыш в 15 единиц, суммируя его с выигрышем, полученным с помощью этой же стратегии в первой партии, получаем 65. Применение первым игроком своей второй стратегии в текущей партии приносит ему выигрыш в 40 единиц и суммарный выигрыш в двух партиях - 65.

Аналогично, применение третьей стратегии первым игроком приносит ему выигрыш в текущей партии в 30 единиц и суммарный выигрыш в двух партиях - 40. Наибольший выигрыш в двух партиях первому игроку обеспечили сразу две стратегии: первая и вторая. В общем случае с точки зрения обеспечения устойчивости решения в следующей партии лучше выбирать ту стратегию, которая была в предшествующей партии. Поэтому во второй партии первый игрок применяет свою первую стратегию. Если в ответ на это второй игрок выбирает свою первую стратегию, то он проигрывает в текущей партии 50 и 100 в двух партиях, если выбирает вторую стратегию, то проигрывает во второй партии 15 и 30 в двух партиях, если выбирает третью стратегию, то соответственно проигрывает 20 и 40. Средний выигрыш первого игрока в двух партиях равен: = 65/2 = 32,5; средний проигрыш второго игрока в двух партиях: =30/2 = 15. Приближенное значение цены игры по результатам двух партий

В третьей и последующих партиях процесс вычислений и заполнения таблицы происходит аналогично.

После 25-й партии имеем следующие приближенные значения цены игры и компоненты смешанных стратегий соответственно первого и второго игроков:

v = 30,40; x = (0,280; 0,640; 0,080); y = (0,400; 0,320; 0,280).

Сопоставление с точным решением этой матричной игры методом линейного программирования

(v = 30,77; x = (0,314; 0,554; 0,132); y = (0,409; 0,289; 0,302))

показывает удовлетворительную точность в определении цены игры и значительную погрешность в определении компонент смешанных стратегий обоих игроков. Эта погрешность объясняется тем, что в рассматриваемом численном методе применяемые игроками стратегии изменяются не после одной, двух или трех партий, а нерегулярно: восемь раз подряд в партиях с 14-й по 21-ю применялась стратегия два первым игроком; пять раз подряд - стратегия один второго игрока; в 18 партиях подряд не применялась третья стратегия первого игрока и т.д. Для того чтобы эта нерегулярность не оказывала существенного влияния на конечный результат, необходим расчет сотен партий. Действительно, если потребовать, чтобы погрешность d определения компонент смешанных стратегий не превышала, допустим, 0,01, а в последовательности партий наблюдаются m‑ кратные появления подряд одной из стратегий любого из игроков, то, в первом приближении, число партий N можно оценить следующим образом:

,

где m - наибольшая кратность появления подряд одной из стратегий любого из игроков.

При m = 8, d = 0,01 получаем, что число партий должно быть не менее 800.

Для точного определения цены игры в общем случае также необходимо большое число партий. Действительно, анализ последнего столбца таблицы показывает существенные колебания цены игры, которые уменьшаются при росте суммарного выигрыша первого игрока и проигрыша второго игрока.





Дата публикования: 2014-11-18; Прочитано: 449 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.006 с)...