Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Примеры игр



Рассмотрим несколько примеров формализации игровых или конфликтных ситуаций в виде игр.

Пример 1. Игроки A и B выбирают одну из двух сторон монеты и одновременно показывают друг другу. Если выбранные стороны монет совпали, т.е. обе монеты показываются гербом или решкой, то игрок A выигрывает монету игрока B. Впротивном случае игрок A проигрывает свою монету игроку B. Матрица игры может быть записана следующим образом:

Стратегии игроков Игрок B
Решка Герб
Игрок A Решка   -1
Герб -1  

В этой игре первые стратегии обоих игроков состоят в выборе и предъявлении решки, а вторые стратегии - в выборе и предъявлении герба. Если оба игрока выбрали одинаковые стратегии, то выигрывает первый игрок, если игроки выбрали разные стратегии, то выигрывает второй игрок.

Пример 2. Формализация конфликтной ситуации между двумя фирмами в виде матричной игры.

Пусть на некотором рынке программного обеспечения действуют две сильные фирмы A и B, которые ведут разработку разнообразных программных продуктов параллельно. Разрабатываемые программные продукты могут получаться хорошего качества (Х) и не очень удачными (Н). Пусть в каждую свою разработку первоначально фирмы вкладывают по a единиц денежных средств. Предположим для простоты также, что вопрос пустить в продажу программный продукт или вложить в него дополнительные средства в размере b единиц денежных средств всегда первой решает фирма A. Если фирма A пускает в продажу свой программный продукт, то фирма B также это делает немедленно. При этом та фирма, которая имеет лучшее программное обеспечение, получает от продажи 2 a единиц денежных средств, а вторая фирма не получает ничего. Если же программное обеспечение одного качества (у обеих фирм хорошее или неудачное), то каждая из фирм покрывает свои расходы, получая по a единиц денежных средств за счет продажи своей продукции. Если фирма A не пускает в продажу свое программное обеспечение, а вкладывает в него дополнительные средства, то у фирмы B имеется в распоряжении две альтернативы:

- либо она отказывается от дальнейшей разработки и несет убытки в размере a единиц денежных средств, а фирма A после доработки своего программного обеспечения и продажи получает (2 a + b) единиц денежных средств;

- либо фирма B вкладывает дополнительные средства в размере b единиц и пускает после этого товар в продажу, после чего и фирма A также вынуждена пустить свою разработку в продажу. Если у обеих фирм программные продукты одного качества, то фирмы окупают свои затраты на разработку, получая от продажи по (a + b) денежных единиц. Если же программные продукты разного качества, то фирма с лучшим программным обеспечением получает 2(a + b) единиц денежных средств, а вторая фирма не получает ничего. Все действия фирм можно выразить табл. 1, где фирма A является первым игроком в матричной игре, а фирма B – вторым.

Легко видеть, что фирма A имеет 4 различные стратегические возможности. Первая из них – пустить в продажу, если у нее имеется хорошее программное обеспечение, и пустить в продажу не очень удачное программное обеспечение. Сокращенно это записывается как "продажа - продажа". Другие стратегические возможности фирмы A: "продажа - дополнительные средства", "дополнительные средства - продажа", "дополнительные средства - дополнительные средства". Аналогично и фирма B имеет 4 стратегии, которые подробно описаны в табл. 1.

Рассмотрим действия фирм, когда фирма A выбрала свою первую стратегию "продажа - продажа", а фирма B - свою первую стратегию "продажа, если продает фирма A ¼ – продажа, если продает фирма A ¼". В случае, если обеими фирмами создано хорошее программное обеспечение (Х, Х), обе фирмы компенсируют свои расходы на разработку за счет продажи программных продуктов. Тоже происходит и в случае не очень удачных программных продуктов (Н, Н). В случае если фирма A имеет лучший программный продукт, чем фирма B (Х, Н), то она получает от продажи 2 a единиц денежных средств, а фирма B несет убытки в размере "- a " единиц. В случае, если фирма B имеет лучший программный продукт (Н, Х), то она получает от продажи 2 a единиц денежных средств, а фирма A несет убытки в размере "- a " единиц.

Таблица 1

Хорошее ПО   Продажа, если продает фирма A, и отказ от дальнейших разработок, если фирма A вкладывает дополнитель-ные средства. Продажа, если продает фирма A, и отказ от дальнейших разработок, если фирма A вкладывает дополнитель-ные средства. Продажа, если продает фирма A, и вложение дополнитель-ных средств, если фирма A вкладывает дополнитель-ные средства. Продажа, если продает фирма A, и вложение дополнитель-ных средств, если фирма A вкладывает дополнитель-ные средства.
Неудачное ПО Продажа, если продает фирма A, и отказ от дальнейших разработок, если фирма A вкладывает дополнитель-ные средства. Продажа, если продает фирма A, и вложение дополнитель-ных средств, если фирма A вкладывает дополнитель-ные средства. Продажа, если продает фирма A, и отказ от дальнейших разработок, если фирма A вкладывает дополнитель-ные средства. Продажа, если продает фирма A, и вложение дополнитель-ных средств, если фирма A вкладывает дополнитель-ные средства.
Продажа Продажа        
Продажа Дополн. средства 3 a/ 4 2 a/ 4 (a - b)/4 -b/ 4
Дополн. средства Продажа a/ 4 (a + b)/4   b/ 4
Дополн. средства Дополн. средства a (3 a + b)/4 (a - b)/4  

Будем считать, что вероятность появления любой из четырех описанных ситуаций равна 0,25, тогда средний выигрыш фирм при многократном повторении ситуации будет равен нулю:

a 11= 0,25((-ЗХХ + ПХХ) + (-ЗНН + ПНН) + (-ЗХН + ПХН) + (-ЗНХ + ПНХ) =
= 0,25((-a + a) + (-a + a) + (-a + 2 a) + (-a + 0)) = 0,

где ЗХХ, ЗНН, ЗХН, ЗНХ - соответственно затраты фирмы A при создании программных продуктов качества (Х, Х), (Н, Н), (Х, Н), (Н, Х);

ПХХ, ПНН, ПХН, ПНХ - соответственно денежные средства фирмы A от продажи товара при создании программных продуктов качества (Х, Х), (Н, Н), (Х, Н), (Н, Х).

При расчете элементов a 12, a 13, a 14 аналогично получаем, что a 11 = a 12 = a 13 = = a 14 = 0. Рассмотрим расчет остальных элементов таблицы:

a 21= 0,25((-ЗХХ + ПХХ) + (-ЗНН + ПНН) + (-ЗХН + ПХН) + (-ЗНХ + ПНХ) =
= 0,25((-a + a) + (- (a + b) + (2 a + b)) + (-a + 2 a) + (- (a + b) + (2 a + b)) = 0,75 a;

a 22= 0,25((-ЗХХ + ПХХ) + (-ЗНН + ПНН) + (-ЗХН + ПХН) + (-ЗНХ + ПНХ) =
= 0,25((-a +a) + (- (a + b) + (a + b)) + (-a + 2 a) + (- (a + b) + (2 a + b)) = 0,5 a;

a 23= 0,25((-ЗХХ + ПХХ) + (-ЗНН + ПНН) + (-ЗХН + ПХН) + (-ЗНХ + ПНХ) =
= 0,25((-a +a) + (- (a + b) + (2 a + b)) + (-a + 2 a) + (- (a + b) + 0) = 0,25(a - b);

a 24= 0,25((-ЗХХ + ПХХ) + (-ЗНН + ПНН) + (-ЗХН + ПХН) + (-ЗНХ + ПНХ) =
= 0,25((-a +a) + (- (a + b) + (a + b)) + (-a + 2 a) + (- (a + b) + 0) = - 0,25 b;

a 31= 0,25((-ЗХХ + ПХХ) + (-ЗНН + ПНН) + (-ЗХН + ПХН) + (-ЗНХ + ПНХ) =
= 0,25(- (a + b) + (2 a + b)) + (-a+ a) + (- (a + b) + (2 a + b)) + (-a + 0) = 0,25 a;

a 32= 0,25((-ЗХХ + ПХХ) + (-ЗНН + ПНН) + (-ЗХН + ПХН) + (-ЗНХ + ПНХ) =
= 0,25(- (a + b) + (2 a + b)) + (-a+ a) + (- (a + b) + 2(a + b)) + (-a + 0) =

= 0,25(a + b);

a 33= 0,25((-ЗХХ + ПХХ) + (-ЗНН + ПНН) + (-ЗХН + ПХН) + (-ЗНХ + ПНХ) =
= 0,25(- (a + b) + (a + b)) + (-a+ a) + (- (a + b) + (2 a + b)) + (-a + 0) = 0;

a 34= 0,25((-ЗХХ + ПХХ) + (-ЗНН + ПНН) + (-ЗХН + ПХН) + (-ЗНХ + ПНХ) =

= 0,25(- (a + b) + (a + b)) + (-a+ a) + (- (a + b) + 2(a + b)) + (-a + 0) = 0,25 b;

a 41= 0,25((-ЗХХ + ПХХ) + (-ЗНН + ПНН) + (-ЗХН + ПХН) + (-ЗНХ + ПНХ) =

= 0,25(- (a + b) + (2 a + b)) + (- (a + b) + (2 a + b)) + (- (a + b) + (2 a + b)) +

+ (- (a + b) + (2 a + b)) = a;

a 42= 0,25((-ЗХХ + ПХХ) + (-ЗНН + ПНН) + (-ЗХН + ПХН) + (-ЗНХ + ПНХ) =

= 0,25(- (a + b) + (2 a + b)) + (- (a + b) + (a + b)) + (- (a + b) + 2(a + b)) +

+ (- (a + b) + (2 a + b)) = 0,25(3 a + b);

a 43= 0,25((-ЗХХ + ПХХ) + (-ЗНН + ПНН) + (-ЗХН + ПХН) + (-ЗНХ + ПНХ) =

= 0,25(- (a + b) + (a + b)) + (- (a + b) + (2 a + b)) + (- (a + b) + (2 a + b)) +

+ (- (a + b) + 0) = 0,25(a - b);

a 44 = 0,25((-ЗХХ + ПХХ) + (-ЗНН + ПНН) + (-ЗХН + ПХН) + (-ЗНХ + ПНХ) =

= 0,25(- (a + b) + (a + b)) + (- (a + b) + (a + b)) + (- (a + b) + 2(a + b)) +

+ (- (a + b) + 0) = 0.

Для первого игрока матрица игры является матрицей выигрышей, поэтому анализ первой и третьей стратегий первого игрока показывает, что третья стратегия лучше первой стратегии.

Действительно, сравнивая элементы первой и третьей строк матрицы в соответствующих столбцах, имеем:

0 < a /4; 0 < (a + b)/4; 0 = 0; 0 < b /4.

Таким образом, только при третьей стратегии второго игрока первая и третья стратегии первого игрока равноценны. Во всех остальных случаях первая стратегия уступает третьей, поскольку в отличие от третьей стратегии она не приносит выигрышей первому игроку, т.е. применять первую стратегию первому игроку невыгодно.

Аналогично, четвертая стратегия первого игрока превосходит его вторую стратегию. Следовательно, и вторую стратегию первому игроку применять нет смысла.

Таким образом, число применяемых стратегий первого игрока уменьшается до двух, поэтому исходную матричную игру размерами 4 × 4 можно преобразовать к игре размерами 2 × 4 (табл. 2):

Таблица 2

Хорошее ПО   Продажа, если продает фирма A, и отказ от дальнейших разработок, если фирма A вкладывает дополнитель-ные средства. Продажа, если продает фирма A, и отказ от дальнейших разработок, если фирма A вкладывает дополнитель-ные средства. Продажа, если продает фирма A, и вложение дополнитель-ных средств, если фирма A вкладывает дополнитель-ные средства. Продажа, если продает фирма A, и вложение дополнитель-ных средств, если фирма A вкладывает дополнитель-ные средства.
Неудачное ПО Продажа, если продает фирма A, и отказ от дальнейших разработок, если фирма A вкладывает дополнитель-ные средства. Продажа, если продает фирма A, и вложение дополнитель-ных средств, если фирма A вкладывает дополнитель-ные средства. Продажа, если продает фирма A, и отказ от дальнейших разработок, если фирма A вкладывает дополнитель-ные средства. Продажа, если продает фирма A, и вложение дополнитель-ных средств, если фирма A вкладывает дополнитель-ные средства.
Дополн. средства Продажа a/ 4 (a + b)/4   b/ 4
Дополн. средства Дополн. средства a (3 a + b)/4 (a - b)/4  

Для второго игрока матрица игры является матрицей проигрышей, поэтому нетрудно видеть, что первая стратегия второго игрока хуже третьей стратегии, а вторая стратегия - четвертой, поскольку элементы соответственно третьего и четвертого столбцов матрицы меньше соответствующих элементов первого и второго столбцов, поэтому применять первую и вторую стратегию второму игроку нет смысла. Следовательно, решение рассматриваемой игры может быть сведено к решению матричной игры 2 ´ 2:

  b/ 4
(a - b)/4  

Пример 3. Игра Бореля. Игра Бореля предложена выдающимся французским математиком в 1921 году. В этой игре два игрока A, B выбирают по три неотрицательных числа, сумма которых равна единице, а именно:

и располагают их в определенном порядке. Игрок A или B выигрывает, если два выбранных ими числа больше соответствующих чисел противника.

Два обобщения игры Бореля

При первом обобщении игроки выбирают по n неотрицательных чисел, удовлетворяющих условиям

(1)

и располагают их в определенном порядке, выигрывает игрок, у которого большее число чисел превосходит числа другого игрока.

При втором обобщении также выбираются по n неотрицательных чисел, удовлетворяющих условиям (1), но при этом выигрывает игрок, у которого больше сумма, определяемая выражениями:

где f - заданная функция.

Игра Бореля может стать игрой на разорение.

Играми на разорение называются многошаговые игры, в которых каждый игрок, начиная игру, имеет ограниченные ресурсы и с каждым шагом или партией ресурсы проигравшего игрока уменьшаются, например, на единицу, на цену игры или на значение, которое вычисляется каким-либо иным способом.

Игра на разорение может быть сформулирована как игра на выигрыш, если считать, что игроки начинают игру с нулевыми ресурсами, а затем на каждом шаге ресурсы выигравшего игрока увеличиваются на единицу или на цену сыгранной партии, или на значение, которое вычисляется каким-либо иным способом.

Пример 4. Игры Блотто. Игра Бореля нашла свое развитие в так называемых играх полковника Блотто - нарицательное имя участника многих иллюстративных игр, имеющих приложения в военной сфере. Рассмотрим пример одной из таких игр.

Два игрока A и B ведут борьбу на N независимых театрах взаимодействия (рынках сбыта, зонах военного конфликта и т.д.), обозначенных числами 1, 2, …, N. Они должны распределить свои силы (ресурсы), соответственно F и G единиц по театрам взаимодействия, не зная схемы распределения противодействующего игрока. Платеж (то есть численная мера выигрыша игрока A или убытки игрока B) на i- ом театре выражается функцией Pi (x, y), зависящей от i- го театра и соотношения ресурсов x и y,вложенных игроками в этот театр взаимодействия. Платеж игры в целом равен сумме платежей на отдельных театрах. Пусть борьба идет на двух театрах, и у A имеется 4 единицы средств, а у его противника - 3, которые нужно распределить между театрами. Платеж определен следующим образом. Игрок получает сумму своих затрат и затрат противника на театре, если он по вложениям превосходит противника,и получает свои затраты, если вложения равны или противник не вкладывал средств в этот театр действий. Если вложения игрока меньше, чем у его противника, то он не получает ничего. Общий платеж равен сумме платежей на обоих театрах действий. Результаты взаимодействия игроков приведены в табл. 3.

Таблица 3

Стратегии (3, 0) (0, 3) (2, 1) (1, 2)
(4, 0) (7, 0) (4, 3) (6, 1) (5, 2)
(0, 4) (4, 3) (7, 0) (5, 2) (6, 1)
(3, 1) (4, 3) (3, 4) (6, 1) (4, 3)
(1, 3) (3, 4) (4, 3) (4, 3) (6, 1)
(2, 2) (2, 5) (2, 5) (5, 2) (5, 2)

За каждой клеточкой матрицы скрывается или окончание игры, как в случае одновременного применения первых или вторых стратегий обоими игроками, или продолжение игры с теми же (например, после применения стратегий (1. 2) или (2, 1)) либо другими ресурсами (например, после применения первым игроком первой стратегии, а вторым - четвертой). В последнем случае будет разыгрываться игра, приведенная в табл. 4.

Таблица 4

Стратегии (2, 0) (0, 2) (1, 1)
(5, 0) (7, 0) (5, 2) (6, 1)
(0, 5) (5, 2) (7, 0) (6, 1)
(4, 1) (7, 0) (4, 3) (6, 1)
(1, 4) (4, 3) (7, 0) (6, 1)
(3, 2) (7, 0) (5, 2) (7, 0)
(2, 3) (5, 2) (7, 0) (7, 0)

В игре Блотто выигрывает тот, кто истощит ресурсы противника.





Дата публикования: 2014-11-18; Прочитано: 510 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.012 с)...