Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Биматричные игры



Предыдущие рассмотрения касались игр двух лиц, в которых интересы игроков были прямо противоположны, а также позиционных игр, сводимых к матричным. Однако ситуации, в которых интересы игроков хотя и не совпадают, но уже не обязательно являются противоположными, встречаются значительно чаще.

Рассмотрим, например, конфликтную ситуацию, в которой каждый из двух участников имеет следующие возможности для выбора своей линии поведения:

игрок А – может выбрать любую из стратегий А1,…,Аm,

игрок В – любую из стратегий В1,…,Вn.

При этом их совместный выбор оценивается вполне определённо: если игрок А выбрал i-ю стратегию Аi, а игрок В – k-ю стратегию Вk, то в итоге выигрыш игрока А будет равен некоторому числу aik, а выигрыш игрока В некоторому, вообще говоря, другому числу bik.

Последовательно перебирая все стратегии игрока А и все стратегии игрока В, мы сможем заполнить их выигрышами две таблицы

Первая из таблиц описывает выигрыш игрока А, а вторая – выигрыш игрока В. Обычно эти таблицы записывают в виде матрицы

А =, В =

Здесь А – платёжная матрица игрока А,

В – платёжная матрица игрока В.

Таким образом, в случае, когда интересы игроков различны (но не обязательно противоположны) получаются две платёжные матрицы: одна – матрица выплат игроку А, другая – матрица выплат игроку В. Поэтому совершенно естественно звучит название, которое обычно присваивается подобной игре – биматричная.

Пример1: «Студент – Преподаватель».

Студент (игрок А) готовится к зачету, который принимает Преподаватель (игрок В). Можно считать, что у студента две стратегии – подготовится к сдаче зачёта (+) и не подготовится (-). У Преподавателя также две стратегии – поставить зачёт [+] и не поставить [-].

Тогда

Количественно это можно выразить, например, так

Вследствие того, что в биматричных играх интересы игроков не совпадают, необходимо построить такое решение, которое бы в том или ином, но в одинаковом смысле удовлетворяло обоих игроков.

Рассмотрим случай когда у игроков имеется ровно две стратегии, т.е. m=n=2.

В 2´2 биматричной игре платёжные матрицы игроков имеют следующий вид

       
 
   


А = В =

Вероятности р1=р, р2=1-р, q1=q, q2=1-q, а средние выигрыши вычисляются по формулам

Ha(p,q) = a11p q + a12 p(1- q) + a21(1-p)q + a22(1-p)(1-q),

Hb(p, q) = b11pq + b12 p(1-q) + b21(1-p)q + b22(1-p)(1-q), где 0 £ p £ 1, 0 £ q £ 1,

Пара чисел (p*, q*), o ≤ p * ≤ 1, o ≤ q* ≤ 1, p и q, подчиненных условиям o ≤ p * ≤ 1, o≤q*≤1, одновременно выполнены следующие неравенства HA (p, q*) ≤ HA (p*, q*). (Ü)

T: всякая биматричная игра имеет хотя бы одну равновесную ситуацию (точку равновесия) в смешанных стратегиях.

Задание смешанной стратегии игрока состоит в указании тех вероятностей, с которыми выбираются его первоначальные стратегии.

Если некоторая пара чисел (p*,q*) претендуют на то, чтобы определить ситуацию равновесия, то необходимо проверить справедливость неравенств (Ü). Для этого воспользуемся теоремой:

T: Выполнение неравенств (Ü) равносильно выполнению неравенств

HA (o, q*) ≤ HA (p*,q*), HB (p*, o) ≤ HB (p*, q*), (ÜÜ)

HA (1, q*) ≤ HA (p*, q*), HB (p*, 1) ≤ HB (p*, q*).

Запишем средние выигрыши игроков А и В в более удобной форме. Имеем

HA (p, q) = (a11 - a12 - a21 + a22) pq + (a11 - a22)p + (a21 - a22)q + a22

HB (p, q) = (b11 - b12 - b21 + b22 ) pq + (b11 - b22)p + (b21 - b22)q + b22

Обратимся к первой формуле. Пологая p = 1, а потом p = 0, получаем, что

HA (1, q) = (a11 - a12 - a21 + a22) q + a12 + (a21 - a22)q,

HA (0, q) = (a21 - a22)q + a22

Рассмотрим разности

HA (p, q) - HA (1, q) = (a11 - a12 - a21 + a22)pq + (a12 - a22)p –

– (a11 - a12 - a21 + a22)q + a22 – a12,

HA (р, q) - HA (0, q) = (a11 - a12 - a21 + a22)p q + (a12 - a22)p

Пологая C = a11 - a12 - a21 + a22, α = a22- a12, получим

HA (p, q) - HA (1, q) = C pq – αp – C r + α = (p – 1)(C q - α)

HA (p, q) - HA (0, q) = C pq – αp = p(C q - α)

В случае, если пара (p, r) определяет точку равновесия, эти разности неотрицательны, поэтому

(p – 1)(C q - α) ≥ 0, p(C q - α) ≥ 0

Из формул для функции HB (p, r) при r = 1, r = 0 соответственно имеем

HB (p, 1) = (b11 - b12 - b21 + b22)p + b12 + (b21 - b22)p + b21,

HB (p, 0) = (b21 - b22)p + b22

Разности HB (p, q) - HB (p, 1) и HB (p, q) - HB (p, - 0)

С учётом обозначений Д = b11-b12-b21+b22, b = b22-b21

Приводятся к виду Hb(p, q) = Hb(p, 1) = (q-1)(Дp-b),

Hb(p, r) = Hb(p, 0) = q(Дp-b).

И (q-1)(Дp-b) ³ 0, q(Дp-b) ³ 0

Итак, чтобы в биматричной игре

       
   


А = В = пара (p, q)

определяемая равновесную ситуацию, необходимо и достаточно одновременное выполнение следующих неравенств

Пример1: «Студент – Преподаватель» (продолжение).

       
 
   
 


А =, В =

Проводя необходимые вычисления

С = 2+1-1+0 = 2, α = 0+1=1,

Д = 1+3+2-1 = 5, b=-1+2 = 1,

и рассуждения (p-1) (2q-1) ³ 0, (q-1)(5p-1) ³ 0,

p(2q-1) ³ 0, q(5p-1) ³ 0,

получаем, что 1) p=1, q ³ , 2) q=1, p ³,

p=0, q ≤ , q=0, p ≤,

0<p<1, q = , 0<q<1, p =.

Число точек пересечения у зигзагов (равновесных ситуаций) равно трём. Две из них отвечают чистым стратегиям игроков,

p=1, q=1: Ha(1,1)=2, Hb(1,1)=1,

p=0, q=0: Ha(0,0)=0, Hb(0,0)=1,

Одна – смешанная, p=, q= : Ha(;) =, Hb(;) =

Наилучшим является выбор каждым из игроков первой чистой стратегии – хорошо подготовится к зачёту и поставить зачет.

Вопросы для самоконтроля по главе

1. Какая матрица называется платежной?

2. Что называют нижней (верхней) ценой игры?

3. Какой элемент матрицы игры называют Седловой точкой или точкой равновесия?

4. Сформулируйте понятие позиционной игры?

5. Что называют информационным множеством?

6. Какой процесс называют нормализацией позиционной игры?

7. Какие игры называют биматричными?

8. Выполнение каких неравенств определяет равновесную ситуацию для биматричных игр?

9. Всегда ли биматричная игра имеет равновесную ситуацию? Если имеет, то сколько?





Дата публикования: 2014-11-03; Прочитано: 1014 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.01 с)...