Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Решение матричных игр с нулевой суммой для игр с седловой точкой



Парная игра называется игрой с нулевой суммой, если выигрыш одного игрока равен проигрышу другого. Мы будем рассматривать только такие игры.

Парную игру с нулевой суммой удобно исследовать, если она описана в виде так называемой платежной матрицы (табл. 1). Такую игру называют матричной.

В платежной матрице строки и столбцы соответствуют различным стратегиям, а элементы – выигрышам одной стороны (равные проигрышам другой).

Рассмотрим игру, в которой игрок А имеет личных стратегий, а игрок В («противник») – личных стратегий. Такая игра называется игрой . Стратегии игрока А будем обозначать , противника – . Предположим, что каждая сторона выбрала определенную стратегию: мы выбрали , противник . В результате выбора игроками любой пары стратегий Ai, Bj ( ) однозначно определяется исход игры, т.е. выигрыш aij игрока А (положительный или отрицательный) и проигрыш (- aij) игрока В.

Предположим, что нам известны значения для каждой пары стратегий. Эти значения можно записать в виде прямоугольной таблицы или матрицы.

Матрица А = (aij), , элементами которой являются выигрыши, соответствующие стратегиям Ai и Bj, называется платежной матрицей или матрицей игры.

Общий вид платежной матрицы приведен ниже:

 

В платежной матрице приведены числа – минимально возможный выигрыш игрока А, применяющего стратегию () и – максимально возможный проигрыш игрока В, если он пользуется стратегией ().

 
 

Чистая стратегия – это некоторая стратегия игрока, выбранная им с вероятностью, равной 1.

Поскольку инте­ресы игроков противоположны, то первый игрок стремится макси­мизировать свой выигрыш, а второй игрок, наоборот, минимизиро­вать свой проигрыш.

Решение игры состоит в определении наилучшей стратегии каждым игроком. Выбор наилучшей стратегии одним игроком про­водится при полном отсутствии информации о принимаемом ре­шении вторым игроком. Следует отметить, что и первый, и второй игрок являются разумными противниками, которые находятся в состоянии конфликта. Поэтому для решения игры двух лиц с нуле­вой суммой используется очень «пессимистичный» принцип, диктующий игрокам выбор наиболее "осторожных" максиминной и минимаксной стратегий, называемый принципом максимина-минимакса. Этот принцип следует из разумного предположения, что каждый игрок стремится достичь цели, противоположной цели противника.

Число называют нижней ценой игры (максимином), а соответствующую ему чистую стратегию – максиминной.

Число показывает, какой минимальный гарантированный выигрыш может получить игрок А, правильно применяя свои чистые стратегии при любых действиях игрока В.

Число называют верхней ценой игры (минимаксом), а соответствующую чистую стратегию минимаксной.

Число показывает, какой минимальный гарантированный проигрыш может быть у игрока В, при правильном выборе им своих чистых стратегий независимо от действий игрока А.

Ясно, что .

Существуют игры, для которых нижняя цена равна верхней, т.е. . Та­кие игры называются играми с седловой точкой. Общее значение верхней и нижней цены v = α = β называется чистой ценой игры, или просто ценой игры. Таким образом, если игра имеет седловую точку, то говорят, что она решается в чистых стратегиях и имеет чистую цену игры v = α = β. Максиминная и минимаксная стратегии, образующие седловую точку, являются оптимальными стратегиями. Тройку чисел () называют решением игры.

Седловая точка есть точ­ка равновесия игры, определяющая однозначно оптимальные стра­тегии. Оптимальность здесь означает, что ни один игрок не стре­мится изменить свою стратегию, так как его противник может на это ответить выбором другой стратегии, дающей худший для пер­вого игрока результат.

Пример. Проверим наличие седловой точки в игре, заданной платежной матрицей.

min
       
       
       
max        

Решение. Для игрока А максимин: = max (1, 1, 10) = 10.

Для игрока В минимакс: = min(10, 10, 12) = 10.

Решение игры – две седловые точки: (А 3, В 1, 10), (А 3, В 2, 10).

Оптимальный выбор для игрока 1 – стратегия А 3, для игрока 2 равнозначны стратегии В 1 и В 2.





Дата публикования: 2015-02-22; Прочитано: 685 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.008 с)...