Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Решение матричных игр со смешанным расширением методами линейного программирования



Ранее были рассмотрены случаи, когда хотя бы у одного из игроков в наличии две стратегии. В случае игры m x n, где у обоих игроков больше двух стратегий, используются методы линейного программирования. Для матричной игры, платёжная матрица которой

,

и нижняя и верхняя цены не совпадают: , определим такие значения вероятностей выбора стратегий для игрока 1 (p1, p2,…, pm) и для игрока 2 (q1, q2,…, qn), при которых игроки достигали бы своего максимально среднего гарантированного выигрыша.

Если один из игроков придерживается своей оптимальной стратегии, то, по условию задачи, его выигрыш не может быть меньше цены игры V. Поэтому данная задача может быть представлена для игроков в виде следующих систем линейных неравенств:

Для первого игрока:

Для второго игрока:

Чтобы определить значение V, разделим обе части каждого из уравнений на V. Величину pi/V обозначим через xi, а qj/V – через yj.

Здесь предполагается, что значение цены игры V > 0. Цена игры вычисляется на основе коэффициентов выигрышей платёжной матрицы. Поэтому, для того, чтобы гарантировать условие V > 0, необходимо, чтобы все коэффициенты матрицы были неотрицательными. Этого можно добиться, прибавив перед началом решения задачи к каждому коэффициенту матрицы число K, соответствующее модулю наименьшего отрицательного коэффициента матрицы. Тогда в ходе решения задачи будет определена не цена игры, а величина V* = V + K. (Аффинное преобразования игр: в общем случае ко всем элементам матрицы игры можно применить линейное преобразование аij* = α∙aij + β, тогда решение исходной игры V и решение игры с преобразованной матрицей V* будут связаны соответствующим соотношением V* = α∙V + β)

Для игрока 1 получим следующую систему неравенств, из которой найдём значение 1/v:

Для игрока 1 необходимо найти максимальную цену игры (V). Следовательно, значение 1/V должно стремиться к минимуму.

Целевая функция задачи будет иметь следующий вид:

min Z = min 1/V = min (x1 + x2 + … + xm)

Для игрока 2 получим следующую систему неравенств, из которой найдём значение 1/v:

Для игрока 2 необходимо найти минимальную цену игры (V). Следовательно, значение 1/V должно стремиться к максимуму.

Целевая функция задачи будет иметь следующий вид:

max F = max 1/V = max (y1 + y2 + … + yn)

Все переменные в данных системах линейных неравенств должны быть неотрицательными: xi = pi/V, а yi = qj/V. Значения pi и qj не могут быть отрицательными, так как являются значениями вероятностей выбора стратегий игроков. А условие V > 0 мы гарантировали ранее.

Для решения задач линейного программирования используется симплекс-метод, изложенный в предыдущем разделе учебного пособия.

В результате решения определяются значения целевых функций (для обоих игроков эти значения совпадают), а также значения переменных xi и yj.

Величина V* определяется по формуле: V* = 1/z

Значения вероятностей выбора стратегий определяются: для игрока 1: Pi = xi×V*; для игрока 2: qi = yi×V*.

Для определения цены игры V из величины V* необходимо вычесть число K (если перед решением задачи такое преобразование имело место).





Дата публикования: 2014-11-02; Прочитано: 517 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.007 с)...