Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Модели непрерывных игр



Антагонистические игры в которых один или оба игрока имеют бесконечное множество стратегий называются бесконечными. С теоретической точки зрения это отличие малосущественно, т.к. игра остается антагонистической и проблема состоит в использовании более сложного аппарата исследования.

Пример.(Одновременная игра преследования на плоскости.)

Пусть S1 и S2 - множества на плоскости. Игра Г заключается в следующем. Пусть 1-ый игрок выбирает некоторую точку хÎS1, а игрок 2 - точку yÎS2. При совершении выбора игроки 1 и 2 не имеют информации о действиях противника, поэтому подобный выбор удобно интерпретировать как одновременный. Точки хÎS1, yÎS2 являются в этом случае стратегиями игроков 1 и 2 соответственно. Таким образом, множества стратегий игроков совпадают с множествами S1 и S2 на плоскости.

Целью игрока 2 является минимизация расстояния между ним и вторым игроком (игрок 1 преследует противоположную цель). Поэтому под выигрышем H(x,y) игрока 1 в этой игре будем понимать евклидово расстояние r(x,y) между точками xÎS1 и yÎS2, т.е. H(x,y)= r(x,y), xÎS1 и yÎS2. Выигрыш игрока 2 полагается равным выигрышу игрока 1, взятому с противоположным знаком(т.к. игра антагонистическая).

Отдельно надо отметить специальный класс антагонистических бесконечных игр, в которых X=Y=[0, 1]. В этих играх ситуациями являются пары чисел (x,y), где x, yÎ[0, 1]. Эти пары задают точки единичного квадрата. Поэтому такие игры называются играми на единичном квадрате. Класс игр на единичном квадрате во многом характеризует бесконечные антагонистические игры и поэтому является базовым при исследовании бесконечных игр.

v= v =`v,

Антагонистическая игра Г называется непрерывной, если функция выигрыша Н непрерывна на g´h. Для игр с бесконечным числом стратегий (непрерывных игр) стандартные методы решений пока не разработаны. Решения находятся только для игр с определенными ограничениями. Например, для игр со смешанными стратегиями существует лемма: В непрерывной игре Г на прямоугольнике найдется max min и min max смешанной стратегии игроков. Исключение составляют непрерывные игры приближенные решения которых можно находить с помощью итеративного алгоритма Брауна-Робинсона(метод фиктивного разыгрывания). Идея метода - многократное фиктивное разыгрывание игры с заданной матрицей выигрыша. Но сходимость итеративного алгоритма очень медленная и поэтому стараются применять какие-нибудь другие более эффективные методы хотя бы приближенного решения непрерывных игр. Для этого применяется способ аппроксимации конечными играми и конструирования из решений конечных игр приближенные(по результатам применения) решения непрерывных игр.

Принятие решений в условиях неопределённости.
Будем предполагать, что лицу, принимающему решение не противостоит разумный противник.
Данные, необходимо для принятия решения в условии неопределенности, обычно задаются в форме матрицы, строки которой соответствуют возможным действиям, а столбцы - возможным состояниям системы.
Пусть, например, из некоторого материала требуется изготовить изделие, долговечность которого при допустимых затратах невозможно определить. Нагрузки считаются известными. Требуется решить, какие размеры должно иметь изделие из данного материала.
Варианты решения таковы:[DK1]
Е1 - выбор размеров из соображений максимальной долговечности;
Еm- выбор размеров из соображений минимальной долговечности;
Ei - промежуточные решения.
Условия требующие рассмотрения таковы:
F1 - условия, обеспечивающие максимальной долговечность;
Fn - условия, обеспечивающие min долговечность;
Fi - промежуточные условия.
Под результатом решения eij = е(Ei; Fj) здесь можно понимать оценку, соответствующую варианту Ei и условиям Fj и характеризующие прибыль, полезность или надёжность. Обычно мы будем называть такой результат полезностью решения.
Тогда семейство (матрица) решений имеет вид:
F1
F2
...
Fn
E1
e11
e12
...
e1n
E2
e21
e22
...
e2n
...
................
Em
em1
em2
...
emn

Чтобы прийти к однозначному и по возможности наивыгоднейшему варианту решению необходимо ввести оценочную (целевую) функцию. При этом матрица решений сводится к одному столбцу. Каждому варианту Ei приписывается, т.о., некоторый результат eir, характеризующий, в целом, все последствия этого решения. Такой результат мы будем в дальнейшем обозначать тем же символом eir.

(1. Классические критерии принятия решений.
1о. Минимаксный критерий.
Правило выбора решения в соответствии с минимаксным критерием (ММ-критерием) можно интерпретировать следующим образом:
матрица решений дополняется ещё одним столбцом из наименьших результатов eir каждой строки. Необходимо выбрать те варианты в строках которых стоят наибольшее значение eir этого столбца.
Выбранные т.о. варианты полностью исключают риск. Это означает, что принимающий решение не может столкнуться с худшим результатом, чем тот, на который он ориентируется. Это свойство позволяет считать ММ-критерий одним из фундаментальных.
Применение ММ-критерия бывает оправдано, если ситуация, в которой принимается решение следующая:
1o. О возможности появления внешних состояний Fj ничего не известно;
2o. Приходится считаться с появлением различных внешних состояний Fj;
3o. Решение реализуется только один раз;
4o. Необходимо исключить какой бы то ни было риск.
2o. Критерий Байеса - Лапласа.
Обозначим через qi - вероятность появления внешнего состояния Fj.
Соответствующее правило выбора можно интерпретировать следующим образом:
матрица решений дополняется ещё одним столбцом содержащим математическое ожидание значений каждой из строк. Выбираются те варианты, в строках которых стоит наибольшее значение eir этого столбца.
При этом предполагается, что ситуация, в которой принимается решение, характеризуется следующими обстоятельствами:
1о. Вероятности появления состояния Fj известны и не зависят от времени.
2о. Решение реализуется (теоретически) бесконечно много раз.
3о. Для малого числа реализаций решения допускается некоторый риск.
При достаточно большом количестве реализаций среднее значение постепенно стабилизируется. Поэтому при полной (бесконечной) реализации какой-либо риск практически исключён.
Т.о. критерий Байеса-Лапласа (B-L-критерий) более оптимистичен, чем минимаксный критерий, однако он предполагает большую информированность и достаточно длительную реализацию.
3о. Критерий Сэвиджа.
Величину aij можно трактовать как максимальный дополнительный выигрыш, который достигается, если в состоянии Fj вместо варианта Ei выбирать другой, оптимальный для этого внешнего состояния вариант. Величину aij можно интерпретировать и как потери (штрафы) возникающие в состоянии Fj при замене оптимального для него варианта на вариант Ei. В последнем случае eir представляет собой максимально возможные (по всем внешним состояниям Fj, j =) потери в случае выбора варианта Ei.
Соответствующее критерию Сэвиджа правило выбора теперь трактуется так:
1). Каждый элемент матрицы решений вычитается из наибольшего результата max eij соответствующего столбца.
2). Разности aij образуют матрицу остатков. Эта матрица пополняется столбцом наибольших разностей eir. Выбирают те варианты, в строках которых стоит наименьшее для этого столбца значение.
Требования, предъявляемые к ситуации, в которой принимается решение, совпадают с требованием к ММ-критерию.
4о. Пример и выводы.
Из требований, предъявляемых к рассмотренным критериям становится ясно, что в следствии их жёстких исходных позиций они применимы только для идеализированных практических решений. В случае, когда возможна слишком сильная идеализация, можно применять одновременно поочерёдно различные критерии. После этого среди нескольких вариантов ЛПР волевым методом выбирает окончательное решение. Такой подход позволяет, во-первых, лучше проникнуть во все внутренние связи проблемы принятия решений и, во-вторых, ослабляет влияние субъективного фактора.
Критерий Сэвиджа
Пример специально подобран так, что каждый критерий предлагает новое решение. Неопределённость состояния, в котором проверка застаёт ЭВМ, превращается в неясность, какому критерию следовать.
Поскольку различные критерии связаны с различными условиями, в которых принимается решение, лучшее всего для сравнительной оценки рекомендации тех или иных критериев получить дополнительную информацию о самой ситуации. В частности, если принимаемое решение относится к сотням машин с одинаковыми параметрами, то рекомендуется применять критерий Байеса-Лапласа. Если же число машин не велико, лучше пользоваться критериями минимакса или Севиджа.

(2. Производные критерии.

1о. Критерий Гурвица.
Стараясь занять наиболее уравновешенную позицию, Гурвиц предположил оценочную функцию, которая находится где-то между точкой зрения крайнего оптимизма и крайнего пессимизма:
eir = (Ceij + (1- C) eij (,
где С- весовой множитель.
Правило выбора согласно критерию Гурвица, формируется следующим образом:
матрица решений дополняется столбцом, содержащим среднее взвешенное наименьшего и наибольшего результатов для каждой строки. Выбираются только те варианты, в строках которых стоят наибольшие элементы eir этого столбца.
При С=1 критерий Гурвица превращается в ММ-критерий. При С = 0 он превращается в критерий "азартного игрока"
eir = eij,
т.е. мы становимся на точку зрения азартного игрока, делающего ставку на то, что "выпадет" наивыгоднейший случай.
В технических приложениях сложно выбрать весовой множитель С, т.к. трудно найти количественную характеристику для тех долей оптимизма и пессимизма, которые присутствуют при принятии решения. Поэтому чаще всего С:= 1/2.
Критерий Гурвица применяется в случае, когда:
1) о вероятностях появления состояния Fj ничего не известно;
2) с появлением состояния Fj необходимо считаться;
3) реализуется только малое количество решений;
4) допускается некоторый риск.
2о. Критерий Ходжа-Лемана.
Этот критерий опирается одновременно на ММ-критерий и критерий Баеса-Лапласа. С помощью параметра (выражается степень доверия к используемому распределений вероятностей. Если доверие велико, то доминирует критерий Баеса-Лапласа, в противном случае - ММ-критерий, т.е. мы ищем
eir = ((+ (1-() eir(, 0 (((1.
Правило выбора, соответствующее критерию Ходжа-Лемана формируется следующим образом:
матрица решений дополняется столбцом, составленным из средних взвешенных (с весом ((const) математическое ожиданиями и наименьшего результата каждой строки (*). Отбираются те варианты решений в строках которого стоит набольшее значение этого столбца.
При (= 1 критерий Ходжа-Лемана переходит в критерий Байеса-Лапласа, а при (= 0 становится минимаксным.
Выбор (субъективен т. к. Степень достоверности какой-либо функции распределения - дело тёмное.
Для применения критерия Ходжа-Лемана желательно, чтобы ситуация в которой принимается решение, удовлетворяла свойствам:
1) вероятности появления состояния Fj неизвестны, но некоторые предположения о распределении вероятностей возможны;
2) принятое решение теоретически допускает бесконечно много реализаций;
3) при малых числах реализации допускается некоторый риск.
3о. Критерий Гермейера.

Этот критерий ориентирован на величину потерь, т.е. на отрицательные значения всех eij. При этом
eir = eij qj.
Т.к. в хозяйственных задачах преимущественно имеют дело с ценами и затратами, условие eij(0 обычно выполняется. В случае же, когда среди величин eij встречаются и положительные значения, можно перейти к строго отрицательным значениям с помощью преобразования eij - a при подходящем образом подобранном a (0. При этом оптимальный вариант решения зависит от а.
Правило выбора согласно критерию Гермейера формулируется следующим образом:
матрица решений дополняется ещё одним столбцом содержащим в каждой строке наименьшее произведение имеющегося в ней результата на вероятность соответствующего состояния Fj. Выбираются те варианты в строках которых находится наибольшее значение eij этого столбца.
В каком-то смысле критерий Гермейера обобщает ММ-критерий: в случае равномерного распределения qj =, j =, они становятся идентичными.
Условия его применимости таковы:
1) вероятности появления состояния Fj неизвестны;
2) с появлением тех или иных состояний, отдельно или в комплексе, необходимо считаться;
3) допускается некоторый риск;
4) решение может реализоваться один или несколько раз.
Если функция распределения известна не очень надёжно, а числа реализации малы, то, следуя критерию Гермейера, получают, вообще говоря, неоправданно большой риск.


4о. BL (MM) - критерий.

Стремление получить критерии, которые бы лучше приспосабливались к имеющейся ситуации, чем все до сих пор рассмотренные, привело к построению так называемых составных критериев. В качестве примера рассмотрим критерий, полученный путем объединения критериев Байеса-Лапласа и минимакса.
Правило выбора для этого критерия формулируется следующим образом:
матрица решений дополняется еще тремя столбцами. В первом из них записываются математические ожидания каждой из строк, во втором - разность между опорным значением

и наименьшим значением

соответствующей строки. В третьем столбце помещаются разности между наибольшим значением

каждой строки и наибольшим значением той строки, в которой находится значение. Выбираются те варианты, строки которых (при соблюдении приводимых ниже соотношений между элементами второго и третьего столбцов) дают наибольшее математическое ожидание. А именно, соответствующее значение

из второго столбца должно быть или равно некоторому заранее заданному уровню риска. Значение же из третьего столбца должно быть больше значения из второго столбца.
Применение этого критерия обусловлено следующими признаками ситуации, в которой принимается решение:
1) вероятности появления состояний Fj неизвестны, однако имеется некоторая априорная информация в пользу какого-либо определенного распределения;
2) необходимо считаться с появлением различных состояний как по отдельности, так и в комплексе;
3) допускается ограниченный риск;
4) принятое решение реализуется один раз или многократно.
BL(MM)-критерий хорошо приспособлен для построения практических решений прежде всего в области техники и может считаться достаточно надежным. Однако заданные границы риска и, соответственно, оценок риска не учитывает ни число применения решения, ни иную подобную информацию. Влияние субъективного фактора хотя и ослаблено, но не исключено полностью.
Условие

существенно в тех случаях, когда решение реализуется только один или малое число раз. В этих условиях недостаточно ориентироваться на риск, связанный только с невыгодными внешними состояниями и средними значениями. Из-за этого, правда, можно понести некоторые потери в удачных внешних состояниях. При большом числе реализаций это условие перестает быть таким уж важным. Оно даже допускает разумные альтернативы. При этом не известно, однако, четких количественных указаний, в каких случаях это условие следовало бы опускать.


5о. Критерий произведений.

eir: = eij
Правило выбора в этом случае формулируется так:
Матрица решений дополняется новым столбцом, содержащим произведения всех результатов каждой строки. Выбираются те варианты, в строках которых находятся наибольшие значения этого столбца.

Применение этого критерия обусловлено следующими обстоятельствами:
1) вероятности появления состояния Fj неизвестны;
2) с появлением каждого из состояний Fj по отдельности необходимо считаться;
3) критерий применим и при малом числе реализаций решения;
4) некоторый риск допускается.
Критерий произведений приспособлен в первую очередь для случаев, когда все eij положительны. Если условие положительности нарушается, то следует выполнять некоторый сдвиг eij + а с некоторой константой а ((eij(. Результат при этом будет, естественно зависеть от а. На практике чаще всего
а:= (eij(+1.
Если же никакая константа не может быть признана имеющей смысл, то критерий произведений не применим.

Критерий Ходжа-Лемана рекомендует вариант Е1 (полная проверка) - так же как и ММ-критерий. Смена рекомендуемого варианта происходит только при (= 0.94. Поэтому равномерное распределение состояний рассматриваемой машины должно распознаваться с очень высокой вероятностью, чтобы его можно было выбрать по большему математическому ожиданию. При этом число реализаций решения всегда остаётся произвольным.
Критерий Гермейера при qj = 0.33 даёт следующий результат (в):

В качестве оптимального выбирается вариант Е1. Сравнение вариантов с помощью величин eir показывает, что способ действия критерия Гермейера является даже более гибким, чем у ММ-критерия.
В таблице, приведенной ниже, решение выбирается в соответствии с BL(MM)-критерием при q1=q2=q3=1/2 (данные в 103).

Вариант Е3 (отказ от проверки) принимается этим критерием только тогда, когда риск приближается к. В противном случае оптимальным оказывается Е1. Во многих технических и хозяйственных задачах допустимый риск бывает намного ниже, составляя обычно только незначительный процент от общих затрат. В подобных случаях бывает особенно ценно, если неточное значение распределения вероятностей сказывается не очень сильно. Если при этом оказывается невозможным установить допустимый риск заранее, не зависимо от принимаемого решения, то помочь может вычисление ожидаемого риска. Тогда становится возможным подумать, оправдан ли подобный риск. Такое исследование обычно дается легче.
Результаты применения критерия произведения при а = 41(103 и а = 200(103 имеют вид:


Условие eij (0 для данной матрицы не выполнимо. Поэтому к элементам матрицы добавляется (по внешнему произволу) сначала а = 41(103, а затем а = 200(103.
Для а = 41(103 оптимальным оказывается вариант Е1, а для а = 200(103 - вариант Е3, так что зависимость оптимального варианта от а очевидна.
Глава 4. КООПЕРАТИВНЫЕ ИГРЫ
Кооперативные игры получаются в тех случаях, когда, в игре n игроков разрешается образовывать определённые коалиции. Обозначим через N множество всех игроков, N ={1, 2,..., n}, а через K - любое его подмножество. Пусть игроки из K договариваются между собой о совместных действиях и, таким образом, образуют одну коалицию. Очевидно, что число таких коалиций, состоящих из r игроков, равно числу сочетаний из n по r, то есть, а число всевозможных коалиций равно
= 2n - 1.
Из этой формулы видно, что число всевозможных коалиций значительно растёт в зависимости от числа всех игроков в данной игре. Для исследования этих игр необходимо учитывать все возможные коалиции, и поэтому трудности исследований возрастают с ростом n. Образовав коалицию, множество игроков K действует как один игрок против остальных игроков, и выигрыш этой коалиции зависит от применяемых стратегий каждым из n игроков.
Функция (, ставящая в соответствие каждой коалиции K наибольший, уверенно получаемый его выигрыш ((K), называется характеристической функцией игры. Так, например, для бескоалиционной игры n игроков ((K) может получиться, когда игроки из множества K оптимально действуют как один игрок против остальных N\K игроков, образующих другую коалицию (второй игрок).
Характеристическая функция (называется простой, если она принимает только два значения: 0 и 1. Если характеристическая функция (простая, то коалиции K, для которых ((K)=1, называются выигрывающими, а коалиции K, для которых ((K) = 0, - проигрывающими.
Если в простой характеристической функции (выигрывающими являются те и только те коалиции, которые содержат фиксированную непустую коалицию R, то характеристическая функция (, обозначаемая в этом случае через (R, называется простейшей.
Содержательно простые характеристические функции возникают, например, в условиях голосования, когда коалиция является выигрывающей, если она собирает более половины голосов (простое большинство) или не менее двух третей голосов (квалифицированное большинство).
Более сложным является пример оценки результатов голосования в Совете безопасности ООН, где выигрывающими коалициями являются все коалиции, состоящие из всех пяти постоянных членов Совета плюс ещё хотя бы один непостоянный член, и только они.
Простейшая характеристическая функция появляется, когда в голосующем коллективе имеется некоторое "ядро", голосующее с соблюдением правила "вето", а голоса остальных участников оказываются несущественными.
Обозначим через (G характеристическую функцию бескоалиционной игры. Эта функция обладает следующими свойствами:
1) персональность
(G(() = 0,
т.е. коалиция, не содержащая ни одного игрока, ничего не выигрывает;
2) супераддитивность
(G(K(L) ((G(K) + (G(L), если K, L (N, K(L ((,
т.е. общий выигрыш коалиции не меньше суммарного выигрыша всех участников коалиции;
3) дополнительность
(G(K) + ((N\K) = ((N)
т.е. для бескоалиционной игры с постоянной суммой сумма выигрышей коалиции и остальных игроков должна равняться общей сумме выигрышей всех игроков.

Распределение выигрышей (делёж) игроков должно удовлетворять следующим естественным условиям: если обозначить через xi выигрыш i-го игрока, то, во-первых, должно удовлетворяться условие индивидуальной рациональности
xi (((i), для i (N
т.е. любой игрок должен получить выигрыш в коалиции не меньше, чем он получил бы, не участвуя в ней (в противном случае он не будет участвовать в коалиции); во-вторых, должно удовлетворяться условие коллективной рациональности
= ((N)
т.е. сумма выигрышей игроков должна соответствовать возможностям (если сумма выигрышей всех игроков меньше, чем ((N), то игрокам незачем вступать в коалицию; если же потребовать, чтобы сумма выигрышей была больше, чем ((N), то это значит, что игроки должны делить между собой сумму большую, чем у них есть).
Таким образом, вектор x = (x1,..., xn), удовлетворяющий условиям индивидуальной и коллективной рациональности, называется дележём в условиях характеристической функции (.
Система {N, (}, состоящая из множества игроков, характеристической функции над этим множеством и множеством дележей, удовлетворяющих соотношениям (2) и (3) в условиях характеристической функции, называется классической кооперативной игрой.
Из этих определений непосредственно вытекает следующая
Теорема. Чтобы вектор x = (x1,..., xn) был дележём в классической кооперативной игре {N, (},
необходимо и достаточно, чтобы
xi = ((i) + (i, (i(N)
причём
(i (0 (i(N)
= ((N) -
В бескоалиционных играх исход формируется в результате действий тех самых игроков, которые в этой ситуации получают свои выигрыши. Исходом в кооперативной игре является делёж, возникающий не как следствие действия игроков, а как результат их соглашений. Поэтому в кооперативных играх сравниваются не ситуации, как это имеет место в бескоалиционных играх, а дележи, и сравнение это носит более сложный характер.
Кооперативные игры считаются существенными, если для любых коалиций K и L выполняется неравенство
((K) + ((L) < ((K(L),
т.е. в условии супераддитивности выполняется строгое неравенство. Если же в условии супераддитивности выполняется равенство
((K) + ((L) = ((K(L),
т.е. выполняется свойство аддитивности, то такие игры называются несущественными.
Справедливы следующие свойства:
1) для того чтобы характеристическая функция была аддитивной (кооперативная игра - несущественной), необходимо и достаточно выполнение следующего равенства:
= ((N)
2) в несущественной игре имеется только один делёж
{((1), ((2),..., ((n) };
3) в существенной игре с более чем одним игроком множество дележей бесконечно
(((1) + (1, ((2) + (2,..., ((n) +(n)
где
(i (0 (i (N), ((N) -(0
Кооперативная игра с множеством игроков N и характеристической функцией (называется стратегически эквивалентной игрой с тем же множеством игроков и характеристической функцией (1, если найдутся такие к (0 и произвольные вещественные Ci (i(N), что для любой коалиции К (N имеет место равенство:
(1(K) = k ((K) +
Смысл определения стратегической эквивалентности кооперативных игр (с.э.к.и.) состоит в том что характеристические функции с.э.к.и. отличаются только масштабом измерения выигрышей k и начальным капиталом Ci. Стратегическая эквивалентность кооперативных игр с характеристическими функциями (и (1 обозначается так (((1. Часто вместо стратегической эквивалентности кооперативных игр говорят о стратегической эквивалентности их характеристических функций.
Справедливы следующие свойства для стратегических эквивалентных игр:
1. Рефлексивность, т.е. каждая характеристическая функция эквивалентна себе (((.
2. Симметрия, т.е. если (((1, то (1((.
3. Транзитивность, т.е. если (((1 и (1((2, то (((2.
Из свойств рефлексивности, симметрии и транзитивности вытекает, что множество всех характеристических функций единственным образом распадается на попарно непересекающиеся классы, которые называются классами стратегической эквивалентности.
Отношение стратегической эквивалентности игр и их характеристических функций переносится на отдельные дележи:
пусть (((1, т.е. выполняется (5), и x = (x1,..., xn) - дележи в условиях характерис- тической функции (; рассмотрим вектор x1 = (,...,), где = k xi+Ci; для него выполняется
= k xi + Ci (k ((i) + Сi = (1(i);
т.е. выполняется условие индивидуальной рациональности, и
== k+= k ((N) += (1(N)
т.е. выполняется условие коллективной рациональности. Поэтому вектор является дележом в условиях (1. Говорят, что делёж x1 соответствует дележу x при стратегической эквивалентности (((1.
Кооперативная игра называется нулевой, если все значения её характеристической функции равны нулю. Содержательное значение нулевой игры состоит в том, что в ней игроки не имеют никакой заинтересованности.
Всякая несущественная игра стратегически эквивалентна нулевой.
Определение. Кооперативная игра с характеристической функцией (имеет (0,1)-редуцированную форму, если выполняются соотношения:
((i) = 0 (i (N),
((N) = 1.
Теорема. Каждая существенная кооперативная игра стратегически эквивалентна одной и только одной игре в (0,1)-редуцированной форме.
Сформулированная теорема показывает, что мы можем выбрать игру в (0,1)-редуцированной форме для представления любого класса эквивалентности игр. Удобство этого выбора состоит в том, что в такой форме значение ((K) непосредственно демонстрирует нам силу коалиции S (т.е. ту дополнительную прибыль, которую получают члены коалиции, образовав её), а все дележи являются вероятностными векторами.
В игре в (0,1)-редуцированной форме дележём является любой вектор x = (x1,..., xn), для которого
xi (0 (i (N) = 1.

Задачей теории игр является выработка рекомендаций для игроков, т.е. определение для них оптимальной стратегии. Стратегией игрока называется система правил, однозначно определяющих поведение игрока на каждом ходе в зависимости от ситуации, сложившейся в процессе игры. Оптимальной называется стратегия, которая при многократном повторении игры обеспечивает данному игроку максимально возможный средний выигрыш.

Биматричные игры являются общим случаем стратегических игр двух игроков с дискретным набором (конечных или бесконечных) стратегий каждого игрока, действия одного (первого) из которых направлены на максимизацию своей прибыли, а другого (второго) – на минимизацию своих потерь. Интересы игроков не обязательно противоположны, т.е. биматричная игра – это игра с ненулевой суммой и описывается в соответствии со своим названием двумя платежными матрицами

,

одинаковой размерности , где aij – прибыль (при aij > 0), а bij – потери соответственно игроков А и В в ситуации (i, j), . Биматричная игра, заданная матрицами А и В, сводится к двум задачам линейного программирования.

Пусть биматричная игра описывается платежными матрицами [2]

Педагогический эксперимент показал, что авторская система проведения лабораторных занятий с решением ситуационных задач из теории игр способствует формированию у студентов-экономистов навыков поведения лица, принимающего решения в условиях экономического соперничества [3].





Дата публикования: 2015-02-18; Прочитано: 581 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.01 с)...