Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Управление в условиях неопределенности



При управлении производством принимать решения очень часто приходится не имея достаточной информации, то есть в условиях неопределенности и риска.

Методами обоснования решений в условиях неопределенности и риска занимается математическая теория игр.

В теории игр рассматриваются такие ситуации, когда имеются два участника выполнения операции, каждый из которых преследует противоположные цели. В качестве участников могут выступать коллективы, конкурирующие предприятия и т.д. Во всех случаях предполагается, что операция проводится против разумного противника (конкурента), преследующего свои собственные цели и сознательно противодействующего достижению цели другим участником.

Так как цели противоположны, а результат мероприятия каждой из сторон зависит от действий конкурента, то эти действия называют конфликтными ситуациями. В конфликтной ситуации сталкиваются противоположные интересы двух участникам. Формализованная (схематизированная) модель конфликтной ситуации называется игрой. Результат игры – победа или поражение, которые не всегда имеют количественное выражение, можно выразить (условно) числами (например, в шахматах: 1, 0, 1/2).

Игра называется игрой с нулевой суммой, если один из игроков выигрывает ровно столько, сколько проигрывает другой.

Развитие игры во времени представляется как ряд последовательных «ходов». Ходы могут быть сознательные и случайные. Случайный ход – результат, получаемый не решением игрока, а каким–либо механизмом случайного выбора (покупательский спрос, задержка с поставкой материалов и т.п.). Сознательный ход – выбор игроком одного из возможных вариантов действия (стратегии) и принятие решения об его осуществлении.

Возможные варианты (исходы) игры сводятся в прямоугольную таблицу (табл. 10.1) – платежную матрицу, в которой строки соответствуют различным стратегиям игрока А, столбцы – стратегиям игрока В, qij называется ценой игры.

Цель теории игр – выработка рекомендаций для различного поведения игроков в конфликтной ситуации, то есть выбор оптимальной стратегии для каждого из них.

Для нахождения оптимальной стратегии необходимо проанализировать все возможные стратегии и рассчитывать на то, что разумный противник каждую из них будет отвечать такой, при которой выигрыш игрока А минимален. Обычно минимальные числа в каждой строке обозначаются a i и выписываются в виде добавочного столбца матрицы (табл. 10.2).

Таблица 9.1

  B 1 B 2 ... Bn
A 1 q 11 q 12 ... q 1 n
A 2 q 21 q 22 ... q 2 n
... ... ... ... ...
Am qm 1 qm 2 ... qmn

Таблица 9.2

  B 1 B 2 ... Bn a i
A 1 q 11 q 12 ... q 1 n a1
A 2 q 21 q 22 ... q 2 n a2
... ... ... ... ... ...
Am qm 1 qm 2 ... qmn a i
b i b1 b2 ... b n  

В каждой строке будет свое

Предпочтительной для игрока А является стратегия, при которой a i обращается в максимум, то есть

или ,

где a – максиминный выигрыш (максимин), а соответствующая ей стратегия – максиминная.

Если придерживаться максиминной стратегии, то при любом поведении стороны В (конкурента) гарантирован выигрыш, во всяком случае не меньше a. Поэтому a называют также ценой игры – тот гарантированный минимум, который можно обеспечить при наиболее осторожной (перестраховочной) стратегии.

Очевидно, что аналогичные распределения можно провести и для конкурента В, который должен рассмотреть все свои стратегии, выделяя для каждой из них максимальные значения выигрыша:

(последняя строка матрицы).

Из всех значений b j находят минимальное:

,

которое дает минимаксный выигрыш или минимакс.

Такая b–стратегия – минимаксная, придерживаясь которой сторона В гарантирована, что в любом случае проиграет не больше b. Поэтому b называют верхней ценой игры.

Если a = b = С, то число С называют чистой ценой игры или седловой точкой.

Для игры с седловой точкой нахождение решения состоит в выборе пары максиминной и минимаксной стратегий, которые являются оптимальными, так как любое отклонение от этих стратегий приводит к уменьшению выигрыша первого игрока и увеличению проигрыша второго игрока по сравнению с ценой игры С.

Пример 9.1

Конструктор получил задание разработать определенное новое изделие. В результате исследований он определил три возможных варианта изделия V 1, V 2, V 3, каждый из которых может быть реализован каким–либо из трех техпроцессов Т1, Т2, Т3.

Если первый вариант конструкции V 1 реализуется по первой технологии Т1, то внешний вид изделия оказывается наилучшим и оценивается экспертами в 9 баллов, а при реализации по второй технологии – в 6 баллов, по третьей – в 5 баллов и т.д. (табл. 10.3).

Таблица 9.3

Матрица игры для конструктивного и технологического вариантов

Конструкция Технология
Т1 Т2 Т3
V 1 V 2 V 3       5 (Т3) 72 или Т3) 5 (Т2)
     

Решение.

Конфликтная ситуация возникает из–за того, что затраты на реализацию каждого конструкторско-технологического решения (варианта) не одинаковы. Для простоты полагаем, что затраты пропорциональны внешнему виду (чем выше балл, тем больше затраты).

Конструктор должен представить только один вариант, конечно самый красивый. Но он понимает, что тогда найдутся сторонники самого дешевого варианта («экономисты»). Поэтому его задача выбрать оптимальный вариант по внешнему виду и стоимости.

Если конструктор выберет V 1, то экономисты будут настаивать на технологии Т3. На вариант V 2 будет ответ Т2 или Т3 и т.д.

Очевидно, что с точки зрения конструктора преимущество имеет вариант V 2, а так как даже при неблагоприятных обстоятельствах получится изделие, оцениваемое в 7 баллов (выигрыш 7), а может быть даже 8, если удается уговорить экономистов на вариант Т1.

С точки зрения экономистов в смысле снижения затрат: при выборе технологии Т1 в варианте V 1 затраты наибольшие – 9 баллов, при Т2 в V 2 (7), при Т3 в V 3 (8). То есть для экономистов оптимальным является техпроцесс Т2, так как он требует меньших затрат при различных вариантах конструкции. Следовательно, стратегия Т2 V 2 с выигрышем 7 – наиболее выгодная сразу для обеих сторон – максимальный выигрыш V совпадает с минимальным проигрышем Т.

Однако не все матрицы имеют седловую точку. Тогда решение находят, применяя смешанные стратегии, то есть чередуя случайным образом несколько чистых стратегий (гибкая тактика).

Вектор, каждая из компонент которого показывает относительную частоту использования игроком соответствующей чистой стратегии, называют смешанной стратегией данного игрока.

Из этого определения следует, что сумма компонент этого вектора равна единице, а сами компоненты не отрицательны.

Обычно смешанную стратегию первого игрока обозначают как вектор U = (u 1, u 2,..., um), а второго игрока – как вектор Z = (z 1, z 2,..., zm), где ui ³ 0 (i = 1.. m), zj ³ 0 (j = 1.. n),

Если u 0 – оптимальная стратегия первого игрока, z 0 – оптимальная стратегия второго игрока, то число – называют ценой игры.

Для того чтобы число u – было ценой игры, а u 0 и z 0 – оптимальными стратегиями, необходимо и достаточно выполнение неравенств:

Если один из игроков применяет оптимальную смешанную стратегию, то его выигрыш равен цене игры u вне зависимости от того, с какими частотами будет применять второй игрок стратегии, вошедшие в оптимальную, в том числе и чистые стратегии.

Пример 9.2

Найти решение игры, заданной матрицей .

Решение.

Прежде всего, проверяется наличие седловой точки. Для этого определяются минимальные элементы в каждой из строк (2 и 4) и максимальные элементы в каждом из столбцов (6 и 5).

Значит, нижняя цена игры

= max (2; 4) = 4,

верхняя цена игры

= min (6; 5) = 5.

Так как a = 4 ¹ b = 5, то решение игры – смешанные оптимальные стратегии, а цена игры u в пределах 4 £ u £ 5.

Пусть для игрока А стратегия задается вектором U = (u 1, u 2). Тогда при применении игроком В чистой стратегии В1 или В2 игрок А получит средний выигрыш, равный цене игры, то есть

Из решения трех уравнений с тремя неизвестными оптимальная стратегия игрока А: u 10 = 2/5; u 20 = 3/5; u = 22/5.

Пусть для игрока В стратегия задается вектором Z = (z 1, z 2). Тогда

Отсюда оптимальная стратегия игрока В: z 10 = 1/5; z 20 = 4/5.

Следовательно, решением игры будут смешанные стратегии

u 0 = (2/5; 3/5), z 0 = (1/5; 4/5) с ценой игры u = 22/5.

9.2. Оценка риска в «играх с природой»

В случае, когда между сторонами (участниками) отсутствует «антагонизм» (например, в процессе работы предприятий и торговых посредников), такие ситуации называют «играми с природой».

Здесь первая сторона принимает решение, а вторая сторона – «природа» не оказывает первой стороне сознательного, агрессивного противодействия, но ее реальное поведение неизвестно.

Пусть торговое предприятие имеет m стратегий: Т1, Т2,..., T m и имеется n возможных состояний природы: П1, П2,..., П n. Так как природа не является заинтересованной стороной, исход любого сочетания поведения сторон можно оценить выигрышем bij первой стороны для каждой пары стратегий Т i и П j. Все показатели игры заданы платежной матрицей { bij } mxn..

По платежной матрице можно принять ряд решений. Например, оценить возможные исходы: минимальный выигрыш

,

то есть наименьшая из величин в каждой i -й строке как пессимистическая оценка; максимальный выигрыш – то наилучшее, что дает выбор i -го варианта

.

При анализе «игры с природой» вводится показатель, по которому оценивают, насколько то или иное состояние «природы» влияет на исход ситуации. Этот показатель называют риском.

Риск rij при пользовании стратегией Т i и состоянии «природы» П j оценивается разностью между максимально возможным выигрышем при данном состоянии «природы» В imax и выигрышем В ij при выбранной стратегии Т i:

rij = В imax – В ij.

Исходя из этого определения можно оценить максимальный риск каждого решения:

Решения могут приниматься по результатам анализа ряда критериев.

Критерий, основанный на известных вероятностных состояниях «природы».

Если известны вероятности состояний «природы» (например, спроса по данным анализа за прошлые годы):

Р1 = Р(П1); Р2 = Р(П2);...; Р n = Р(П n),

полагая, что Р1 + Р2 +... + Р j +... + Р n = 1.

Тогда в качестве показателя эффективности (рациональности, обоснованности) стратегии Т i берется среднее (математическое ожидание) – выигрыш применения этой стратегии:

а оптимальной считают стратегию, для которой этот показатель эффективности имеет максимальное значение, то есть

Если каждому решению Т i соответствует множество возможных результатов В ij с вероятностями Р ij, то среднее значение выигрыша определится

а оптимальная стратегия выбирается по условию

В этом случае можно воспользоваться и стратегией минимального среднего риска для каждого i -го состояния «природы»

Максиминный критерий Вальда.

Здесь выбирается решение торговой организации, при котором гарантируется максимальный выигрыш в наихудших условиях внешней среды (состояния «природы»):

Критерий пессимизма–оптимизма Гурвица.

Здесь представляется логичным, чтобы при выборе решения вместо двух крайностей в оценке ситуации (оптимум–пессимизм) придерживаться некоторого компромисса, учитывающего возможность как наихудшего, так и наилучшего поведения «природы». В соответствии с этим компромиссным критерием для каждого решения будет линейная комбинация минимального и максимального выигрышей и выбирается тот, для которого эта величина окажется наибольшей:

где x – показатель пессимизма–оптимизма (чаще всего 0.5).

Критерий минимаксного риска Сэвиджа.

Здесь выбирают ту стратегию, при которой величина риска имеет минимальное значение в самой неблагоприятной ситуации:

чтобы избежать слишком большого риска при выборе решения.

Комплексный анализ всех этих критериев позволяет в какой–то мере ценить возможные последствия принимаемых решений.

Пример 9.3

Известна матрица условных вероятностей Pij продажи старых товаров С1, C 2, C 3 при наличии новых товаров Н1, Н2, H 3 (табл. 10.4).

Таблица 9.4

Платежная матрица

Старые товары Новые товары
Н1 Н2 Н3
С1 C 2 C 3 9 0.6 8 0.2 5 0.1 6 0.3 3 0.7 5 0.4 4 0.6 7 0.2 8 0.5

Определить наиболее выигрышную политику продаж.

Решение.

Минимальный выигрыш

Минимальный выигрыш при продаже старого товара

С1:

С2:

С3:

где В12, В22, В31 образуют систему пессимистических оценок выигрыша от продаж старых товаров.

Максимальный выигрыш при продаже старых товаров:

С1:

С2:

С3: ,

где В11, В21, В33 образуют систему оптимистических оценок выигрыша от продаж старых товаров.

При анализе «игры с природой» вводится показатель влияния какого-либо состояния «природы» на исход продаж, то есть показатель риска:

rij = В imax –В ij,

каждый из которых составит матрицу рисков (табл. 10.5).

Таблица 9.5.

Матрица рисков

Товары Н1 Н2 Н3
С1 C 2 C 3      

Максимальное значение риска для каждого решения:

то есть при продаже товаров:

С1:

С2:

С3:

Решения о плане продаж принимается исходя из анализа системы критериев.

Критерий по известным вероятностным состояниям «природы» Р ij: оптимальной считают стратегию, для которой этот показатель наибольший, то есть

– математическое ожидание выигрыша при i -й стратегии:

где В ij – результат (выигрыш при применении ij -й стратегии):

= 9. 0,6 + 6. 0,3 + 4. 0,1 = 7,6;

= 8. 0,2 + 3. 0,7 + 7. 0,1 = 4,4;

= 5. 0,1 + 5. 0,4 + 8. 0,5 = 6,5.

Тогда

то есть оптимальной стратегией по этому критерию будет продажа изделия С1.

Максиминный критерий Вальда:

то есть при продаже изделия С1 гарантируется выигрыш даже в наихудших условиях.

Критерий пессимизма–оптимизма Гурвица:

где x – доля оптимизма–пессимизма (0,5).

[0,5{6,3,5} + 0,5{9,8,8}] = max {(3 + 4,5); (1,5 + 4); (2,5 + 4)} =

= max {7,5; 5,5; 6,5} = 7,5,

то есть исходя из уравновешенной точки зрения принимается решение о продажах С1.

Критерий минимаксного риска Сэвиджа, по которому принимают решение минимальным значением риска в самой неблагоприятной ситуации:

где rimax вычислена по матрице рисков.

что соответствует целесообразности в смысле этого критерия продажам изделия С3.

Комплексный анализ всех критериев позволяет предположить, что наилучшей стратегией продаж будет продажа изделий Н1, Н2, Н3, С1, С3. Изделие С2 должно быть снято с продаж.





Дата публикования: 2015-01-10; Прочитано: 334 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.025 с)...