Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Критерии выбора наилучших стратегий в условиях неопределенности



1. Критерий Вальда. Этот критерий основан на принципе крайнего пессимизма. Принимающий решение считает, что какую бы стратегию он ни выбрал, природа реализует свое наихудшее состояние. В наихудших условиях принимающий решение находит наилучший выход.

j
Таким образом, принимающий решение для каждой стратегии Аi находит наименьший выигрыш аi=min аij, Затем среди наименьших выигрышей он находит наибольший:

(6.4.1)

Стратегия , соответствующая будет наилучшей по Вальду. Ее часто называют максиминной стратегией.

2. Критерий Сэвиджа. Этот критерий основан на принципе минимизации максимального риска. Риском rij, , , принимающего решение называют разницу между тем выигрышем, который он бы получил, если бы знал, какое состояние реализует природа и его реальным выигрышем, то есть, rijij, где .

Матрица рисков R имеет вид:

П1 П2 … Пn

       
   
 


А2 r21 r22 … r2n
R=


Принимающий решение для каждой стратегии Аi находит максимальный риск ri, ri= . Затем из максимальных рисков выбирает минимальный:

(6.4.2)

Стратегия Аi0, соответствующая минимальному из максимальных рисков ri0, будет наилучшей по Сэвиджу.

3. Критерий Гурвица. Критерий Гурвица является критерием пессимизма-оптимизма. Наилучшей по Гурвицу является стратегия Аi0, соответствующая числу аi0, которое рассчитывается по формуле:

(6.4.3)

Значение параметра γ задает принимающий решение на основании своего опыта и характера. Если γ=1, то критерий Гурвица преобразуется в критерий крайнего пессимизма:

.

Если γ=0, то получаем критерий крайнего оптимизма:

.

Обычно, на практике, выбирают 0<γ<1.

Пример 6.4.1. Небольшое частное предприятие выпекает диетические хлебобулочные изделия. Оборудование позволяет выпекать 500, 600 или 700 кг изделий в день. Спрос на эти изделия так же может составлять 500, 600 или 700 кг в день. Если хлебобулочные изделия не продаются в этот день, то они возвращаются на предприятие для переработки. Затраты на производство 1 кг изделий составляют 2 тысячи рублей, а цена реализации – 3,5 тысячи рублей. Дополнительные затраты в случае возврата составляют 1 тысяча рублей на 1 кг изделий. Необходимо определить ежедневный объем выпечки диетических хлебобулочных изделий.

Решение. В этой ситуации можно выделить две стороны: менеджера предприятия, которому необходимо принять решение об объеме производства, действующего сознательно, и спрос на хлебобулочные изделия, который не является сознательно действующим противником. Ситуацию можно назвать конфликтной, так как результаты действий одной стороны зависят от действий другой стороны, не всегда благоприятных для первой.

В нашем примере один игрок – менеджер предприятия. Его возможные действия (стратегии): запланировать выпечку хлебобулочных изделий в объеме либо 500 кг, либо 600 кг, либо 700 кг. Второй игрок – спрос на хлебобулочные изделия (природа). Его возможные действия: установить спрос на хлебобулочные изделия в объеме либо 500 кг, либо 600 кг, либо 700 кг.

Рассчитаем платежную матрицу. Платежная матрица будет иметь размерность 3х3, так как игрок, принимающий решение, имеет три стратегии (А1 – объем выпечки 500 кг, А2 – объем выпечки 600 кг, А3 – объем выпечки 700 кг), и второй игрок, природа, имеет три стратегии (П1 – спрос составит 500 кг, П2 – спрос составит 600 кг, П3 – спрос составит 700 кг). Элементу платежной матрицы а11 соответствуют стратегии А1 и П1, это значит, что предприятие выпечет 500 кг хлебобулочных изделий, и спрос на них определится в объеме 500 кг, т.е. все изделия будут реализованы в тот же день. Тогда прибыль предприятия составит (3,5 - 2) тыс. руб. х 500 = 750 тыс. руб., т.е. а11 = 750 тыс. руб. Рассчитаем теперь элемент платежной матрицы а12. Ему соответствуют стратегии А1, П2, т.е. предприятие выпечет 500 кг хлебобулочных изделий, а спрос на них определится в объеме 600 кг. Таким образом, все изделия проданы, и прибыль предприятия составит

(3,5 - 2) х 500=750 тыс. руб., т.е. а12=750 тыс. руб. Аналогично а13=750ден.ед. Рассчитаем элемент платежной матрицы а21. Предприятие выпечет 600 кг хлебобулочных изделий, а спрос на них определится в объеме 500 кг, 100 кг хлебобулочных изделий будет возвращено на переработку. Тогда прибыль предприятия рассчитывается следующим образом: (3,5-2)х500+(-2-1)х100=750-300=450 тыс. руб., т.е. а21=450 тыс. руб. Точно так же рассчитываются все остальные элементы платежной матрицы. В результате платежная матрица в примере 6.4.1 будет иметь вид:


А2 450 900 900
А=
.

А3 150 600 1050


Так как в примере 6.4.1 отсутствует информация о вероятностях, с которыми реализуются стратегии природы, то имеем ситуацию неопределенности. Для выбора наилучших стратегий воспользуемся приведенными выше критериями.

1. Критерий Вальда. Для каждой из стратегий выберем наименьший выигрыш. Для стратегии А1 все состояния природы равнозначны, поэтому условно будем считать, что наименьшим выигрышем принимающего решение будет прибыль 750 тыс. руб., т.е., а1=750 тыс. руб. Для стратегии А2 наихудшим будет состояние природы П1, а наименьшим выигрышем а2= 450 тыс. руб. Для стратегии А3 наименьшим выигрышем будет а3=150 тыс.руб. Запишем наименьшие выигрыши принимающего решение в дополнительный столбец платежной матрицы:


.

Далее из наименьших выигрышей принимающий решение выбирает наибольший, т.е. а1=750= Наибольший из наименьших выигрышей соответствует стратегии А1. Это будет наилучшая стратегия по критерию Вальда. Таким образом, если руководствоваться принципом крайнего пессимизма (критерием Вальда), то следует выпекать 500 кг хлебобулочных изделий диетических сортов в сутки. При этом прибыль предприятия будет не меньше 750 тыс. руб. при любом спросе.

2. Критерий Сэвиджа.

Рассчитаем риск для каждой пары стратегий природы и принимающего решение. Если бы менеджер предприятия точно знал, что природа реализует свое состояние П1, т.е. спрос составит 500 кг, то он бы выбрал стратегию А1; при этом предприятие получило бы прибыль 750 тыс. руб. – наибольшую для состояния природы П1, β1=750. Для состояния природы П2 наибольшая прибыль равна β2=900, а для состояния природы П3- β3=1050. По определению, для стратегии А1 и состояния природы П1 риск, r11, составит β111=750-750=0, для стратегии А2 и состояния природы П1 риск r21 составит r21= β121=750-450=300, и так далее.

Получаем матрицу рисков:

           
 
R=
   


А2 300 0 150
А2 r21 r22 r23
.

       
 
А3 r31 r32 r33
 
А3 600 300 0


Далее принимающий решение для каждой стратегии выбирает максимальный риск. Для стратегии А1 максимальным будет риск, равный 300, т.е. r1=300. Аналогично r2=300; r3=600. В матрицу рисков добавляем столбец, содержащий максимальный риск для каждой стратегии:

       
 
R=
 


А2 300 0 150 300
.


Из максимальных рисков принимающий решение выбирает минимальный: r1 = r2 = То есть минимальному из максимальных рисков соответствует и первая и вторая стратегия. Наилучшими по критерию Сэвиджа стратегиями будут А1 и А2.

3. Критерий Гурвица.

Пусть в примере 6.4.1 принимающий решение в равной мере оптимист и пессимист, и он использует критерий Гурвица, в котором γ=1/5.

Для каждой стратегии Аi рассчитаем число аi; :

а1=1/5*750+4/5*750=750,

а2=1/5*450+4/5*900=810,

а3=1/5*150+4/5*1050=870.

.

Числу а3=870 соответствует стратегия А3, т.е. при таком выборе параметра γ наилучшим по Гурвицу вариантом является выпечка 700 кг хлебобулочных изделий.

Таким образом, в примере 6.4.1 лучшей по всем критериям будет первая стратегия. Однако, в некоторых задачах разные критерии могут рекомендовать различные стратегии. Это объясняется неопределенностью ситуации, и тогда можно провести дополнительные исследования. И хотя использование игры с природой при принятии решений в условиях неопределенности не всегда дает однозначный результат, принимающий решение упорядочивает данные, определяет состояния природы и свои возможные решения, оценивает потери и выигрыши для различных вариантов, что способствует повышению качества принимаемых решений.





Дата публикования: 2015-01-23; Прочитано: 734 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.009 с)...