Игры с « природой».

Для того чтобы можно сделать вывод о том какую именно стратегию выбирать игроку, необходимо использовать критерии Вальда, Гурвица, Сэвиджа, Лапласа, Байеса.

1. Критерий Вальда. Рекомендуется применять максиминную стратегию. Она достигается из условия max min α_ijи совпадает с нижней ценой игры.

i j

Критерий является пессимистическим, считается, что природа будет действовать наихудшим для человека образом, агрессивно, делать все, чтобы помешать нам достигнуть успеха.

Рассмотрим задачу.

Ежедневный спрос на булочки в продовольственном магазине может принимать следующие значения

Если булочка не продана днем, то она м.б. реализована за 15 центов к концу дня. Свежие булочки продаются по 49 центов за штуку. Затраты магазина на одну булочку 25 центов.

Используя игровой подход, определить, какое число булочек надо заказывать ежедневно.

Составим платежную матрицу. Сначала вычислим прибыль (49-25=24) и убыток (15-25=-10).


100*24	100*24	100*24	100*24	100*24
10024-5010	150*24	150*24	150*24	150*24
10024-10010	15024-5010	200*24	200*24	200*24
10024-15010	15024-10010	20024-5010	250*24	250*24
10024-20010	15024-15010	20024-10010	25024-5010	300*24

Платежная матрица примет вид

Вычислим критерий Вальда - максиминный. Он отражает принцип гарантированного результата:

Олицетворяет позицию крайнего пессимизма: надо ориентироваться всегда на худшие условия, зная наверняка, что хуже этого не будет. Этот перестраховочный подход для того, кто очень боится проиграть.

Оптимальной считается стратегия, при которой гарантируется выигрыш в любом случае, не меньший, чем нижняя цена игры с природой:

Н = max minα_ij

i j

Подсчитать min по строкам и выбрать ту стратегию, при которой минимум строки максимален.

А₁
А₂
А₃
А₄
А₅

Критерий Вальда рекомендует выбирать стратегию А_1.

2. Критерий Гурвица (оптимизма - пессимизма).Критерий рекомендует при выборе решения не руководствоваться ни крайним пессимизмом (всегда рассчитывай на худшее), ни крайним легкомысленным оптимизмом (авось кривая выведет). Критерий рекомендует стратегию, определяемую по формуле

H = Max {γmin a_ij + (1- γ)max a_ij}

i j j

где γ - степень оптимизма - изменяется в диапазоне [0, 1].

Критерий придерживается некоторой промежуточной позиции, учитывающей возможность как наихудшего, так и наилучшего поведения природы. При γ = 1 критерий превращается в критерий Вальда, при γ = 0 - в критерий максимума. На γ оказывает влияние степень ответственности лица, принимающего решение по выбору стратегии. Чем хуже последствия ошибочных решений, больше желания застраховаться, тем γ ближе к единице.

Рассмотрим платежную матрицу.

Параметр Гурвица возьмем равным 0,6.

	min	max	γmin a_ij + (1- γ)max a_ij
А₁			24000.6+0.42400=2400
А₂			19000.6+36000.4=2580
А₃			14000.6+48000.4=2760
А₄			9000.6+60000.4=2940
А₅			4000.6+72000.4=3120

Критерий Гурвица рекомендует стратегию А₅.

3. Критерий Сэвиджа.Суть критерия состоит в выборе такой стратегии, чтобы не допустить чрезмерно высоких потерь, к которым она может привести. Находится матрица рисков, элементы которой показывают, какой убыток понесет человек (фирма), если для каждого состояния природы он не выберет наилучшей стратегии.

Элементы матрицы рисков находится по формуле (r_ij):

r_ij = maxa_ij - a_ij

где maxa_ij - максимальный элемент в столбце исходной матрицы.

Оптимальная стратегия находится из выражения

H = Min {max(max a_ij - a_ij)}

Составим матрицу риска, (max a_ij - a_ij).

Выберем максимальный элемент в столбце и вычитаем из него остальные элементы столбца, получим max(max a_ij - a_ij).

						Мax
А₁
А₂
А₃
А₄
А₅

Из максимальных значений последнего столбца выбираем минимальную величину, получим Min {max(max a_ij - a_ij)}.

Критерий Сэвиджа рекомендует стратегию А₄.

4. Критерий Лапласа.Этот критерий основывается на принципе недостаточного обоснования. Поскольку вероятности состояния не известны, необходимая информация для вывода, что эти вероятности различны, отсутствует. Поэтому можно предположить, что они равны. Выбор стратегии осуществляется по формуле

H = Max {1/n·∑ a_ij}

где 1/n вероятность реализации одного из состояний р = 1/n.

А₁	(2400+2400+2400+2400+2400)/5=2400
А₂	(1900+3600+3600+3600+3600)/5=3260
А₃	(1400+3100+4800+4800+4800)/5=3780
А₄	(900+2600+4300+6000+6000)/5=3960
А₅	(400+2100+3800+5500+7200)/5=3800

Критерий Лапласа рекомендует нам стратегию А₄.

Таким образом, рассмотрев одну платежную матрицу, мы получили, что критерии Лапласа и Сэвиджа рекомендует стратегию А₄.То есть необходимый заказ булочек составит 250 единиц ежедневно.

5. Критерий Байеса. Принятие решения в условиях риска.

Если в рассмотренных выше критериях, необходимая информация о вероятностях какого-либо состояния отсутствовала, то критерий Байеса действует в условиях не полной информации, т.е. в условиях риска (имеется информация о вероятностях применения стратегий второй стороной). Эти вероятности называются априорными вероятностями.

Выбор стратегии осуществляется по формуле

H = Max {∑p_i a_ij}

Ежедневный спрос на булочки в продовольственном магазине задается следующим распределением вероятностей



0,2	0,25	0,3	0,15	0,1

Поставив значение a_ij и p_i в формулу, получим:

А₁	24000,2+24000,25+24000,3+24000,15+2400*0,1=2400
А₂	19000,2+36000,25+36000,3+36000,15+3600*0,1=3260
А₃	14000,2+31000,25+48000,3+48000,15+4800*0,1=3695
А₄	9000,2+26000,25+43000,3+60000,15+6000*0,1=3620
А₅	4000,2+21000,25+38000,3+55000,15+7200*0,1=3290

Критерий Байеса рекомендует стратегию А₃

В условиях полной неопределенности теория не дает однозначных принципов выбора того или иного критерия.

Оптимальные стратегии, выбранные по различным критериям, различны.

Таким образом, окончательный вывод зависит от предпочтений человека, который принимает решение.

ПРИМЕР №1

Найти оптимальные стратегии 1-го игрока, исходя из различных критериев, в игре с полной неопределенностью относительно второго игрока, заданной платежной матрицей:

а₁₁ а₁₂ а₁₃ а₁₄5 10 18 25

а₂₁ а₂₂ а₂₃ а₂₄8 7 8 23

А = а₃₁ а₃₂ а₃₃ а₃₄; А = 21 18 12 21

а₄₁ а₄₂ а₄₃ а₄₄20 22 19 15

Решение.

1. Максиминный критерий Вальда. max min а_ij

ⁱ^j

Вычислим минимальные значения по строкам min а_ij, а далее из них выберем максимальное.

5 10 18 255

А = 8 7 8 23 7

21 18 12 21 12

20 22 19 1515

Таким образом, получаем Н = max min а_ij = 15 при применении стратегии А₄. ⁱ^j

Ответ: оптимальной стратегией 1-го игрока А является

стратегия А₄.

2. Критерий Гурвица.

Параметр Гурвица возьмем равным γ=0,6: γ= min а_ij+(1-γ) max а_ij

5 10 18 255 25 5*0,6+0,4*25=13

А = 8 7 8 23 7 23 7*0,6+0,4*23=13,4

21 18 12 21 12 18 12*0,6+0,4*18=14,4

20 22 19 1515 22 15*0,6+0,4*22=17,8

Получаем H = max[0.6 min а_ij+(1-0.6) max а_ij]=17.8

ⁱ^j

Ответ: оптимальной стратегией первого игрока является

стратегия А₄.

3. Критерий Сэвиджа (критерий минимаксного риска).

Необходимо построить матрицу рисков.

Для этого:

1) вычислить максимальные значения по столбцам

5 10 18 25

А = 8 7 8 23

21 18 12 21

20 22 19 15

21 22 19 25

2) вычислить матрицу рисков: r_ij= max а_ij- а_ij

21-5 22-10 19-18 25-25 16 12 1 0

r_ij= 21-8 22-7 19-8 25-23 = 13 15 11 2

21-21 22-18 19-12 25-21 0 4 7 4

21-20 22-22 19-19 25-15 1 0 0 10

3) вычислить максимальные значения по строкам и из них выберем строку с минимальным значением:

16 12 1 0 16

13 15 11 2 15

r_ij= 0 4 7 4 7

1 0 0 10 10

Получаем H = min max r_ij = 7 при применении стратегии А₃.

ⁱ^j

Ответ: оптимальной стратегией первого игрока является стратегия А₃.

4. Критерий Лапласа. n

Вычислить средние арифметические по строкам [1/n ∑ а_ij]

5 10 18 25 0.25 (5+10+18+25)=14.5 ^j⁼¹

A = 8 7 8 23 0.25 (8+7+8+23)=11.5

21 18 12 21 0.25 (21+18+12+21)=18

20 22 19 15 0.25 (20+22+19+15)=19

Получаем H = max [1/n ∑ а_ij] =19 при применении стратегии А₄.

ⁱ^j⁼¹

Ответ: оптимальной стратегией первого игрока является стратегия А₄.

Выбор стратегии в условиях риска (при наличии вероятностной информации).

В₁ В₂ В₃В₄_n

А₁ 5 10 18 25 H = max∑P_j а_ij

А₂8 7 8 23 ⁱ^j⁼¹

А₃21 18 12 21

А₄20 22 19 15

Вероятности стратегий второго игрока.

В₁ В₂ В₃ В₄

0.2 0.15 0.35 0.3

5*0.2+10*0.15+18*0.35+25*0.3=16.30

8*0.2+7*0.15+8*0.35+23*0.3=12.35

21*0.2+18*0.15+12*0.35+21*0.3=17.40

20*0.2+22*0.15+19*0.35+15*0.3=18.45

Получаем Н = 18,45 при применении стратегии А₄.

Ответ: оптимальной стратегией первого игрока является стратегия А₄.

ПРИМЕР №2

Предприятие имеет возможность самостоятельно планировать объемы выпуска сезонной продукции А₁, А₂, А₃. Не проданная в течении сезона продукция позже реализуется по сниженной цене. Данные о себестоимости продукции, отпускных ценах и объемах реализации в зависимости от уровня спроса приведены в таблице:

Вид продукции Себесто-имость Цена единицы Продукции Объем реализации При уровне спроса

В течение сезона После уценки Повы-шенном среднем Пони- женном

А₁ d₁ р₁ q₁ a₁ b₁ c₁

А₂ d₂ р₂ q₂ a₂ b₂ c₂

А₃ d₃ р₃ q₃ а₃ b₃ c₃

Требуется:

1) придать описанной ситуации игровую схему, указать допустимые стратегии сторон, составить платежную матрицу

2) дать рекомендации об объемах выпуска продукции по видам, обеспечивающих предприятию наивысшую прибыль.

Указание. Для уменьшения размерности платежной матрицы считать, что одновременно на все три вида продукции уровень спроса одинаков: повышенный, средний или пониженный.

Вид продукции Себесто-имость Цена единицы Продукции Объем реализации При уровне спроса

В течение сезона После уценки Повы-шенном среднем Пони- женном

А₁ 2,6 3,4 2,8

А₂ 3,7 4,2 3,2

А₃ 1,5 2,8 1,7

Решение.

В игре участвуют 2 игрока: А - производитель, В - потребитель.

Игрок А стремится реализовать свою продукцию так, чтобы получить максимальную прибыль. Стратегиями игрока А являются:

А₁- продавать продукцию при повышенном состоянии спроса

А₂- продавать продукцию при среднем состоянии спроса

А₃- продавать продукцию при пониженном состоянии спроса

Игрок В стремится приобрести продукцию с минимальными затратами. Стратегиями игрока В являются:

В₁- покупать продукцию при повышенном состоянии спроса

В₂- покупать продукцию при среднем состоянии спроса

В₃- покупать продукцию при пониженном состоянии спроса

Интересы игроков А и В - противоположны. Определим цену продукции в течение сезона и после уценки:

Вид продукции себестоимость Цена в течение сезона Цена после уценки

А₁ 2,6 3,4-2,6=0,2 2,8-2,6=0,2

А₂ 3,7 4,2-3,7=0,5 3,2-3,7= -5

А₃ 1,5 2,8-1,5=1,3 1,7-1,5=0,2

Рассчитаем элементы платежной матрицы

Предложение Спрос

стратегии Повышенный спрос 14+38+24 Средний спрос 8+22+13 Пониженный спрос 5+9+7

Повышенный спрос 14+38+24 14*0,8+38*0,5+ 24*1,3=61,4 8*0,8+(14-8) *0,2+ 22*0,5+(38-22)*(-5) +13*1,3+(24-13)*0,2 =29,7 5*0,8+(14-5)*0,2+ 9*0,5+(38-9)*(-5)+ 7*1,3+(24-7)=8,3

Средний спрос 8+22+13 8*0,8+22*0,5+ 13*1,3=34,3 8*0,8+22*0,5+ 13*1,3=34,3 5*0,8+(8-5)*0,2+ 9*0,5+(22-9)*(-5)+ 7*1,3+(13-7)*0,2 =12,9

Пониженный спрос 5+9+7 5*0,8+9*0,5+7*1,3 =17,6 5*0,8+9*0,5+ 7*1,3=17,6 5*0,8+9*0,5+ 7*1,3=17,6

Платежная матрица примет вид

Стратегии В₁ В₂ В₃ α_i=min а_ij ^j

А₁ 61.4 29.7 8.3 8.3

А₂ 34.3 34.3 12.9 12.9

А₃ 17.6 17.6 17.6 17.6

β_j=max а_ij ⁱ 61.4 34.3 17.6

α = max α_i = 17.6 β = min β_j = 17.6

Так как α = β = ν = 17,6, то найдена седловая точка. Значит оптимальное решение: А₃; В₃

Производитель (игрок А) получит гарантированную прибыль в размере 17,6 ден.ед., если будет реализовывать свою продукцию при пониженном уровне спроса в объеме 5,9 и 7 ед. соответственно продукции А₁, А₂ и А₃

Контрольные вопросы:

1.Дайте определение конфликтной ситуации.

2.Как называется математическая модель конфликтной ситуации?

3.Как называются заинтересованные стороны в теории игр?

4.Какая игра называется антагонистической? Приведите пример.

5.Дайте определение понятию «стратегия».

6.Что понимается под исходом конфликта?

7.Дайте определение понятию «выигрыш».

8.На какие классы делятся игры в зависимости от числа игроков?

9.В чем состоит цель игрока А при выборе стратегии ?

10. В чем состоит суть максиминного принципа оптимальности и как называется выигрыш, полученный в соответствии в этим принципом?

11.Почему максимин α называют нижней ценой игры?

12.В чем состоит цель игрока В при выборе стратегии?

13.Почему минимакс βназывают верхней ценой игры?

14.Почему справедливо неравенство α < β ?

15.Дайте определение цены игры в чистых стратегиях.

16.Какая игра называется игрой в смешанных стратегиях?

17.Как найти оптимальную смешанную стратегию игрока А и цену игры 2 х n геометрически?

18.Что в теории игр понимается под термином «природа»?

19.Приведите примеры в которых решение принимается в условиях неопределенности, связанной с неосознанным принятием различных факторов.

20.Чем отличается выбор оптимальных стратегий игроков в играх с природой от антагонистических игр?

21.Что понимается под риском игрока в игре с природой, и каким образом формируется матрица рисков,

22.Дайте определение критерия Вальда и как по нему определяется выигрыш?

23. Дайте определение критерия Севиджа и как по нему определяется выигрыш?

24. Дайте определение критерия Лапласа и как по нему определяется выигрыш?

25. Дайте определение критерия Байеса и как по нему определяется выигрыш?

26. Какой принцип выбора оптимальной стратегии лежит в основе критерия пессимизма –оптимизма Гурвица относительно выигрышей?