Некоторые критерии принятия решений в условиях неопределенности

В случае, когда неизвестны априорные вероятности стратегий второго игрока, для поиска оптимальных стратегий первого игрока применяются также и другие критерии. Наряду с минимаксным критерием будем применять такие критерии, как критерии Лапласа; Сэвиджа; Гурвица. Остановимся на них по порядку.

Критерий Лапласа

В основе этого критерия лежит так называемый принцип недостаточного обоснования. Поскольку вероятности q1, q2 ,…, qm стратегий Θ1, … ,Θm второго игрока неизвестны, то информация, необходимая для вывода того, что эти вероятности различны, отсутствует, и, так как принцип недостаточного обоснования утверждает противоположное, считается, что эти вероятности равны, т.е.

q1 = q2 =…= qm.

Предположим, что имеется матрица потерь первого игрока и у второго игрока имеется m стратегий, и эти стратегии имеют равные вероятности:

.

Оптимальной для первого игрока считается та стратегия, которая дает минимум средним потерям (для матрицы выигрышей максимум).

.

Пример 1.Одно из предприятий должно определить уровень предложения услуг так, чтобы удовлетворить потребности клиентов в течение предстоящих праздников. Точное число клиентов неизвестно, но ожидается, что оно может принимать следующие значения: 200, 250, 300, 350. Для каждого из возможных случаев существует наилучший уровень предложения, который является стратегией первого игрока.

Предположим, что матрица затрат предприятия имеет вид:

.

Верхняя цена a* = 21 (δ3 – минимаксная стратегия)

Вводим qj = P(θ = θj) = 1/4. Тогда, средние потери:

a(δ1) = 1/4(5 + 10 + 18 + 25) = 14,5

a(δ2) = 1/4(8 + 7 + 8 + 23) = 11,5

a(δ3) = 1/4(21 + 18 + 12 + 21) = 18

a(δ4) = 1/4(30 + 22 + 19 + 15) = 21,5

Выбираем минимальное значение, и это значение (11,5) соответствует стратегии δ2 , следовательно, она является оптимальной стратегией первого игрока по критерию Лапласа.

Критерий Сэвиджа

Для обоснования использования критерия Сэвиджа обычно приводят такой пример

Пример 2.Пусть матрица потерь первого игрока имеет вид

Цена игры a* = 10000, следовательно, δ2 – минимаксная стратегия. Однако применение этой стратегии как оптимальной является нелогичным.

Предположим, что - матрица потерь или матрица выигрышей первого игрока.

Вводится следующая матрица , где

Матрица В интерпретируется как матрица сожаления первого игрока по поводу того, что он не выбрал наилучшей стратегии.

Применительно к примеру 2 мы получим:

Цена игры а* = 1000, следовательно, δ1 – оптимальная стратегия по критерию Сэвиджа, что является более логичным решением.

Отметим, что независимо от того А – матрица потерь или выигрышей, В – матрица потерь и для нахождения решения игры к матрице В применяется минимаксный подход.

Критерий Гурвица

Этот критерий учитывает склонность лица, принимающего решение к оптимизму или пессимизму.

Предположим, что - матрица потерь первого игрока. Очевидно, что для первого игрока - оптимистический выбор стратегии осуществляется по критерию:, а пессимистический выбор - по критерию:.

Вводится параметр α, и составляется функция потерь

где α – показатель оптимизма, и выбирается стратегия по этому критерию. Когда нет точного значения α, оно берется равным 1/2.

Пример 3.Пусть в условиях примера 1 данного параграфа α = 1/2. Вычисления приведены в следующей таблице:

 
δ1
δ2
δ3 16,5
δ4 22,5

По данным таблицы, δ1и δ2 – оптимальные стратегии по критерию Гурвица.

 

Задачи к § 9

9.1.Найти оптимальные стратегии игроков с помощью критериев принятия решений в условиях неопределенности. Рассмотреть матрицу А как а) матрицу потерь и б) матрицу выигрышей первого игрока.

9.2.Один из N станков должен быть выбран для изготовления партии изделий, размер которой может принимать любое значение в пределах Q1 QQ2. Производственные затраты для i-го станка задаются следующей функцией:

Найти решение используя все вышеописанные критерии.