Некоторые критерии принятия решений в условиях неопределенности

В случае, когда неизвестны априорные вероятности стратегий второго игрока, для поиска оптимальных стратегий первого игрока применяются также и другие критерии. Наряду с минимаксным критерием будем применять такие критерии, как критерии Лапласа; Сэвиджа; Гурвица. Остановимся на них по порядку.

Критерий Лапласа

В основе этого критерия лежит так называемый принцип недостаточного обоснования. Поскольку вероятности q₁, q₂,…, q_m стратегий Θ₁, … ,Θ_m второго игрока неизвестны, то информация, необходимая для вывода того, что эти вероятности различны, отсутствует, и, так как принцип недостаточного обоснования утверждает противоположное, считается, что эти вероятности равны, т.е.

q₁= q₂=…= q_m.

Предположим, что имеется матрица потерь первого игрока и у второго игрока имеется m стратегий, и эти стратегии имеют равные вероятности:

Оптимальной для первого игрока считается та стратегия, которая дает минимум средним потерям (для матрицы выигрышей максимум).

Пример 1.Одно из предприятий должно определить уровень предложения услуг так, чтобы удовлетворить потребности клиентов в течение предстоящих праздников. Точное число клиентов неизвестно, но ожидается, что оно может принимать следующие значения: 200, 250, 300, 350. Для каждого из возможных случаев существует наилучший уровень предложения, который является стратегией первого игрока.

Предположим, что матрица затрат предприятия имеет вид:

Верхняя цена a* = 21 (δ₃ – минимаксная стратегия)

Вводим q_j = P(θ = θ_j) = 1/4. Тогда, средние потери:

a(δ₁) = 1/4(5 + 10 + 18 + 25) = 14,5

a(δ₂) = 1/4(8 + 7 + 8 + 23) = 11,5

a(δ₃) = 1/4(21 + 18 + 12 + 21) = 18

a(δ₄) = 1/4(30 + 22 + 19 + 15) = 21,5

Выбираем минимальное значение, и это значение (11,5) соответствует стратегии δ₂ , следовательно, она является оптимальной стратегией первого игрока по критерию Лапласа.

Критерий Сэвиджа

Для обоснования использования критерия Сэвиджа обычно приводят такой пример

Пример 2.Пусть матрица потерь первого игрока имеет вид

Цена игры a* = 10000, следовательно, δ₂ – минимаксная стратегия. Однако применение этой стратегии как оптимальной является нелогичным.

Предположим, что - матрица потерь или матрица выигрышей первого игрока.

Вводится следующая матрица , где

Матрица В интерпретируется как матрица сожаления первого игрока по поводу того, что он не выбрал наилучшей стратегии.

Применительно к примеру 2 мы получим:

Цена игры а* = 1000, следовательно, δ₁ – оптимальная стратегия по критерию Сэвиджа, что является более логичным решением.

Отметим, что независимо от того А – матрица потерь или выигрышей, В – матрица потерь и для нахождения решения игры к матрице В применяется минимаксный подход.

Критерий Гурвица

Этот критерий учитывает склонность лица, принимающего решение к оптимизму или пессимизму.

Предположим, что - матрица потерь первого игрока. Очевидно, что для первого игрока - оптимистический выбор стратегии осуществляется по критерию:, а пессимистический выбор - по критерию:.

Вводится параметр α, и составляется функция потерь

где α – показатель оптимизма, и выбирается стратегия по этому критерию. Когда нет точного значения α, оно берется равным 1/2.

Пример 3.Пусть в условиях примера 1 данного параграфа α = 1/2. Вычисления приведены в следующей таблице:


δ₁
δ₂
δ₃			16,5
δ₄			22,5

По данным таблицы, δ₁и δ₂ – оптимальные стратегии по критерию Гурвица.

Задачи к § 9

9.1.Найти оптимальные стратегии игроков с помощью критериев принятия решений в условиях неопределенности. Рассмотреть матрицу А как а) матрицу потерь и б) матрицу выигрышей первого игрока.

9.2.Один из N станков должен быть выбран для изготовления партии изделий, размер которой может принимать любое значение в пределах Q₁≤ Q ≤ Q₂. Производственные затраты для i-го станка задаются следующей функцией:

Найти решение используя все вышеописанные критерии.