Некоторые критерии принятия решений в условиях неопределенности
В случае, когда неизвестны априорные вероятности стратегий второго игрока, для поиска оптимальных стратегий первого игрока применяются также и другие критерии. Наряду с минимаксным критерием будем применять такие критерии, как критерии Лапласа; Сэвиджа; Гурвица. Остановимся на них по порядку.
Критерий Лапласа
В основе этого критерия лежит так называемый принцип недостаточного обоснования. Поскольку вероятности q1, q2 ,…, qm стратегий Θ1, … ,Θm второго игрока неизвестны, то информация, необходимая для вывода того, что эти вероятности различны, отсутствует, и, так как принцип недостаточного обоснования утверждает противоположное, считается, что эти вероятности равны, т.е.
q1 = q2 =…= qm.
Предположим, что имеется матрица потерь первого игрока и у второго игрока имеется m стратегий, и эти стратегии имеют равные вероятности:
.
Оптимальной для первого игрока считается та стратегия, которая дает минимум средним потерям (для матрицы выигрышей максимум).
.
Пример 1.Одно из предприятий должно определить уровень предложения услуг так, чтобы удовлетворить потребности клиентов в течение предстоящих праздников. Точное число клиентов неизвестно, но ожидается, что оно может принимать следующие значения: 200, 250, 300, 350. Для каждого из возможных случаев существует наилучший уровень предложения, который является стратегией первого игрока.
Предположим, что матрица затрат предприятия имеет вид:
.
Верхняя цена a* = 21 (δ3 – минимаксная стратегия)
Вводим qj = P(θ = θj) = 1/4. Тогда, средние потери:
a(δ1) = 1/4(5 + 10 + 18 + 25) = 14,5
a(δ2) = 1/4(8 + 7 + 8 + 23) = 11,5
a(δ3) = 1/4(21 + 18 + 12 + 21) = 18
a(δ4) = 1/4(30 + 22 + 19 + 15) = 21,5
Выбираем минимальное значение, и это значение (11,5) соответствует стратегии δ2 , следовательно, она является оптимальной стратегией первого игрока по критерию Лапласа.
Критерий Сэвиджа
Для обоснования использования критерия Сэвиджа обычно приводят такой пример
Пример 2.Пусть матрица потерь первого игрока имеет вид
Цена игры a* = 10000, следовательно, δ2 – минимаксная стратегия. Однако применение этой стратегии как оптимальной является нелогичным.
Предположим, что - матрица потерь или матрица выигрышей первого игрока.
Вводится следующая матрица , где
Матрица В интерпретируется как матрица сожаления первого игрока по поводу того, что он не выбрал наилучшей стратегии.
Применительно к примеру 2 мы получим:
Цена игры а* = 1000, следовательно, δ1 – оптимальная стратегия по критерию Сэвиджа, что является более логичным решением.
Отметим, что независимо от того А – матрица потерь или выигрышей, В – матрица потерь и для нахождения решения игры к матрице В применяется минимаксный подход.
Критерий Гурвица
Этот критерий учитывает склонность лица, принимающего решение к оптимизму или пессимизму.
Предположим, что - матрица потерь первого игрока. Очевидно, что для первого игрока - оптимистический выбор стратегии осуществляется по критерию:, а пессимистический выбор - по критерию:.
Вводится параметр α, и составляется функция потерь
где α – показатель оптимизма, и выбирается стратегия по этому критерию. Когда нет точного значения α, оно берется равным 1/2.
Пример 3.Пусть в условиях примера 1 данного параграфа α = 1/2. Вычисления приведены в следующей таблице:
δ1 | |||
δ2 | |||
δ3 | 16,5 | ||
δ4 | 22,5 |
По данным таблицы, δ1и δ2 – оптимальные стратегии по критерию Гурвица.
Задачи к § 9
9.1.Найти оптимальные стратегии игроков с помощью критериев принятия решений в условиях неопределенности. Рассмотреть матрицу А как а) матрицу потерь и б) матрицу выигрышей первого игрока.
9.2.Один из N станков должен быть выбран для изготовления партии изделий, размер которой может принимать любое значение в пределах Q1 ≤ Q ≤ Q2. Производственные затраты для i-го станка задаются следующей функцией:
Найти решение используя все вышеописанные критерии.