Метод Сэвиджа (метод матрицы сожалений)
Лето
Вид продукции | Дождливое | Жаркое | Умеренное | Минимальное значение дохода |
Зонтики | ||||
Шляпы | ||||
Плащи |
В рассмотренном примере maxmin=50, поэтому необходимо выпускать плащи.
Важно ещё раз отметить, что minFij — это гарантированный уровень функции полезностиFij для каждого состояния среды (хуже быть не может). Отсюда следует, что
является наибольшим из гарантированных результатов. Поэтому принцип максимина называют также принципом наибольшего гарантированного результата.
Заметим, что если в таблице решений вместо функции выигрыша использовать функцию проигрыша, то вместо maxmin F решением будет minmax F.
Процедура поиска решения методом Севиджа сводится к следующему:
. 1. Предположим, что наступит состояние среды, соответствующее первому столбцу. Подсчитаем потери дохода, которые могут возникнуть при выборе каждой альтернативы. Если мы выберем альтернативу с наибольшим значением дохода, потерь не будет. Для каждой из остальных, неоптимальных альтернатив потери дохода равны разности между максимальным доходом для лучшей альтернативы и доходом для рассматриваемой альтернативы. Аналогичные операции выполняем для всех столбцов. Таким образом, в каждом столбце таблицы решений определяем наибольший элемент и вычитаем из него значения остальных элементов этого столбца, т. е. получаем новую таблицу. Эту операцию можно описать формулой
Данную формулу можно трактовать как потери дохода, которые могут возникнуть, если мы выберем неоптимальную альтернативу. Пересчитанная таблица называется матрицей сожалений о возможных потерях дохода, то есть об упущенной выгоде. Упущенная выгода, сожаление о возможных потерях равны нулю для альтернативы с максимальным доходом. Для других альтернатив упущенная выгода равна разнице между максимальным возможным доходом и полученным при выборе данной альтернативы.
Сравним позиции ЛПР в методах максимина и Севиджа. ЛПР, пользующееся методом максимина, стремится как можно больше гарантированно выиграть, получить гарантированный наибольший выигрыш. ЛПР, пользующееся методом Севиджа, стремится как можно меньше потерять, получить наименьший проигрыш в доходе из всех возможных (наименьшее сожаление об упущенной выгоде). Эти разные позиции, вообще говоря, могут привести к выбору разных оптимальных альтернатив.
2. Далее, в соответствии с гипотезой об антагонизме, предполагающей, что среда будет вести себя по отношению к ЛПР самым "подлым" образом, то есть будет максимизировать сожаление ЛПР об упущенной выгоде, определяем в каждой строке полученной матрицы сожалений максимальный элемент, т. е. наибольшее сожаление, гарантирующее, что больших сожалений о возможных потерях дохода, чем выбранное сожаление, не будет. Эта операция взятия максимума по столбцам j в i-той каждой строке записывается в виде:
В результате получаем столбец наибольших сожалений о потерянной выгоде
3. Из полученных наибольших сожалений определяем наименьшее, соответствующее выбору наилучшей альтернативы, т. е. находим минимаксное значение
Пример:
Используя вышеописанный пример (п. 4.1), строим матрицу сожалений об упущенной выгоде и записываем столбец наибольших сожалений для каждой альтернативы:
решение
Наименьшие гарантированы потери получаются при выпуске зонтиков (в отличие от плащей в методе гарантированного выигрыша).