Решение игр в смешанных стратегиях
Если игра не имеет седловой точки, то применение чистых стратегий не дает оптимального решения игры.
К примеру, в задаче игры «поиск» , т.е. седловая точка отсутствует. В данном случае можно получить оптимальное решение, случайным образом чередуя чистые стратегии.
Смешанной стратегией SA игрока A будем называть применение чистых стратегий A1, A2, …, Am с вероятностями p1, p2, …, pm, причем:
. (7.9)
Смешанные стратегии можно записывать в матричной форме:
, (7.10)
или в векторной:
. (7.11)
Чистые стратегии можно считать частным случаем смешанных и задавать строкой, в которой 1 соответствует чистой стратегии.
На основе принципа минимакса определяется оптимальное решение игры: это пара оптимальных стратегий (в общем случае смешанных), обладающих следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то другому должно быть не выгодно отступать от своей.
Выигрыш, соответствующий оптимальному решению – цена игры, удовлетворяет следующему неравенству:
, (7.12)
где – соответственно нижняя и верхняя цена игры.
Справедлива следующая теорема (основная теорема теории игр – теорема Неймана): каждая конечная игра имеет, по крайней мере, одно оптимальное решение, возможно, среди смешанных стратегий.
Пусть и – пара оптимальных стратегий. Если чистая стратегия входит в оптимальную смешанную стратегию с отличной от нуля вероятностью, то она называется активной.
Теорема об активных стратегиях: если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остается неизменным и равным цене игры ν, если второй игрок не выходит за пределы своих активных стратегий.
Рассмотрим игру 2×2. Если такая игра имеет седловую точку, то оптимальное решение – это пара чистых стратегий, соответствующих этой точке.
Игра, в которой отсутствует седловая точка, в соответствии с основной теоремой теории игр имеет оптимальное решение в смешанных стратегиях и .
Для их определения воспользуемся теоремой об активных стратегиях.
Если игрок А придерживается своей оптимальной стратегии , то его средний выигрыш будет равен цене игры ν, какой бы активной стратегией ни пользовался игрок В. Для игры 2×2 любая чистая стратегия противника является активной, если отсутствует седловая точка.
Выигрыш игрока А (проигрыш игрока В) – случайная величина, математическое ожидание которой является ценой игры. Поэтому средний выигрыш игрока А при использовании оптимальной смешанной стратегии будет равен ν и для первой, и для второй стратегии противника.
Пусть игра задана следующей платежной матрицей:
.
Средний выигрыш игрока А, если он использует оптимальную смешанную стратегию , а игрок В – чистую стратегию В1, равен цене игры ν:
. (7.13)
Тот же средний выигрыш получает игрок А, если второй игрок применяет стратегию B2:
. (7.14)
Учитывая, что , получаем следующую систему уравнений для определения оптимальной стратегии и цены игры ν:
(7.15)
Решая ее получим:
(7.16)
Аналогично для игрока В:
(7.17)
Оптимальная стратегия :
(7.18)
Пример 7.2. Найти оптимальные стратегии игры «поиск».