Тема 6. Функции выигрыша в смешанных стратегиях
Примеры симплексов
Если игроки А и В независимо друг от друга выбрали смешанные стратегии соответственно и , то упорядоченная пара (Р, Q) называется ситуацией в смешанных стратегиях. В условиях ситуации (Р, Q) в смешанных стратегиях чистые стратегии и выбираются независимо друг от друга случайным образом с вероятностями соответственно и . Поэтому вероятность совместного выбора чистых стратегий равна произведению их вероятностей:. Но в ситуации в чистых стратегиях игрок А получает выигрыш . Вероятность этого выигрыша совпадает с вероятностью ситуации , т. е. равна .
Таким образом, выигрыш игрока А в ситуации (Р, Q) в смешанных стратегиях представляет собой дискретную случайную величину, принимающую значения с вероятностью . Тогда средний выигрыш игрока А в ситуации (Р, Q)в смешанных стратегиях есть математическое ожидание указанной случайной величины
(6.1)
Определим функцию выигрыша игрока А в смешанных стратегиях как функцию H, заданную на декартовом произведении множеств смешанных стратегий, ставящую в соответствие каждой ситуации в смешанных стратегиях средний выигрыш игрока А в этой ситуации, определяемый выражением (8.1). Таким образом,
, , (6.2)
где , .
Форма (6.2) задания функции выигрыша в смешанных стратегиях называется координатной. Функцию Н можно задать и в матричной форме
,
Теорема 6.1. Для каждой смешанной (в частности, чистой) стратегии игрока А существует (достигается)
(6.2)
Для каждой смешанной (в частности, чистой) стратегии е8в игрока В существует (достигается)
(6.3)
Число, определенное равенством (6.2) (существование которого доказано в теореме 6.1), назовем показателем эффективности смешанной стратегии игрока А относительно множества смешанных стратегий игрока В.
Если в этом определении множество смешанных стратегий игрока В заменить на множество его чистых стратегий, то получим определение показателя эффективности смешанной стратегии игрока А относительно множества чистых стратегий игрока В:
. (6.4)
Теорема 6.2. Показатели эффективности любой смешанной (в частности, чистой) стратегии игрока А относительно множеств и чистых и смешанных стратегий противника В равны, т.е.
(6.5)
Число, определенное равенством (6.3), назовем показателем неэффективности смешанной стратегии игрока В относительно множества смешанных стратегий игрока А, а число
(6.6)
показателем неэффективности смешанной стратегии Q игрока В относительно множества чистых стратегий игрока А.
Теорема 6.3. Показатели неэффективности любой смешанной (в частности, чистой) стратегии игрока В относительно множеств и чистых и смешанных стратегий игрока А равны, т.е.
Нижней ценой (или максимином) матричной игры в смешанных стратегиях называется величина
Верхней ценой (или минимаксом) матричной игры в смешанных стратегиях называется величина
Те о р е м а 6.4. Для любой конечной матричной игры существуют нижняя и верхняя цены игры в смешанных стратегиях.
Соотношения между нижними и верхними ценами игры в чистых и смешанных стратегиях устанавливаются в следующей теореме.
Теорема 6.5. Нижняя цена игры а и верхняя цена игры (3 в чистых стратегиях, нижняя цена игры V и верхняя цена игры
в смешанных стратегиях удовлетворяют следующему неравенству
.