Решение матричной игры в чистых и смешанных стратегиях

 

Целью участников любой матричной игры является выбор наиболее выгодных стратегий, доставляющих игроку А макси­мальный выигрыш, а игроку В – минимальный проигрыш.

Предположим, что игроку А надлежит сделать свой выбор. Анализируя платежную матрицу, он для каж­дой чистой стратегии Ai сначала найдет минималь­ное значение αi ожидаемого выигрыша: , а затем из всех αi выделит наибольшее и выберет соответствующую ему чистую стратегию . Это и будет наи­более предпочтительная (гарантирующая) в данных условиях стратегия игрока А. Ее называют максиминной, поскольку она отвечает величине

 

. (7.1)

 

Число α, определяемое по формуле (7.1), называется ниж­ней чистой ценой игры (максимином). Оно показывает, какой минимальный выигрыш может получить игрок А, правильно применяя свои чистые стратегии при любых действиях игро­ка В.

В свою очередь, игрок В, стремясь минимизировать проиг­рыш, при выборе наиболее предпочтительной стратегии, исполь­зует принцип осторожности так: сначала он для каждой чистой стратегии Вj ( ) найдет максимально возможный про­игрыш ( ), а затем среди βj вы­берет минимальное значение , которому и будет со­ответствовать искомая чистая стратегия . Ее называют ми­нимаксной, так как она соответствует величине

 

. (7.2)

 

Число β, определяемое по формуле (7.2), называется верх­ней чистой ценой игры (минимаксом). Оно показывает, какой максимальный проигрыш может быть у игрока В при пра­вильном выборе им своих чистых стратегий независимо от действий игрока А.

Если в матричной игре нижняя и верхняя чистые цены совпадают, т.е. α = β, то эта игра имеет седловую точку в чистых стратегиях и чистую цену игры ν = α = β. Оптимальными для игроков будут соот­ветственно максиминная и минимаксная стратегии, а чистой ценой игры – седловой элемент платежной матрицы. Если игра седловой точки не имеет, то решение игры следует найти в смешанных стратегиях.

Обозначим через р1, ..., рm вероятности, с которыми игрок А использует в ходе игры свои чистые стратегии A1, ..., Аm. Для вероятностей рi выполняются условия:

 

. (7.3)

Упорядоченное множество , элементы кото­рого удовлетворяют условиям (7.3), полностью определяет ха­рактер игры игрока А и называется его смешанной стратеги­ей.

Аналогично упорядоченное множество , эле­менты которого удовлетворяют соотношениям

, (7.4)

 

является смешанной стратегией игрока В.

Итак, пусть игроки А и В применяют смешанные стратегии р и q. Это означает, что игрок А использует стратегию Ai с вероятностью pi, а игрок В – стратегию Вj с вероятностью qj. При использовании смешанных стратегий игра приобрета­ет случайный характер, случайной становится и величина вы­игрыша игрока А (проигрыша игрока В). В связи с этим мож­но вести речь лишь о средней величине (математическом ожи­дании) выигрыша (проигрыша). Эта величина явля­ется функцией от смешанных стратегий р и q и определяется по формуле

. (7.5)

 

Функция (7.5) называется платежной функцией игры с матрицей.

Нижней ценой игры будем называть число α, определяемое по формуле , a верхней ценой игры – число β, определяемое по формуле

. (7.6)

 

Оптимальными являются смешанные стратегии р* и q* игроков А и В, удовлетворяющие равенству

 

= = . (7.7)

 

Величину , полученную по формуле (7.7), называют ценой игры v.