Решение матричной игры в чистых и смешанных стратегиях
Целью участников любой матричной игры является выбор наиболее выгодных стратегий, доставляющих игроку А максимальный выигрыш, а игроку В – минимальный проигрыш.
Предположим, что игроку А надлежит сделать свой выбор. Анализируя платежную матрицу, он для каждой чистой стратегии Ai сначала найдет минимальное значение αi ожидаемого выигрыша: , а затем из всех αi выделит наибольшее и выберет соответствующую ему чистую стратегию . Это и будет наиболее предпочтительная (гарантирующая) в данных условиях стратегия игрока А. Ее называют максиминной, поскольку она отвечает величине
. (7.1)
Число α, определяемое по формуле (7.1), называется нижней чистой ценой игры (максимином). Оно показывает, какой минимальный выигрыш может получить игрок А, правильно применяя свои чистые стратегии при любых действиях игрока В.
В свою очередь, игрок В, стремясь минимизировать проигрыш, при выборе наиболее предпочтительной стратегии, использует принцип осторожности так: сначала он для каждой чистой стратегии Вj ( ) найдет максимально возможный проигрыш ( ), а затем среди βj выберет минимальное значение , которому и будет соответствовать искомая чистая стратегия . Ее называют минимаксной, так как она соответствует величине
. (7.2)
Число β, определяемое по формуле (7.2), называется верхней чистой ценой игры (минимаксом). Оно показывает, какой максимальный проигрыш может быть у игрока В при правильном выборе им своих чистых стратегий независимо от действий игрока А.
Если в матричной игре нижняя и верхняя чистые цены совпадают, т.е. α = β, то эта игра имеет седловую точку в чистых стратегиях и чистую цену игры ν = α = β. Оптимальными для игроков будут соответственно максиминная и минимаксная стратегии, а чистой ценой игры – седловой элемент платежной матрицы. Если игра седловой точки не имеет, то решение игры следует найти в смешанных стратегиях.
Обозначим через р1, ..., рm вероятности, с которыми игрок А использует в ходе игры свои чистые стратегии A1, ..., Аm. Для вероятностей рi выполняются условия:
. (7.3)
Упорядоченное множество , элементы которого удовлетворяют условиям (7.3), полностью определяет характер игры игрока А и называется его смешанной стратегией.
Аналогично упорядоченное множество , элементы которого удовлетворяют соотношениям
, (7.4)
является смешанной стратегией игрока В.
Итак, пусть игроки А и В применяют смешанные стратегии р и q. Это означает, что игрок А использует стратегию Ai с вероятностью pi, а игрок В – стратегию Вj с вероятностью qj. При использовании смешанных стратегий игра приобретает случайный характер, случайной становится и величина выигрыша игрока А (проигрыша игрока В). В связи с этим можно вести речь лишь о средней величине (математическом ожидании) выигрыша (проигрыша). Эта величина является функцией от смешанных стратегий р и q и определяется по формуле
. (7.5)
Функция (7.5) называется платежной функцией игры с матрицей.
Нижней ценой игры будем называть число α, определяемое по формуле , a верхней ценой игры – число β, определяемое по формуле
. (7.6)
Оптимальными являются смешанные стратегии р* и q* игроков А и В, удовлетворяющие равенству
= = . (7.7)
Величину , полученную по формуле (7.7), называют ценой игры v.