Тема 12. Игры и их решение с помощью линейного программирования
Между матричными играми и линейным программированием существует взаимосвязь, состоящая в том, что, с одной стороны, решение любой матричной игры можно свести к решению пары двойственных друг другу задач линейного программирования специалыуэго вида, а с другой стороны, наоборот, любая задача линейного программирования, у которой существует решение, может быть сведена к матричной игре специального вида. Таким образом, в этом смысле теория линейного программирования эквивалентна теории матричных игр.
Сформулируем теорему, устанавливающую сведение решения любой матричной игры к решению пары двойственных задач линейного программирования специального вида. При этом будем предполагать, что все элементы матрицы игры
… | |||
… | |||
… | … | … | … |
… |
положительны:
(12.1)
Условие (12.1) не умаляет общности, поскольку матрица с любыми элементами может быть приведена к матрице с положительными элементами аффинным преобразованием
где, по которому к каждому элементу исходной матрицы прибавляется достаточно большое положительное число , например, большее максимального модуля неположительных элементов матрицы; при этом оптимальные стратегии остаются прежними, а цена игры увеличивается на прибавленную константу .
Теорема 20.1. Решение матричной игры тхп с матрицей А, элементы которой удовлетворяют условию (12.1), эквивалентно решению следующей пары двойственных друг другу стандартных задач линейного программирования:
найти , при ограничениях
(12.2)
найти при ограничениях
(12.3)
Точнее говоря, если - оптимальное решение задачи(12.2), - оптимальное решение задачи (20.3), то
(12.4)
- цена игры с матрицей А,
(12.5)
- оптимальная стратегия игрока А,
- оптимальная стратегия игрока В.
Пример. Необходимо найти решение матричной игры 3x3 с матрицей
B A | |||
Чтобы сделать все неотрицательными, прибавим ко всем элементам матрицы . Получим матрицу:
B A | |||
При этой цена игры увеличится на 5, а решение не изменится.
Определим оптимальную стратегию . Условия (12.3) имеют вид:
(12.6)
где
Чтобы избавиться от знаков неравенства, введем фиктивные переменные; условия (12.6) запишутся в виде:
(12.7)
Линейная форма Ф имеет вид:
и должна быть сделана как можно меньше.
Если все три стратегии В являются «полезными», то все три фиктивные переменные обратятся в нуль (т. е. выигрыш, равный цене игры , будет достигаться при каждой стратегии ). Но мы пока не имеем оснований утверждать, что все три стратегии являются «полезными». Чтобы проверить это. попытаемся выразить форму Ф через фиктивные переменные и посмотрим, добьемся ли мы, полагая их рапными нулю, минимума формы. Для этого разрешим уравнения (5.7) относительно переменных (т. е. выразим через фиктивные переменные ):
(12.8)
Складывая получим:
(12.9)
В выражении (12.9) коэффициенты при всех положительны; значит, любое увеличениесверх нуля может привести только к увеличению формы Ф, а мы хотим, чтобы она была минимальна. Следовательно, значениями обращающими форму (12.9) в минимум, являются
Подставляя их в формулу (12.9), находим минимальное значение формы Ф: ,
откуда цена игры .
Подставляя нулевые значения в формулы (5.8), находим:
,
или, умножая их на ,
.
Таким образом, оптимальная стратегия А найдена:
,
т. е. мы должны в одной четверти всех случаев писать цифру 1, в половине случаев 2 и в остальной четверти случаев 3.
Зная цену игры , можно уже известными способами найти оптимальную стратегию противника
.
Для этого воспользуемся нашими любыми двумя «полезными» стратегиями (например, и) и напишем уравнения:
откуда .Оптимальная стратегия противника будет такой же, как наша:
.
Теперь вернемся к первоначальной (не преобразованной) игре. Для этого нужно только от цены игры отнять величину, прибавленную к элементам матрицы. Получим цену исходной игры . Следовательно, оптимальные стратегии обеих сторон обеспечивают средний выигрыш, равный нулю; игра в одинаковой мере выгодна или невыгодна для обеих сторон.