Сведение нахождения оптимальных смешанных стратегий игроков к задаче линейного программирования.
Обозначим . Из определения нижней цены игры следует, что - наибольшее из тех чисел , для которых есть хотя бы один допустимый набор удовлетворяющий неравенствам
Будем считать, что все элементы платежной матрицы неотрицательны (для этого их достаточно увеличить на одно и то же положительное число, оптимальные стратегии при этом не изменятся). Поделим все неравенства системы на и обозначим . Тогда, с учетом соотношения , получаем . Таким образом, задача по определению смешанных стратегий первого игрока сводится к следующей задаче линейного программирования.
,
.
Если есть решение задачи, то цена игры равна , а оптимальная стратегия игрока определяется из соотношений .
Несколько более удобно решать задачу по определению верхней цены игры и максиминной стратегии второго игрока. По определению нижней цены получаем, что есть наименьшее значение из тех , для которых выполняются неравенства
хотя бы для одного допустимого набора . Обозначая , получаем следующую задачу линейного программирования
,
.
Если решение задачи, то , .
Задачи по определению максиминной стратегии перового игрока и минимаксной стратегии второго игрока являются двойственными по отношению друг к другу, поэтому, решив одну из задач, из соответствующей симплекс таблицы мы можем одновременно определить решение второй задачи.
Задача 6.4. Рассматривается антагонистическая игра двух лиц с нулевой суммой и платежной матрицей (первый игрок - получатель платежа, - выбирает строку платежной матрицы, второй - плательщик, - выбирает столбец). Требуется: 1) определить верхнюю и нижнюю цену игры в чистых стратегиях; 2) найти цену игры и оптимальные смешанные стратегии игроков графическим способом; 3) свести нахождение смешанных стратегий второго игрока к задаче линейного программирования и найти цену игры.
Решение. Найдем сначала верхнюю и нижнюю цену игры в чистых стратегиях. Для нахождения верхней цены (привелигирован первый игрок) подчеркнем максимум в каждом из столбцов платежной матрицы, а затем выберем наименьшее значение из этих максимумов.
Следовательно, , а минимаксной стратегией второго игрока является либо первая, либо третья. Для нахождения нижней цены игры подчеркнем наименьшее значение из чисел платежной матрицы в каждой строке и выберем наибольшее из этих минимумов.
Следовательно, , а максиминной стратегией первого игрока является любая из двух, первая или вторая. Поскольку , цены игры и решения в чистых стратегиях нет.
Найдем оптимальные смешанные стратегии игроков и цену игры графическим способом. Для этого нам надо построить графики четырех функций
,
,
,
,
на отрезке , определить
,
а затем найти .
(4) 16
11 (2)
9 (1) 9
7 7
2 (3) 2
0 1
Из рисунка видно, что точка максимина соответствует пересечению графиков второй и третьей функции, то есть
,
откуда
Û , .
Для определения смешанной стратегии второго игрока следует решить уравнение
,
откуда
, .
Таким образом, оптимальные стратегии игроков определены однозначно - это стратегия для первого игрока, и стратегия для второго. Цена игры в смешанных стратегиях равна .
Сведем теперь задачу нахождения оптимальной стратегии второго игрока задаче линейного программирования. Получаем:
,
, .
Приведем задачу к стандартной форме
Запишем условия задачи в виде симплекс-таблицы.
Б | ||||||||
-1 | -1 | -1 | -1 |
Ö
Б | ||||||||
Ö
Б | |||||||
Найдено следующее решение задачи линейного программирования:
, , , .
Переходя к вероятностям, получим
, , .
Одновременно мы нашли решение двойственной задачи: оптимальные значения двойственных переменных , содержатся в -строке в столбцах, отвечающих вспомогательным переменным и соответственно. Таким образом, , , . Окончательно, , . Ответы совпали с ответами, полученными графическим способом.