Линейное программирование для решения матричных игр

Решение матричных игр

Существует несколько основных методов решения матричных игр:

1. Аналитический

2. Графический

3. Итеративный (метод Брауна-Джонсона)

4. Метод линейного программирования

Рассмотрим подробнее последний из перечисленных.

Пусть имеется некоторая матричная игра Г=<X,Y,H> (где X и Y — множества стратегий 1го и 2го игроков соответственно, а Н — платежная матрица), H=(a_ij) R^m^*ⁿ

Требуется найти оптимальную смешанную стратегию, т.е.

p^*=(p₁^*,p₂^*,…,p_m^*) и q*=(q₁^*,q₂^*,…,q_n^*), при которых

,

где v — цена игры.

Для решения этой задачи можно применять линейное программирование.

Будем считать, что все a_ij0, игра Г’ эквивалентна игре Г, H’=H+L, L — число, при котором неравенство будет выполняться (при переходе от игры Г к игре Г’).

Далее предположим, что 2й игрок принимает стратегию y_k , , тогда выигрыш игрока 1 будет определяться условием

p₁a₁_k + p₂a₂_k + … + p_ma_mk v, (*)

(равенство v достигается, если k-я стратегия является рабочей)

p_i 0 , ;p_i a_ik > 0 v>0 (т.к. левая часть неравенства (*) больше нуля).

Разделим неравенство (*) на v :

t₁a_1k + t₂a_2k +…+ t_ma_mk 1, где t_i=, t_i 0,

Цель стратегии 1-го игрока — максимизировать выигрыш:

vmax min

Исходя из рассмотренных условий, задачу линейного программирования можно сформулировать так:

1) t_i 0 ,

2) min

3) , причем z_k=0 для рабочих стратегий , z_k>0 для нерабочих стратегий.

Решение этой задачи позволяет:

1. Вычислить t_i^*.

2. Определить те k, при которых z_k=0 (т.е. найти рабочие стратегии 2го игрока)

3.

4. p_i^*=t_i^* v

Для определения стратегии 2го игрока можно поступить двояко:

1) сформулировать двойственную задачу

2) использовать информацию о полезных стратегиях 2-го игрока (полезные стратегии – при z_k=0 )

Пусть найдена полезная стратегия игрока y_j, , . Для определения оптимальной стратегии q_j^*, для рабочих стратегий 1-го игрока можно записать условие

q₁a_i₁ + q₂a_i₂ + … + q_ka_ik v,

(причем если i-я стратегия 1-го игрока рабочая, то =v,а если нет, то >v)

q₁a_i₁ + q₂a_i₂ + … + q_ka_ik v ,

- система уравнений для определения оптимального q.