Платежная матрица

Повторяющиеся игры

В неповторяющихся (одноходовых) играх, пример которых рассмотрен нами выше, используются четыре предпосылки, определяющие контекст игры:

1. игра состоит из одной партии, что означает: в будущем эти два игрока никогда не встретятся в рамках одной и той же игры, а партия состоит из одного хода. Таким образом, у игроков нет возможности наказать своего партнера за отступничество;

2. каждый из игроков не обладает информацией о поведении в прошлом своего контрагента в аналогичных ситуациях, так что формирование ожиданий на основе прошлого опыта невозможно. Соответственно репутация игрока не имеет значения, что не позволяет говорить о достоверности обещаний;

3. игроки не могут обмениваться информацией до осуществления выбора (либо это технически невозможно, либо запретительно высоки издержки коммуникации). Иногда эта предпосылка принимает форму предположения об одновременном выборе альтернатив участниками игры;

4. не существует возможности выплаты компенсаций одним игроком другому (в силу особой структуры платежной матрицы или свойства платежа).

В повторяющихся играх, когда игроки попадают в определенную ситуацию выбора неоднократно, их взаимодействие существенным образом усложняется. Они могут позволить себе комбинировать стратегии, максимизируя общий выигрыш.

Рассмотрим модель, описывающую отношения между Правительством и экономическим агентом в отношении проводимой налоговой политики. Правительство, стремясь повысить доходы бюджета, может повысить налоговые ставки. В этом случае на первом этапе игры произойдет сокращение потребления экономического агента и увеличение доходов Правительства. Однако на следующем этапе игры стратегией агента станет сокрытие доходов, что, в конечном счете, приведет к проигрышу Правительства из-за сокращения налоговых поступлений.

То же самое касается и игры "дилемма заключенного". Если у игроков будет возможность договориться, то они выберут единственно верную стратегию - не давать показаний друг против друга.

Рассмотрим парную конечную игру.

Пусть игрок А располагает m личными стратегиями: A1, A2, ..., Am., а у игрока В имеется n личных стратегий: B1, B2, ..., Bn.

Такая игра имеет размерность m × n.

В результате выбора игроками любой пары стратегий Ai и Bj (i=1,2,...,m; j=1,2 ...,n) однозначно определяется исход игры: выигрыш hij игрока А (положительный или отрицательный) и проигрыш (- hij ) игрока В.

Предположим, что значения hij известны для любой пары стратегий (Ai,Bj).

Матрица H=[hij], где i=1,2,...,m; j=1,2, ..., n, элементами которой являются выигрыши, соответствующие стратегиям Ai и Bj , называется платежной матрицей или матрицей игры.

Общий вид платежной матрицы представлен в таблице 1. Строки этой таблицы соответствуют стратегиям игрока А, а столбцы - стратегиям игрока В.

Таблица 1. Платежная матрица игры двух игроков А и В

A_i В_j	В₁	В₂	…	В_n
A₁	h₁₁	h₁₂	…	h_1n
A₂	h₂₁	h₂₂	…	h_2n
…	…	…	…	…
A_m	h_m1	h_m2	…	h_2m

Рассмотрим пример1:

построить платежную матрицу игры «Поиск». Условия игры:

игрок А может спрятаться в одном из двух убежищ: I и II. Игрок В ищет игрока А, и если найдет, то получает от А штраф 1 ден. ед., в противном случае В платит игроку А 1 ден. ед.