Платежная матрица
Повторяющиеся игры
В неповторяющихся (одноходовых) играх, пример которых рассмотрен нами выше, используются четыре предпосылки, определяющие контекст игры:
1. игра состоит из одной партии, что означает: в будущем эти два игрока никогда не встретятся в рамках одной и той же игры, а партия состоит из одного хода. Таким образом, у игроков нет возможности наказать своего партнера за отступничество;
2. каждый из игроков не обладает информацией о поведении в прошлом своего контрагента в аналогичных ситуациях, так что формирование ожиданий на основе прошлого опыта невозможно. Соответственно репутация игрока не имеет значения, что не позволяет говорить о достоверности обещаний;
3. игроки не могут обмениваться информацией до осуществления выбора (либо это технически невозможно, либо запретительно высоки издержки коммуникации). Иногда эта предпосылка принимает форму предположения об одновременном выборе альтернатив участниками игры;
4. не существует возможности выплаты компенсаций одним игроком другому (в силу особой структуры платежной матрицы или свойства платежа).
В повторяющихся играх, когда игроки попадают в определенную ситуацию выбора неоднократно, их взаимодействие существенным образом усложняется. Они могут позволить себе комбинировать стратегии, максимизируя общий выигрыш.
Рассмотрим модель, описывающую отношения между Правительством и экономическим агентом в отношении проводимой налоговой политики. Правительство, стремясь повысить доходы бюджета, может повысить налоговые ставки. В этом случае на первом этапе игры произойдет сокращение потребления экономического агента и увеличение доходов Правительства. Однако на следующем этапе игры стратегией агента станет сокрытие доходов, что, в конечном счете, приведет к проигрышу Правительства из-за сокращения налоговых поступлений.
То же самое касается и игры "дилемма заключенного". Если у игроков будет возможность договориться, то они выберут единственно верную стратегию - не давать показаний друг против друга.
Рассмотрим парную конечную игру.
Пусть игрок А располагает m личными стратегиями: A1, A2, ..., Am., а у игрока В имеется n личных стратегий: B1, B2, ..., Bn.
Такая игра имеет размерность m × n.
В результате выбора игроками любой пары стратегий Ai и Bj (i=1,2,...,m; j=1,2 ...,n) однозначно определяется исход игры: выигрыш hij игрока А (положительный или отрицательный) и проигрыш (- hij ) игрока В.
Предположим, что значения hij известны для любой пары стратегий (Ai,Bj).
Матрица H=[hij], где i=1,2,...,m; j=1,2, ..., n, элементами которой являются выигрыши, соответствующие стратегиям Ai и Bj , называется платежной матрицей или матрицей игры.
Общий вид платежной матрицы представлен в таблице 1. Строки этой таблицы соответствуют стратегиям игрока А, а столбцы - стратегиям игрока В.
Таблица 1. Платежная матрица игры двух игроков А и В
Ai Вj | В1 | В2 | … | Вn |
A1 | h11 | h12 | … | h1n |
A2 | h21 | h22 | … | h2n |
… | … | … | … | … |
Am | hm1 | hm2 | … | h2m |
Рассмотрим пример1:
построить платежную матрицу игры «Поиск». Условия игры:
игрок А может спрятаться в одном из двух убежищ: I и II. Игрок В ищет игрока А, и если найдет, то получает от А штраф 1 ден. ед., в противном случае В платит игроку А 1 ден. ед.