Парные матричные игры с нулевой суммой
Тема 4. ЭЛЕМЕНТЫ ТЕОРИИ МАТРИЧНЫХ ИГР
Теория игр занимается разработкой различного рода рекомендаций по принятию решений в условиях конфликтной ситуации.
Игрой называют упрощенную модель конфликтной ситуации. Игра ведется по определенным правилам. Суть игры в том, что каждый из ее участников принимает такие решения, которые, как он полагает, могут обеспечить ему наилучший результат (исход). Исход игры — это значение некоторой функции, называемой функцией выигрыша (платежной функцией). Если сумма выигрышей игроков равна нулю, то игру называют игрой с нулевой суммой. Если в игре участвуют два игрока, то ее называют парной.
Пусть игроки А и В располагают конечным числом возможных действий — чистых стратегий. Обозначим их соответственно и . Игрок А может выбрать любую чистую стратегию , в ответ на которую игрок В может выбрать любую свою чистую стратегию . Если игра состоит только из личных ходов, то выбор пары стратегий однозначно определяет результат — выигрыш игрока А или проигрыш игрока В. Если известны значения выигрыша для каждой пары чистых стратегий, то можно составить матрицу выигрышей игрока А (проигрышей игрока В) (табл. 4.1). Эту матрицу называют также платежной.
В табл. 4.1 приведены числа — минимально возможный выигрыш игрока А, применяющего стратегию и — максимально возможный проигрыш игрока В, если он пользуется стратегией .
Таблица 4.1
… | ||
… | … … … … … | … |
… |
Число называют нижней чистой ценой игры (максимином), а соответствующую ему чистую стратегию — максиминной. Число называют верхней чистой ценой игры (минимаксом), а соответствующую чистую стратегию — минимаксной. Ясно, что максимин не превосходит минимакса, т. е. .
Если , то говорят, что игра имеет седловую точку в чистых стратегиях и чистую цену игры . Пару чистых стратегий , соответствующих и , называют седловой точкой матричной игры, а элемент , платежной матрицы, стоящий на пересечении -ой строки и -го столбца, — седловым элементом платежной матрицы. Он одновременно является минимальным в своей строке и максимальным в своем столбце, т. е. . Стратегии и , образующие седловую точку, являются оптимальными. Тройку называют решением игры.
Пример. Каждый из игроков А и В записывает одно из чисел 1, 4, 6 или 9, затем они одновременно показывают написанное. Если оба числа оказались одинаковой четности, то игрок А выигрывает столько очков, какова сумма этих чисел, если разной четности — выигрывает игрок В. Составить платежную матрицу, найти нижнюю и верхнюю чистые цены игры, максиминную и минимаксную стратегии игроков.
Решение. Чистыми стратегиями игрока А будут: — записать число 1, — число 4, — число 6, — число 9. У игрока В чистыми будут аналогичные стратегии (табл. 4.2).
Таблица 4.2
(1) | (4) | (6) | (9) | ||
(1) (4) (6) (9) | –5 | –7 | –7 | ||
–5 | –13 | –13 | |||
–7 | –15 | –15 | |||
–13 | –15 | –15 | |||
Элемент =2, так как в ситуации оба игрока записывают нечетное число 1 и выигрыш игрока А равен 1+1=2. Элемент = –5, так как в ситуации игрок А записывает число 1, а игрок В — число 4, т. е. числа разной четности, поэтому выигрыш игрока В равен 5, тогда как выигрыш игрока А составит –5. Аналогичным образом вычисляются остальные элементы платежной матрицы. После определения и замечаем, что нижняя чистая цена игры не равна верхней чистой цене игры , поэтому данная игра не имеет седловой точки. Максиминной для игрока А будет чистая стратегия . Пользуясь ею, игрок А «выиграет» не менее –7 (проиграет не более 7). Минимаксными для игрока В будут чистые стратегии и , при которых он проиграет не более 10.