Байесовский подход в теории игр

Предположим, что - матрица потерь первого игрока. Предполагается, что известны вероятности, с которыми второй игрок применяет свои стратегии:

qj = P(θ = θj), j=1,2,…,m,.

Для каждой стратегии δi считаются средние потери

.

Байесовской называется та стратегия, для которой средние потери минимальны:

δ*: а(δ*) =.

Пример 1.Пусть первый игрок имеет 106 руб.; он может хранить их дома (стратегия δ1) либо поместить в банк под 10% годовых (стратегия δ2). Его противник (банк) имеет тоже две стратегии: θ1 – нормальная работа банка в течении года; θ2 – в течении года банк лопнет и вкладчик потеряет свои деньги. Матрица потерь первого игрока имеет вид:

Поскольку а* = а* = 0, то игра имеет цену а = 0 и оптимальная (чистая) стратегия первого игрока в этой А-игре существует. Это δ1, т.е. первый игрок, следующий минимаксной стратегии, должен хранить свои деньги дома.

Рассмотрим теперь байесовскую постановку данной задачи. Пусть априорное распределение имеет вид

q1 = P(θ = θ1) = 0,9999, q2 = P(θ = θ2) = 0,0001.

Иначе говоря, вероятность разорения банка в течении года равна 0,0001, т.е. достаточно мала. Тогда средние (байесовские) потери первого игрока равны соответственно

а(δ1) = 0q1 + 0q2 = 0, a(δ2) = q1(-105) + q2106 = -99890.

Поэтому байесовская стратегия в этой задаче равна δ2. Иначе говоря, банки разоряются очень редко (в странах с нормальной банковской системой), поэтому деньги хранить выгоднее в банке, чем дома.

 

Задачи к § 10

10.1.Рассмотрите игру с матрицей потерь первого игрока

Найти: а) байесовскую стратегию первого игрока, если известно априорное распределение стратегий второго игрока;

б) подобрать такое априорное распределение (q1, q2, q3), чтобы байесовская стратегия, отвечающая ему, имела вид (0,1,0).

10.2.Молодой бизнесмен М планирует посетить Объединенные Арабские Эмираты и с этой целью планирует занять в банке $5000. Если его дела пойдут успешно (стратегия θ1), он обещает через 3 месяца вернуть своему кредитору взятые деньги плюс 10%; в противном случае (стратегия θ2) он не сможет вернуть деньги.

У банка есть тоже две стратегии:

δ1 = {дать бизнесмену М деньги}; δ2 = {не дать бизнесмену М деньги}.

а) Найти минимаксную стратегию банка; б) допустим известны qj, при каких значениях q2 байесовской стратегией банка будет δ1.