Байесовский подход в теории игр
Предположим, что - матрица потерь первого игрока. Предполагается, что известны вероятности, с которыми второй игрок применяет свои стратегии:
qj = P(θ = θj), j=1,2,…,m,.
Для каждой стратегии δi считаются средние потери
.
Байесовской называется та стратегия, для которой средние потери минимальны:
δ*: а(δ*) =.
Пример 1.Пусть первый игрок имеет 106 руб.; он может хранить их дома (стратегия δ1) либо поместить в банк под 10% годовых (стратегия δ2). Его противник (банк) имеет тоже две стратегии: θ1 – нормальная работа банка в течении года; θ2 – в течении года банк лопнет и вкладчик потеряет свои деньги. Матрица потерь первого игрока имеет вид:
Поскольку а* = а* = 0, то игра имеет цену а = 0 и оптимальная (чистая) стратегия первого игрока в этой А-игре существует. Это δ1, т.е. первый игрок, следующий минимаксной стратегии, должен хранить свои деньги дома.
Рассмотрим теперь байесовскую постановку данной задачи. Пусть априорное распределение имеет вид
q1 = P(θ = θ1) = 0,9999, q2 = P(θ = θ2) = 0,0001.
Иначе говоря, вероятность разорения банка в течении года равна 0,0001, т.е. достаточно мала. Тогда средние (байесовские) потери первого игрока равны соответственно
а(δ1) = 0q1 + 0q2 = 0, a(δ2) = q1(-105) + q2106 = -99890.
Поэтому байесовская стратегия в этой задаче равна δ2. Иначе говоря, банки разоряются очень редко (в странах с нормальной банковской системой), поэтому деньги хранить выгоднее в банке, чем дома.
Задачи к § 10
10.1.Рассмотрите игру с матрицей потерь первого игрока
Найти: а) байесовскую стратегию первого игрока, если известно априорное распределение стратегий второго игрока;
б) подобрать такое априорное распределение (q1, q2, q3), чтобы байесовская стратегия, отвечающая ему, имела вид (0,1,0).
10.2.Молодой бизнесмен М планирует посетить Объединенные Арабские Эмираты и с этой целью планирует занять в банке $5000. Если его дела пойдут успешно (стратегия θ1), он обещает через 3 месяца вернуть своему кредитору взятые деньги плюс 10%; в противном случае (стратегия θ2) он не сможет вернуть деньги.
У банка есть тоже две стратегии:
δ1 = {дать бизнесмену М деньги}; δ2 = {не дать бизнесмену М деньги}.
а) Найти минимаксную стратегию банка; б) допустим известны qj, при каких значениях q2 байесовской стратегией банка будет δ1.