Деревья решений
Задачи с вазами
Теория полезности экспериментально исследовалась в так называемых задачах с вазами. В непрозрачном сосуде находится определенное (известное лишь организатору эксперимента) количество шаров различного цвета. Задачи с вазами типичны для группы наиболее простых задач принятия решений — задач статистического типа. Для решения этих задач надо знать элементарные начала теории вероятностей. Человек делает выбор в этих задачах, основываясь на расчетах. Варианты действий выражены в наиболее простом виде.
Типовая задача для испытуемого может быть представлена следующим образом. Перед испытуемым ставится ваза, которая может быть вазой 1-го или 2-го типа. Дается следующая информация: сколько имеется у экспериментатора ваз 1-го и 2-го типов; сколько черных и красных шаров в вазах 1-го и 2-го типов; какие выигрыши ожидают испытуемого, если он угадает, какого типа ваза; какие проигрыши ожидают его, если он ошибется. После получения такой информации испытуемый должен сделать выбор: назвать, к какому типу принадлежит поставленная перед ним ваза.
Пусть, например, экспериментатор случайно выбирает вазу для испытуемого из множества, содержащего 700 ваз 1-го типа и 300 ваз 2-го типа. Пусть в вазе 1-го типа содержится 6 красных шаров и 4 черных. В вазе 2-го типа содержится 3 красных и 7 черных шаров. Если перед испытуемым находится ваза 1-го типа и он угадает это, то получит выигрыш 350 денежных единиц (д. е.), если не угадает, его проигрыш составит 50 д. е. Если перед ним ваза 2-го типа и он это угадает, то получит выигрыш 500 д. е., если не угадает, его проигрыш составит 100 д. е. Испытуемый может предпринять одно из следующих действий:
d1 — сказать, что ваза 1-го типа;
d2 — сказать, что ваза 2-го типа.
Условия задачи можно представить в табл. 2.
Таблица 2.1
Представление задачи с вазами
Тип вазы | Вероятность выбора вазы данного типа | Выигрыш при действии | |
d1 | d2 | ||
0,7 | -100 | ||
0,3 | -50 |
Согласно теории полезности ЛПР следует оценить среднюю (ожидаемую) полезность каждого из действий и выбрать действие с максимальной ожидаемой полезностью. В соответствии с этой рекомендацией мы можем определить среднее значение выигрыша для каждого из действий:
U(d1)= 0,7Ä350 - 0,3Ä50=230 д.е;
U(d2)= 0,30Ä500 - 0,7Ä100=80 д.е.
Т.е. разумный человек выберет действие d1, а не действие d2.
Из этого примера следует общий рецепт действий для рационального человека: определить исходы, помножить их на соответствующие вероятности, получить ожидаемую полезность и выбрать действие с наибольшей полезностью.
Приведенная выше табл. 2.1 может быть представлена в виде дерева решений (рис. 2.3). На этом дереве квадратик означает место, где решение принимает человек, а светлый кружок - место, где все решает случай. На ветвях дерева написаны уже знакомые нам значения вероятностей, а справа у конечных ветвей - значения исходов (результаты).
Рис. 2.3 Дерево решений
ДР может использоваться для представления возможных действий и для нахождения последовательности правильных решений, ведущих к максимальной ожидаемой полезности. Чтобы показать это, усложним задачу. Предоставим человеку, выбирающему между действиями d1 и d2, дополнительные возможности. Пусть он может до своего ответа вытащить за определенную плату один шар из вазы, причем после вытаскивания шар кладется обратно в вазу. Плата за вытаскивание одного шара 60 д. е. Вот теперь вопрос о том, какое решение следует принимать, стал сложнее: необходимо решить, стоит ли вынимать шар и какой ответ дать после вытаскивания красного или черного шара. При принятии этих решений нам окажет существенную помощь известный в теории вероятностей (и в теории статистических решений) способ подсчета изменения вероятностей событий после получения дополнительной информации.
Вернемся к описанию задачи. Вероятность вытащить красный шар из вазы 1-го типа рк(В1)=0,6, а из вазы 2-го типа pк(В2)=0,3. Зная все условные вероятности (зависящие от условия), а также вероятности р1 и р2 выбора ваз 1-го и 2-го типа (табл. 2), мы можем поставить следующие вопросы.
Первый вопрос: каковы вероятности вытащить красный и черный шары? Для ответа на этот вопрос произведем простые вычисления. Вероятность вытащить красный шар рк(В1)=0,7Ä0,6=0,42, если ваза окажется 1-го типа, рк(В2)=0,3Ä0,3=0,09, если ваза окажется 2-го типа. Следовательно, вероятность вытащить красный шар в общем случае рк=0,51. Аналогичным образом можно посчитать, что вероятность вытащить черный шар рч=0,49.
Второй вопрос более сложный. Пусть вытащенный шар оказался красным (черным). Какое действие следует выбрать: d1 или d2? Для ответа на этот вопрос нужно знать вероятности принадлежности ваз к 1-му и 2-му типам после получения дополнительной информации. Эти вероятности позволяет определить формула Байеса.
Например, мы вытащили красный шар. Какова после этого вероятность того, что перед нами стоит ваза 1-го типа? Приведем все обозначения вероятностей:
pк(В1) - вероятность вытащить красный шар из вазы 1-го типа;
pч(В1) - вероятность вытащить черный шар из вазы 1-го типа;
pк(В2) - вероятность вытащить красный шар из вазы 2-го типа;
pч(В2) - вероятность вытащить черный шар из вазы 2-го типа;
р(В1) - вероятность того, что ваза 1-го типа;
p(В2) - вероятность того, что ваза 2-го типа;
p(В1/к) - вероятность того, что ваза окажется 1-го типа после вытаскивания красного шара; '
р(В1/ч) — вероятность того, что ваза окажется 1-го типа после вытаскивания черного шара;
p(В2/к) — вероятность того, что ваза окажется 2-го типа после вытаскивания красного шара;
р(В2/ч) — вероятность того, что ваза окажется 2-го типа после вытаскивания черного шара.
Формула Байеса позволяет оценить р(Вi/к) и р(Вi/ч), где i=1,2, используя все прочие вероятности. Например:
Для нашей задачи: р(В1/к)=0,82; р(В1/ч)=0,57; р(В2/к)=0,18; р(В2/ч)=0,43.
При использовании для принятия решений деревьев решений есть три простых правила выбора оптимальной (по критерию максимума ожидаемой полезности) последовательности решений на основе дерева решений:
1) идти от конечных ветвей дерева к его корню;
2) там, где есть случайность (кружок), находится среднее значение;
3) там, где есть этап принятия решений (квадратик), выбирается ветвь с наибольшей ожидаемой полезностью, а другая отсекается.
Построив и применив эти правила к дереву решений относительно нашей задачи получаем, что наилучший вариант действий: шар не вытаскивать и выбирать действие d1.
Деревья решений при заданных числовых значениях вероятностей и исходов позволяют осуществить выбор той стратегии (последовательности действий), при которой достигается наибольший выигрыш, т. е. достигается максимум функции полезности ЛПР.