Деревья решений

Задачи с вазами

Теория полезности экспериментально исследовалась в так называемых задачах с вазами. В непрозрачном сосуде находится определенное (известное лишь организатору эксперимента) количество шаров различного цвета. Задачи с вазами типичны для группы наиболее простых задач принятия решений — задач статистического типа. Для решения этих задач надо знать элементарные начала теории вероятностей. Человек делает выбор в этих задачах, основываясь на расчетах. Варианты действий выражены в наиболее простом виде.

Типовая задача для испытуемого может быть представлена следующим образом. Перед испытуемым ставится ваза, которая может быть вазой 1-го или 2-го типа. Дается следующая информация: сколько имеется у экспериментатора ваз 1-го и 2-го типов; сколько черных и красных шаров в вазах 1-го и 2-го типов; какие выигрыши ожидают испытуемого, если он угадает, какого типа ваза; какие проигрыши ожидают его, если он ошибется. После получения такой информации испытуемый должен сделать выбор: назвать, к какому типу принадлежит поставленная перед ним ваза.

Пусть, например, экспериментатор случайно выбирает вазу для испытуемого из множества, содержащего 700 ваз 1-го типа и 300 ваз 2-го типа. Пусть в вазе 1-го типа содержится 6 красных шаров и 4 черных. В вазе 2-го типа содержится 3 красных и 7 черных шаров. Если перед испытуемым находится ваза 1-го типа и он угадает это, то получит выигрыш 350 денежных единиц (д. е.), если не угадает, его проигрыш составит 50 д. е. Если перед ним ваза 2-го типа и он это угадает, то получит выигрыш 500 д. е., если не угадает, его проигрыш составит 100 д. е. Испытуемый может предпринять одно из следующих действий:

d₁ — сказать, что ваза 1-го типа;

d₂ — сказать, что ваза 2-го типа.

Условия задачи можно представить в табл. 2.

Таблица 2.1

Представление задачи с вазами

Тип вазы	Вероятность выбора вазы данного типа	Выигрыш при действии
d₁	d₂
	0,7		-100
	0,3	-50

Согласно теории полезности ЛПР следует оценить среднюю (ожидаемую) полезность каждого из действий и выбрать действие с максимальной ожидаемой полезностью. В соответствии с этой рекомендацией мы можем определить среднее значение выигрыша для каждого из действий:

U(d₁)= 0,7Ä350 - 0,3Ä50=230 д.е;

U(d₂)= 0,30Ä500 - 0,7Ä100=80 д.е.

Т.е. разумный человек выберет действие d₁, а не действие d₂.

Из этого примера следует общий рецепт действий для рационального человека: определить исходы, помножить их на соответствующие вероятности, получить ожидаемую полезность и выбрать действие с наибольшей полезностью.

Приведенная выше табл. 2.1 может быть представлена в виде дерева решений (рис. 2.3). На этом дереве квадратик означает место, где решение принимает человек, а светлый кружок - место, где все решает случай. На ветвях дерева написаны уже знакомые нам значения вероятностей, а справа у конечных ветвей - значения исходов (результаты).

Рис. 2.3 Дерево решений

ДР может использоваться для представления возможных действий и для нахождения последовательности правильных решений, ведущих к максимальной ожидаемой полезности. Чтобы показать это, усложним задачу. Предоставим человеку, выбирающему между действиями d₁ и d₂, дополнительные возможности. Пусть он может до своего ответа вытащить за определенную плату один шар из вазы, причем после вытаскивания шар кладется обратно в вазу. Плата за вытаскивание одного шара 60 д. е. Вот теперь вопрос о том, какое решение следует принимать, стал сложнее: необходимо решить, стоит ли вынимать шар и какой ответ дать после вытаскивания красного или черного шара. При принятии этих решений нам окажет существенную помощь известный в теории вероятностей (и в теории статистических решений) способ подсчета изменения вероятностей событий после получения дополнительной информации.

Вернемся к описанию задачи. Вероятность вытащить красный шар из вазы 1-го типа р_к(В₁)=0,6, а из вазы 2-го типа p_к(В₂)=0,3. Зная все условные вероятности (зависящие от условия), а также вероятности р₁ и р₂ выбора ваз 1-го и 2-го типа (табл. 2), мы можем поставить следующие вопросы.

Первый вопрос: каковы вероятности вытащить красный и черный шары? Для ответа на этот вопрос произведем простые вычисления. Вероятность вытащить красный шар р_к(В₁)=0,7Ä0,6=0,42, если ваза окажется 1-го типа, р_к(В₂)=0,3Ä0,3=0,09, если ваза окажется 2-го типа. Следовательно, вероятность вытащить красный шар в общем случае р_к=0,51. Аналогичным образом можно посчитать, что вероятность вытащить черный шар р_ч=0,49.

Второй вопрос более сложный. Пусть вытащенный шар оказался красным (черным). Какое действие следует выбрать: d₁ или d₂? Для ответа на этот вопрос нужно знать вероятности принадлежности ваз к 1-му и 2-му типам после получения дополнительной информации. Эти вероятности позволяет определить формула Байеса.

Например, мы вытащили красный шар. Какова после этого вероятность того, что перед нами стоит ваза 1-го типа? Приведем все обозначения вероятностей:

p_к(В₁) - вероятность вытащить красный шар из вазы 1-го типа;

p_ч(В₁) - вероятность вытащить черный шар из вазы 1-го типа;

p_к(В₂) - вероятность вытащить красный шар из вазы 2-го типа;

p_ч(В₂) - вероятность вытащить черный шар из вазы 2-го типа;

р(В₁) - вероятность того, что ваза 1-го типа;

p(В₂) - вероятность того, что ваза 2-го типа;

p(В_1/к) - вероятность того, что ваза окажется 1-го типа после вытаскивания красного шара; '

р(В_1/ч) — вероятность того, что ваза окажется 1-го типа после вытаскивания черного шара;

p(В_2/к) — вероятность того, что ваза окажется 2-го типа после вытаскивания красного шара;

р(В_2/ч) — вероятность того, что ваза окажется 2-го типа после вытаскивания черного шара.

Формула Байеса позволяет оценить р(В_i_/к) и р(В_i_/ч), где i=1,2, используя все прочие вероятности. Например:

Для нашей задачи: р(В_1/к)=0,82; р(В_1/ч)=0,57; р(В_2/к)=0,18; р(В_2/ч)=0,43.

При использовании для принятия решений деревьев решений есть три простых правила выбора оптимальной (по критерию максимума ожидаемой полезности) последовательности решений на основе дерева решений:

1) идти от конечных ветвей дерева к его корню;

2) там, где есть случайность (кружок), находится среднее значение;

3) там, где есть этап принятия решений (квадратик), выбирается ветвь с наибольшей ожидаемой полезностью, а другая отсекается.

Построив и применив эти правила к дереву решений относительно нашей задачи получаем, что наилучший вариант действий: шар не вытаскивать и выбирать действие d₁.

Деревья решений при заданных числовых значениях вероятностей и исходов позволяют осуществить выбор той стратегии (последовательности действий), при которой достигается наибольший выигрыш, т. е. достигается максимум функции полезности ЛПР.