Теория принятия решений
Как указывалось в гл. 11, существенной чертой процесса принятия решений является возможность выбора альтернативных линий поведения. Теория принятия решений требует определения некоторых понятий, с тем чтобы придать элементам процесса принятия решений большую точность и конкретность.
Альтернативные линии поведения.Обозначим возможные действия (альтернативы) через alt а2, а3, ..., ап. В обыденном примере человек, идя на работу, может взять с собой плащ (аг) или не брать его (аа). Инженер, участвующий в разработке искусственного спутника Земли, в качестве материала для его корпуса может выбрать, например, алюминий, сталь или титан. Эти альтернативы можно обозначить соответственно через аь аа и а3.
Внешние условия.Обычно существуют условия, которые неподконтрольны лицу, принимающему решения. Мы назовем их внешними условиями, и для их обозначения здесь будет использован символ 0. Например, может идти дождь (Qi), или дождя может не быть (Э2).
В случае разработки корпуса спутника внешними условиями являются размер и частота появления метеоритных тел, с которыми будет сталкиваться спутник. Природное явление такого рода является скорее непрерывным, чем дискретным. (Дождь ведь тоже явление непрерывного типа. Так, дождя может не быть, он может моросить, слегка накрапывать и т. д.) Обычно такие ситуации описываются путем деления непрерывного распределения природного явления на произвольное удобное число дискретных состояний. Допустим поэтому, что метеорные потоки, которые может встретить спутник, описываются следующим образом: Q1— очень разреженный поток, 92— разреженный, 63— средний, 64— плотный, 9Б— очень плотный. На практике должно быть задано конкретное определение этих состояний, однако здесь для иллюстрации даются лишь качественные определения.
Потеря или выигрыш. Полезность.Таким образом, принимая решение, исходят из того, что некоторые цели, характеризуемые разной степенью желательности, достигаются с различной степенью достоверности при различном выборе альтернативных линий поведения. Конкретная линия поведения имеет, разумеется, вероятность успеха несколько меньше единицы. Теперь можно составить так называемую таблицу (или матрицу) потерь. Для каждой заданной комбинации «линия поведения—внешнее условие» имеют место определенные затраты. В данном случае «затратами» могут быть деньги, однако к ним могут относиться и многие другие факторы, например время, престиж, потеря невосполнимых ресурсов и т. д. Все эти факторы могут измеряться одним показателем, называемым полезностью. Полезность можно рассматривать как некоторого рода обобщенные потери или выигрыш, когда все ценности приведены к одной шкале. Теория полезности рассматривается в разд. 16.3, а пока что мы предположим, что шкалы полезности уже рассчитаны и получены таблицы потерь: табл. 16.1 для примера с плащом и табл. 16.2 для конструкции спутника.
Таблица 16.1 Таблица потерь для примера с плащом
Внешние условия | ||
Линия поведения | дождь | нет дождя |
«1 | е2 | |
Взять плащ, aj | ||
Не брать плаща, а2 |
Таблица 16.2 материала Таблица потерь для случая выбора корпуса спутника
Линия | Внешние условия | ||||
поведения | |||||
65 | |||||
% | |||||
а2 | |||||
gs |
Если полезность естественным образом приводит к выигрышу, а не к потерям, то выигрыш можно легко превратить в потери, просто вычитая из каждой величины значение наибольшего выигрыша. Тогда все элементы будут отрицательны либо равны нулю. Поскольку отрицательный выигрыш есть потеря, то знак минус можно опустить, и в результате получим таблицу потерь.
Вероятности, характеризующие внешние условия. Как можно видеть, вопрос может значительно усложниться, если вероятности различных потерь различны. Например, при условии 82 выбор альтернативы % с вероятностью р может привести к потерям LT и с вероятностью р2 — к потерям L2. Однако в данном примере, который дается здесь лишь для иллюстрации, мы рассмотрим только вероятности, отнесенные к различным внешним условиям. Пусть Бюро прогнозов установило, что вероятность дождя р(81)=0,30, а вероятность отсутствия осадков р(62)=0,70, и пусть в результате запуска предыдущих спутников получена следующая информация:
Внешнее условие | Вероятность |
Q1 | 0,10 |
Q2 | 0,20 |
Q 3 | 0,40 |
Q4 | 0,20 |
Q5 | 0,10 |
Математическое ожидание потерь. Теперь можно вычислить математическое ожидание потерь при выборе каждой возможной линии поведения. Напомним, что математическое ожидание случайной величины х равно
поэтому для простого примера с плащом математические ожидания потерь при выборе альтернатив ах и а2 составят соответственно
Еа, =0,30x1 + 0,70x2 = 1,7, £йа =0,30x7 + 0,70x0 = 2,1.
Таким образом, чтобы минимизировать ожидаемые потери., нужно принять альтернативу а1( т. е. взять с собой плащВ примере выбора материала для корпуса спутника математические ожидания потерь равны
£в, =0,1x2 + 0,2x7 + 0,4x12 + 0,2x12 + 0,1x12=10,0, Еаг =0,1x5+0,2x5 + 0,4x10 + 0,2x15 + 0,1x15 = 10,0, £аз =0,1x6 + 0,2x6 + 0,4x6 + 0,2x11+0,1 х 16 = 8,0.
Таким образом, модель, построенная на основе теории принятия решений, указывает, что инженеру следует выбрать альтернативу аа. (Цифры в этом примере условны и не обязательно должны в точности соответствовать реальной ситуации.)
Минимакс. Хотя, принимая решение, по-видимому, разумно использовать в качестве критерия математическое ожидание потерь, все же иногда в этом случае могут применяться и другие критерии. Одним из обычных показателей является минимакс. Этот метод требует минимизации максимальных потерь. Таким образом, этот консервативный критерий гласит: выбирайте стратегию, при которой вероятность больших потерь минимальна. В примере с плащом максимальные потери составляют 7 при выборе альтернативы а2 и 2 при выборе аа. Таким образом, минимакс требует выбора альтернативы аг. Заметим, что иллюстрацией консервативности этого метода является то, что он требует выбора альтернативы а1 независимо от прогноза погоды.
В примере с выбором материала для корпуса спутника максимальные потери составляют 12 для альтернативы аь 15 для а2, 16 для а3. Минимальное значение максимальных потерь равно 12 (при выборе альтернативы а^}. Метод минимакса рекомендует выбор альтернативы аг, в то время как рассмотрение математических ожиданий потерь показывает, что альтернатива а3 лучше. Объективный способ выбора критерия отсутствует. Ранее указывалось, что при принятии решений многое определяется личным вкусом. Это справедливо даже в теории принятия решений, так как критерий (математическое ожидание потерь, минимакс или какой-либо другой) выбирается субъективно.
Стратегии. В зависимости от конкретных условий рассматриваемой задачи возможны различные варианты изложенной выше методики принятия решений. Часто, например, ситуация такова, что можно использовать определенную стратегию. Обычно это имеет место тогда, когда должен приниматься ряд аналогичных решений. Стратегия есть план принятия решения.
Для иллюстрации стратегий достаточно рассмотреть простой пример принятия решения относительно плаща. Каждый день человек слушает прогноз погоды, и каждый день он должен решать, брать или не брать с собой плащ. На основании многолетнего опыта он узнал, что Бюро прогнозов дает один из следующих прогнозов: вероятность дождя p(9j) равна 0; 0,25; 0,50; 0,75 или 1,0. Кроме того, он узнал. что, когда бюро прогнозов утверждает, что р(01)=0, в действительности в 5% случаев идет дождь. Другая информация такого рода дается в табл. 16.3. Эту информацию следует рассматривать как экспериментальные данные, помогающие принять решение. Теперь, имея эти данные, можно
Таблица 16.3 Вероятности того, что прогноз погоды будет правилен (пример с плащом)
Прогноз | Внешние условия | |
дождь в, | нет дождя 62 | |
р(в,) = 0,25 р(02) = 0,50 р(93) = 0,75 | 0,10 0,20 0,25 | 0,20 0,15 0,10 |
р(64) = 1,00- | 0,40 | 0,05 |
определить стратегии. Возможные стратегии сведены в табл. 16.4. Например, стратегия St требует выбирать альтернативу а2, когда, согласно прогнозу, вероятность дождя р(61) равна 0, 0,25 или 0,50, а в противном случае — выбирать альтернативу а. Стратегия 5.2 требует брать плащ, (альтернатива %) всегда и т. д. Здесь приведены четыре стратегии, однако их может быть значительно больше.
Когда стратегии перечислены, можно определить вероятности различных альтернатив. Обратите внимание на то, что в табл. 16.3 даются различные вероятности того, что может пойти дождь. Таким образом, в день, когда может пойти дождь (бд}, существует вероятность, равная 0,05, того, что прогнозом будет р(в1)=0, и т. д. В данном случае стратегия 8г требует, чтобы при р(61), равной 0, 0,25 и 0,50, выбиралась альтернатива а2, что, согласно табл. 16.3, будет иметь место в 35% случаев. Следовательно, для стратегии Si и внешнего условия 6j вероятность альтернативы аа равна 0,35, а вероятность альтернативы ах равна 0,65. Вероятности других альтернатив находятся аналогично; они приводятся в табл. 16.5.
Таблица 16.5 Вероятность различных альтернатив в примере с плащом
Альтернативы | ||||
Прогноз | а, аг | О-i а2 | а, аг | а, аг |
0,65 0,35 | 1,00 0 | 0,40 0,60 | 0 1,00 | |
62 | 0,85 0,15 | 1,00 0 | 0,05 0,95 | 0 1,00 |
После определения вероятностей различных альтернатив при каждом внешнем условии можно определить средние потери при различных стратегиях. При выборе стратегии <Sb когда выполняется условие 0!, вероятность альтернативы % составляет 0,65, и из табл. 16.1 находим, что потеридля (аь 6,) равны 1. Вероятность альтернативы а2 равна 0,35, и соответствующие потери равны 7. Таким образом, средние потери равны
0,65x1+0,35x7 = 3,10.
При внешнем условии 62 средние потери составляют 0,85x2 + 0,15x0=1,70.
Значения 3,10 и 1,70 представляют собой средние потери при выборе стратегии 5Х соответственно при условиях 0Х и 02. В табл. 16.6 показаны средние потери для других стратегий.
Таблица 16.6 Средние потери в примере с плащом
S, | S2 | S,, | S | |
3,10 | 1,00 | 4,60 | 7,00 | |
62 | 1,70 | 2,00 | 0,10 | 0,00 |
Заметим, что по содержанию табл. 16.6 очень похожа на табл. 16.1. Действительно, стратегии 52 и S4 в точности соответствуют данным из табл. 16.1, однако стратегии St и S3 совсем иные. Таблица дает средние потери, получаемые тогда, когда данной стратегии придерживаются в течение некоторого промежутка времени.
Имея данные, приведенные в табл. 16.6 для выбора наилучшей стратегии, можно непосредственно использовать метод минимакса. Для этого нужно выбрать стратегию, при которой максимальные потери составляют 2,0.
Чтобы можно было использовать математическое ожидание потерь, необходимо получить данные о среднем числе дней 0j и 62. Допустим, что путем изучения фактических данных установлено, что в рассматриваемом районе 10% дней являются дождливыми. Тогда для каждой стратегии математическое ожидание потерь es можно вычислить cле дующим образом:
Е31 =0,10x3,10 + 0,90x1,70=1,84, ESi =0,10x1,00 + 0,90x2,00=1,90, Esa =0,10x4,60 + 0,90x0,10 = 0,55, Est =0,10x7,00 + 0,90x0,00 = 0,70.
На основе вычисленных таким путем математических ожиданий наилучшей является стратегия Sa, и снова выбор оказался несколько менее консервативным, чем при использовании минимакса. Существенно, однако, то, что при применении любого из этих методов каждая из стратегий (5Х или S3) оказывается лучше соответствующей стратегии S2 или S4, принимаемых при негибких планах, не допускающих выбора.
Смешанные стратегии.Можно получить также стратегии, основанные на случайности. Например, возможна такая стратегия: «если бюро прогнозов дает прогноз р(61) = =0,25, я буду случайным образом выбирать стратегии а и а2, с тем чтобы р(Э2)=0,25». Такие стратегии здесь не будут рассматриваться подробно, однако они довольно часто встречаются в теории игр, где их случайный характер не позволяет противнику раскрыть план на данный день, поскольку плана не существует.
В этом разделе были изложены основные идеи теории принятия решений. Как уже указывалось в начале раздела., теория принятия решений пока еще не получила сколько-нибудь существенного применения в административном управлении инженерным проектированием. Этот метод находит некоторое применение в административном управлении торгово-промышленными предприятиями и при анализе военно-стратегических решений. Вопрос о возможности его применения в инженерной практике предлагается решить самим читателям.