Теория принятия решений

Как указывалось в гл. 11, существенной чертой процесса принятия решений является возможность выбора альтернативных линий поведения. Теория принятия решений тре­бует определения некоторых понятий, с тем чтобы придать элементам процесса принятия решений большую точность и конкретность.

Альтернативные линии поведения.Обозначим возмож­ные действия (альтернативы) через alt а2, а3, ..., ап. В обы­денном примере человек, идя на работу, может взять с собой плащ г) или не брать его (аа). Инженер, участвующий в разработке искусственного спутника Земли, в качестве ма­териала для его корпуса может выбрать, например, алюми­ний, сталь или титан. Эти альтернативы можно обозначить соответственно через аь аа и а3.

Внешние условия.Обычно существуют условия, которые неподконтрольны лицу, принимающему решения. Мы назо­вем их внешними условиями, и для их обозначения здесь бу­дет использован символ 0. Например, может идти дождь (Qi), или дождя может не быть (Э2).

В случае разработки корпуса спутника внешними усло­виями являются размер и частота появления метеоритных тел, с которыми будет сталкиваться спутник. Природное явление такого рода является скорее непрерывным, чем дискретным. (Дождь ведь тоже явление непрерывного типа. Так, дождя может не быть, он может моросить, слегка накра­пывать и т. д.) Обычно такие ситуации описываются путем деления непрерывного распределения природного явления на произвольное удобное число дискретных состояний. До­пустим поэтому, что метеорные потоки, которые может встре­тить спутник, описываются следующим образом: Q1— очень разреженный поток, 92— разреженный, 63— средний, 64— плотный, 9Б— очень плотный. На практике должно быть за­дано конкретное определение этих состояний, однако здесь для иллюстрации даются лишь качественные определения.

Потеря или выигрыш. Полезность.Таким образом, при­нимая решение, исходят из того, что некоторые цели, харак­теризуемые разной степенью желательности, достигаются с различной степенью достоверности при различном выборе альтернативных линий поведения. Конкретная линия пове­дения имеет, разумеется, вероятность успеха несколько меньше единицы. Теперь можно составить так называемую таблицу (или матрицу) потерь. Для каждой заданной комби­нации «линия поведения—внешнее условие» имеют место определенные затраты. В данном случае «затратами» могут быть деньги, однако к ним могут относиться и многие другие факторы, например время, престиж, потеря невосполни­мых ресурсов и т. д. Все эти факторы могут измеряться од­ним показателем, называемым полезностью. Полезность мож­но рассматривать как некоторого рода обобщенные потери или выигрыш, когда все ценности приведены к одной шкале. Теория полезности рассматривается в разд. 16.3, а пока что мы предположим, что шкалы полезности уже рассчитаны и получены таблицы потерь: табл. 16.1 для примера с плащом и табл. 16.2 для конструкции спутника.

Таблица 16.1 Таблица потерь для примера с плащом

 

  Внешние условия
Линия   поведения дождь нет дождя
  «1 е2
Взять плащ, aj
Не брать плаща, а2

Таблица 16.2 материала Таблица потерь для случая выбора корпуса спутника

 

Линия Внешние условия
поведения          
  65
%
а2
gs

 

Если полезность естественным образом приводит к вы­игрышу, а не к потерям, то выигрыш можно легко превра­тить в потери, просто вычитая из каждой величины значение наибольшего выигрыша. Тогда все элементы будут отрицательны либо равны нулю. Поскольку отрицательный вы­игрыш есть потеря, то знак минус можно опустить, и в ре­зультате получим таблицу потерь.

Вероятности, характеризующие внешние условия. Как можно видеть, вопрос может значительно усложниться, если вероятности различных потерь различны. Например, при условии 82 выбор альтернативы % с вероятностью р может привести к потерям LT и с вероятностью р2 — к потерям L2. Однако в данном примере, который дается здесь лишь для иллюстрации, мы рассмотрим только вероятности, отне­сенные к различным внешним условиям. Пусть Бюро прогно­зов установило, что вероятность дождя р(81)=0,30, а веро­ятность отсутствия осадков р(62)=0,70, и пусть в результате запуска предыдущих спутников получена следующая ин­формация:

 

Внешнее условие Вероятность
Q1 0,10
Q2 0,20
Q 3 0,40
Q4 0,20
Q5 0,10    

Математическое ожидание потерь. Теперь можно вычис­лить математическое ожидание потерь при выборе каждой возможной линии поведения. Напомним, что математичес­кое ожидание случайной величины х равно

поэтому для простого примера с плащом математические ожидания потерь при выборе альтернатив ах и а2 составят соответственно

Еа, =0,30x1 + 0,70x2 = 1,7, £йа =0,30x7 + 0,70x0 = 2,1.

Таким образом, чтобы минимизировать ожидаемые потери., нужно принять альтернативу а1( т. е. взять с собой плащВ примере выбора материала для корпуса спутника ма­тематические ожидания потерь равны

£в, =0,1x2 + 0,2x7 + 0,4x12 + 0,2x12 + 0,1x12=10,0, Еаг =0,1x5+0,2x5 + 0,4x10 + 0,2x15 + 0,1x15 = 10,0, £аз =0,1x6 + 0,2x6 + 0,4x6 + 0,2x11+0,1 х 16 = 8,0.

Таким образом, модель, построенная на основе теории при­нятия решений, указывает, что инженеру следует выбрать альтернативу аа. (Цифры в этом примере условны и не обя­зательно должны в точности соответствовать реальной си­туации.)

Минимакс. Хотя, принимая решение, по-видимому, ра­зумно использовать в качестве критерия математическое ожи­дание потерь, все же иногда в этом случае могут применять­ся и другие критерии. Одним из обычных показателей явля­ется минимакс. Этот метод требует минимизации максималь­ных потерь. Таким образом, этот консервативный критерий гласит: выбирайте стратегию, при которой вероятность боль­ших потерь минимальна. В примере с плащом максимальные потери составляют 7 при выборе альтернативы а2 и 2 при выборе аа. Таким образом, минимакс требует выбора аль­тернативы аг. Заметим, что иллюстрацией консервативности этого метода является то, что он требует выбора альтерна­тивы а1 независимо от прогноза погоды.

В примере с выбором материала для корпуса спутника максимальные потери составляют 12 для альтернативы аь 15 для а2, 16 для а3. Минимальное значение максимальных потерь равно 12 (при выборе альтернативы а^}. Метод минимакса рекомендует выбор альтернативы аг, в то время как рассмотрение математических ожиданий потерь показы­вает, что альтернатива а3 лучше. Объективный способ выбо­ра критерия отсутствует. Ранее указывалось, что при принятии решений многое определяется личным вкусом. Это справедливо даже в теории принятия решений, так как критерий (математическое ожидание потерь, минимакс или какой-либо другой) выбирается субъективно.

Стратегии. В зависимости от конкретных условий рас­сматриваемой задачи возможны различные варианты изло­женной выше методики принятия решений. Часто, напри­мер, ситуация такова, что можно использовать определенную стратегию. Обычно это имеет место тогда, когда должен приниматься ряд аналогичных решений. Стратегия есть план принятия решения.

Для иллюстрации стратегий достаточно рассмотреть про­стой пример принятия решения относительно плаща. Каж­дый день человек слушает прогноз погоды, и каждый день он должен решать, брать или не брать с собой плащ. На основании многолетнего опыта он узнал, что Бюро прогно­зов дает один из следующих прогнозов: вероятность дождя p(9j) равна 0; 0,25; 0,50; 0,75 или 1,0. Кроме того, он узнал. что, когда бюро прогнозов утверждает, что р(01)=0, в дей­ствительности в 5% случаев идет дождь. Другая информа­ция такого рода дается в табл. 16.3. Эту информацию сле­дует рассматривать как экспериментальные данные, помо­гающие принять решение. Теперь, имея эти данные, можно

Таблица 16.3 Вероятности того, что прогноз погоды будет правилен (пример с плащом)

 

Прогноз Внешние условия
    дождь в, нет дождя 62
р(в,) = 0,25 р(02) = 0,50 р(93) = 0,75 0,10 0,20 0,25 0,20 0,15 0,10
р(64) = 1,00- 0,40 0,05

определить стратегии. Возможные стратегии сведены в табл. 16.4. Например, стратегия St требует выбирать аль­тернативу а2, когда, согласно прогнозу, вероятность дождя р(61) равна 0, 0,25 или 0,50, а в противном случае — выби­рать альтернативу а. Стратегия 5.2 требует брать плащ, (альтернатива %) всегда и т. д. Здесь приведены четыре стра­тегии, однако их может быть значительно больше.

Когда стратегии перечислены, можно определить веро­ятности различных альтернатив. Обратите внимание на то, что в табл. 16.3 даются различные вероятности того, что может пойти дождь. Таким образом, в день, когда может пойти дождь (бд}, существует вероятность, равная 0,05, того, что прогнозом будет р(в1)=0, и т. д. В данном случае стра­тегия 8г требует, чтобы при р(61), равной 0, 0,25 и 0,50, вы­биралась альтернатива а2, что, согласно табл. 16.3, будет иметь место в 35% случаев. Следовательно, для стратегии Si и внешнего условия 6j вероятность альтернативы аа равна 0,35, а вероятность альтернативы ах равна 0,65. Ве­роятности других альтернатив находятся аналогично; они приводятся в табл. 16.5.

Таблица 16.5 Вероятность различных альтернатив в примере с плащом

 

  Альтернативы
Прогноз а, аг О-i а2 а, аг а, аг
0,65 0,35 1,00 0 0,40 0,60 0 1,00
62 0,85 0,15 1,00 0 0,05 0,95 0 1,00

После определения вероятностей различных альтерна­тив при каждом внешнем условии можно определить средние потери при различных стратегиях. При выборе стратегии <Sb когда выполняется условие 0!, вероятность альтернати­вы % составляет 0,65, и из табл. 16.1 находим, что потеридля (аь 6,) равны 1. Вероятность альтернативы а2 равна 0,35, и соответствующие потери равны 7. Таким образом, средние потери равны

0,65x1+0,35x7 = 3,10.

При внешнем условии 62 средние потери составляют 0,85x2 + 0,15x0=1,70.

Значения 3,10 и 1,70 представляют собой средние потери при выборе стратегии 5Х соответственно при условиях 0Х и 02. В табл. 16.6 показаны средние потери для других стра­тегий.

Таблица 16.6 Средние потери в примере с плащом

 

  S, S2 S,, S
3,10 1,00 4,60 7,00
62 1,70 2,00 0,10 0,00

Заметим, что по содержанию табл. 16.6 очень похожа на табл. 16.1. Действительно, стратегии 52 и S4 в точности со­ответствуют данным из табл. 16.1, однако стратегии St и S3 совсем иные. Таблица дает средние потери, получаемые тог­да, когда данной стратегии придерживаются в течение не­которого промежутка времени.

Имея данные, приведенные в табл. 16.6 для выбора наи­лучшей стратегии, можно непосредственно использовать метод минимакса. Для этого нужно выбрать стратегию, при которой максимальные потери составляют 2,0.

Чтобы можно было использовать математическое ожида­ние потерь, необходимо получить данные о среднем числе дней 0j и 62. Допустим, что путем изучения фактических данных установлено, что в рассматриваемом районе 10% дней являются дождливыми. Тогда для каждой стратегии математическое ожидание потерь es можно вычислить cле дующим образом:

Е31 =0,10x3,10 + 0,90x1,70=1,84, ESi =0,10x1,00 + 0,90x2,00=1,90, Esa =0,10x4,60 + 0,90x0,10 = 0,55, Est =0,10x7,00 + 0,90x0,00 = 0,70.

На основе вычисленных таким путем математических ожи­даний наилучшей является стратегия Sa, и снова выбор ока­зался несколько менее консервативным, чем при использо­вании минимакса. Существенно, однако, то, что при приме­нении любого из этих методов каждая из стратегий (5Х или S3) оказывается лучше соответствующей стратегии S2 или S4, принимаемых при негибких планах, не допускающих выбора.

Смешанные стратегии.Можно получить также страте­гии, основанные на случайности. Например, возможна та­кая стратегия: «если бюро прогнозов дает прогноз р(61) = =0,25, я буду случайным образом выбирать стратегии а и а2, с тем чтобы р(Э2)=0,25». Такие стратегии здесь не бу­дут рассматриваться подробно, однако они довольно часто встречаются в теории игр, где их случайный характер не позволяет противнику раскрыть план на данный день, по­скольку плана не существует.

В этом разделе были изложены основные идеи теории принятия решений. Как уже указывалось в начале раздела., теория принятия решений пока еще не получила сколько-нибудь существенного применения в административном управлении инженерным проектированием. Этот метод на­ходит некоторое применение в административном управле­нии торгово-промышленными предприятиями и при анали­зе военно-стратегических решений. Вопрос о возможности его применения в инженерной практике предлагается ре­шить самим читателям.