Ссылка на архив

Теория принятия решений

Министерство образования и науки Украины

Запорожская государственная инженерная академия


Теория принятия решений

Учебно-методическое пособие


Ю.О. Матузко

Запорожье 2009


Содержание

Ведение

Раздел 1. Основные понятия и структура исследования операций

Раздел 2. Принятие решения в условиях риска

2.1 Постановка задачи

2.2 Критерий Байеса

2.3 Критерий Лапласа (Бернулли)

2.4 Критерий Гермейера

2.5 Критерий Ходжа-Лемана

Раздел 3. Принятие решения в условиях неопределенности

3.1 Принцип максимина

3.2 Критерий азартного игрока

3.3 Критерий произведений

3.4 Критерий Сэвиджа

3.5 Критерий Гурвица

Раздел 4. Принятие решения в условиях противодействия

4.1 Матричные игры

4.2 Матричные игры, разрешимые в чистых стратегиях

4.3 Матричные игры, разрешимые в смешанных стратегиях

4.3.1 Постановка задачи

4.3.2 Решение задачи симплекс-методом

4.3.3 Решение задачи графическим методом

Раздел 5. Принятие решения в условиях нескольких критериев выбора40

5.1 Постановка задачи, основные понятия

5.2 Линейные свёртки

5.3 Максиминная и лексикографическая свёртки

5.4 Мультипликативные свёртки

5.5 Многокритериальный выбор на языке бинарных отношений

Раздел 6. Принятие корпоративных решений

6.1 Групповая оценка объектов

6.2 Определение коэффициентов компетентности экспертов

Раздел 7. Критерии модульного оценивания знаний

Раздел 8. Задания для самостоятельной работы студентов

8.1 Домашняя контрольная работа

8.2 Вопросы к модульным тестированиям

8.3 Контрольные вопросы к экзамену по дисциплине

Учебно-методический материал по дисциплине

(принцип математического ожидания) предполагает полное доверие ЛПР известным вероятностям состояний окружающей среды. Следовательно, данная задача – это задача принятия решения в условиях риска.

Показатель эффективности стратегии Аi по критерию Байеса находится по формуле:

Z =  ,

гдеm – количество строк матрицы, заданной в условии;

n – количество столбцов матрицы, заданной в условии;

qj – заданные вероятности ;

аij – элементы матрицы, заданной в условии.

Для случая оптимизации потерь критерий будет таким:

Z =  #

Заметим, что  – это математическое ожидание стратегии Аi . Таким образом, исходную матрицу необходимо дополнить справа еще одним столбцом, в который нужно внести значения математических ожиданий всех стратегий:

Пример вычислений для первой строки:

 = 0,33 + 0,27 + 0,153 + 0,115 + 0,256 = 0,6 + 1,4 + 0,45 + 1,5 + 1,5 = 5,75

Далее в добавленном столбце нужно найти наибольший элемент (наибольшее математическое ожидание). Строка, в которой он стоит и будет оптимальной стратегией. Необходимо заметить, что наибольших элементов может быть несколько, тогда и оптимальных стратегий соответственно будет несколько.

В нашем случае наибольший элемент 5,95 (в матрице он выделен). Таким образом, в нашем примере оптимальной стратегией будет А3, т.е. средства фонда вам нужно вложить в третий проект.

Ответ А3 .


2.3 Критерий Лапласа (Бернулли)

Критерий Лапласа (принцип недостаточного основания) предполагает недоверие ЛПР известным вероятностям состояний окружающей среды. Вероятности состояний окружающей среды считаются одинаковыми и равными  . Следовательно, данная задача – это задача принятия решения в условиях риска с вероятностями  .

Показатель эффективности стратегии Аi по критерию Лапласа находится аналогично критерию Байеса с вероятностями  :

Z =  =  ,

Заметим, что нет необходимости вычислять эти математические ожидания. Достаточно просто просуммировать элементы строк матрицы и выбрать из них максимальную сумму:

Z =

Для случая оптимизации потерь критерий будет таким:

Z =  #

Таким образом, исходную матрицу необходимо дополнить справа еще одним столбцом, в который нужно внести значения сумм элементов строк всех стратегий:

Далее в добавленном столбце нужно найти наибольший элемент. Строка, в которой он стоит и будет оптимальной стратегией. Необходимо заметить, что наибольших элементов может быть несколько, тогда и оптимальных стратегий соответственно будет несколько.

В нашем случае наибольший элемент в добавленном столбце 34 (в матрице он выделен). Таким образом, в нашем примере оптимальной стратегией будет А1 , т.е. инвестор должен выбрать для вложения первый проект.

Ответ А1 .

2.4 Критерий Гермейера

Критерий Гермейера применяется для задач принятия решений в условиях риска.

Он применяется в основном для решения задач выбора для оптимизации величины потерь или затрат. Такие задачи довольно часто встречаются в хозяйственной практике. Матрица потерь, задаваемая в условии, будет содержать отрицательные элементы (потери выражаются отрицательными величинами). Если в матрице помимо отрицательных будут и положительные элементы, то исходная матрица потерь преобразуется в матрицу, содержащую только отрицательные элементы по правилу:

аij – с ,

где с – некое выбранное ЛПР положительное число.

Следует иметь в виду, что оптимальное решение зависит от выбора с.

Критерий Гермейера применяется и для оптимизации величины прибыли (как в нашей задаче), т.е. для положительных матриц.

В общем случае Гермейер предложил ввести в рассмотрение матрицу с такими элементами:

Построим новую матрицу для нашего примера:

Далее к этой матрице применяется принцип максимина. Показатель эффективности стратегии Аi при этом находится по формуле:

Таким образом, новую матрицу необходимо дополнить справа еще одним столбцом, в который нужно внести наименьшие значения элементов каждой строки.

Затем из элементов добавленного столбца нужно выбрать наибольший. Строка, в которой он стоит и будет оптимальной стратегией.

В нашем случае наибольший элемент в добавленном столбце 16 (в матрице он выделен). Таким образом, в нашем примере оптимальной стратегией будет А3, т.е. инвестор должен выбрать для вложения третий проект.

Ответ А3 .

2.5 Критерий Ходжа-Лемана

Критерий Ходжа-Лемана привносит фактор определенной субъективности при принятии решения.

Решение принимается в условиях риска. Однако у ЛПР есть некое недоверие к распределению вероятностей состояний окружающей среды. Поэтому ЛПР вводит некий "коэффициент доверия" l к вероятностям состояний окружающей среды (0 £ l £ 1). Чтобы сильно не рисковать, обычно таким коэффициентом берут 0,4. Этот коэффициент ещё называют уровнем оптимизма.

Показатель эффективности стратегии Аi по критерию Ходжа-Лемана находится по формуле:

Z =  ,

#Для случая оптимизации потерь критерий будет таким:

Z =  #

Таким образом, исходную матрицу необходимо дополнить справа еще тремя столбцами. В первый нужно внести значения математических ожиданий всех стратегий, умноженных на уровень оптимизма l = 0,4. Во второй нужно внести значения наименьших элементов всех строк, умноженных на уровень пессимизма 1 – l = 1 – 0,4 = 0,6 . В третий добавленный столбец внесем сумму значений первых двух добавленных столбцов:

Пример вычислений для первой строки:

 = 0,4  (0,33 + 0,27 + 0,153 + 0,115 + 0,256) = 0,4  5,75 = 2,3

 = 0,6  3 = 1,8

Z1 = 2,3 + 1,8 = 4,1

Далее в добавленном столбце нужно найти наибольший элемент. Строка, в которой он стоит и будет оптимальной стратегией.

В нашем случае наибольший элемент 4,78 (в матрице он выделен). Таким образом, в нашем примере оптимальной стратегией будет А3, т.е. инвестор для вложения должен выбрать третий проект.

Ответ А3 .


максимина (критерий Вальда) предполагает полное недоверие ЛПР известным вероятностям состояний окружающей среды. Либо же вероятности состояний окружающей среды считаются неизвестными. Следовательно, данная задача – это задача принятия решения в условиях неопределенности.

При неопределенности выбор наилучшей стратегии может основываться на введении различных разумных гипотез о поведении окружающей среды.

Одна из важнейших и основополагающих гипотез такого типа называется гипотезой антагонизма. Она состоит в предположении, что окружающая среда ведет себя наихудшим для ЛПР образом. На этой гипотезе основывается принцип максимина, называемый также принципом гарантированного результата.

Показатель эффективности стратегии Аi по критерию максимина находится по формуле:

Z =

Для случая оптимизации потерь критерий превратится в минимаксный и будет таким:


Z = #

Таким образом, исходную матрицу необходимо дополнить справа еще одним столбцом, в который нужно внести значения минимальных элементов каждой строки.

Затем из элементов добавленного столбца нужно выбрать наибольший. Строка, в которой он стоит и будет оптимальной стратегией.

Выбранные таким образом альтернативы полностью исключают всякий риск! Это означает, что ЛПР не может столкнуться с худшим результатом, чем тот на который он ориентируется. В силу этого принцип максимина является принципом крайнего пессимизма ЛПР (принципом наибольшей осторожности).

Как бы ни вела себя окружающая среда, результат не может оказаться ниже значения критерия максимина! Это свойство делает принцип максимина наиболее применяемым на практике, особенно в случаях, где от конечного результата зависят жизни людей.

Народная интуиция уже веками непроизвольно использует принцип максимина. Это подтверждается такими поговорками как "Семь раз отмерь – один раз отрежь", "Береженого бог бережет", "Лучше синица в руках, чем журавль в небе".

В нашем случае наибольший элемент в добавленном столбце 4 (в матрице он выделен). Таким образом, в нашем примере оптимальной стратегией будет А3, т.е. инвестор должен выбрать для вложения средств третий проект.

Ответ А3 .


3.2 Критерий азартного игрока

Критерий азартного игрока (принцип максимакса) – это диаметральная противоположность принципу максимина, он тоже применяется при принятии решения в условиях неопределенности. Критерий азартного игрока допустим в случаях очень низкого риска, а также когда выигрыш намного превышает возможные потери.

Показатель эффективности стратегии Аi по критерию азартного игрока находится по формуле:

Z =

Для случая оптимизации потерь критерий будет таким:

Z = #

Таким образом, исходную матрицу необходимо дополнить справа еще одним столбцом, в который нужно внести значения максимальных элементов каждой строки.

Затем из элементов добавленного столбца нужно выбрать наибольший. Строка, в которой он стоит и будет оптимальной стратегией.

В нашем случае наибольший элемент в добавленном столбце 15 (в матрице он выделен). Таким образом, в нашем примере оптимальной стратегией будет А1, т.е. инвестор должен выбрать для вложения первый проект.

Применение критерия азартного игрока народная мудрость выразила пословицей "Кто не рискует, тот не пьет шампанского".

Ответ А1 .


3.3 Критерий произведений

Критерий произведений тоже применяется при принятии решения в условиях неопределенности. Это более нейтральный критерий по сравнению с принципом максимина и критерием азартного игрока. Критерий произведений производит некое "выравнивание" между большими и малыми значениями аij .

Показатель эффективности стратегии Аi по критерию произведений находится по формуле:

Z =

Для случая оптимизации потерь критерий будет таким:

Z =  #

Таким образом, исходную матрицу необходимо дополнить справа еще одним столбцом, в который нужно внести значения произведений всех элементов каждой строки.

Затем из элементов добавленного столбца нужно выбрать наибольший. Строка, в которой он стоит и будет оптимальной стратегией.

В нашем случае наибольший элемент в добавленном столбце 8640 (в матрице он выделен). Таким образом, в нашем примере оптимальной стратегией будет А3, т.е. инвестор должен выбрать для вложения третий проект.

Ответ А3 .


3.5 Критерий Сэвиджа

Решение опять принимается в условиях неопределенности.

Сэвидж предложил ввести в рассмотрение новую матрицу, элементы которой определяются по формуле:

rij =

Построим новую матрицу для нашего примера:

Пример вычислений для первого столбца:

= 6; r11 = 6 – 3 = 3; r21 = 6 – 4 = 2; r31 = 6 – 6 = 0; r41 = 6 – 3 = 3.

Построенная таким способом матрица называется "матрицей сожалений". И действительно, ведь каждый элемент rij выражает "сожаление" ЛПР по поводу того, что он не выбрал наилучшего решения по отношению к

Далее к матрице сожалений применяется критерий минимакса. Показатель эффективности стратегии Аi при этом находится по формуле:

Z =  =

Для случая оптимизации потерь критерий будет таким:

Z =  #

Таким образом, матрицу сожалений необходимо дополнить справа еще одним столбцом, в который нужно внести наибольшие значения элементов каждой строки.

Затем из элементов добавленного столбца нужно выбрать наименьший. Строка, в которой он стоит и будет оптимальной стратегией.

В нашем случае наименьший элемент в добавленном столбце 5 (в матрице он выделен). Таким образом, в нашем примере оптимальной стратегией будет А3, т.е. инвестор должен выбрать для вложения третий проект.

Ответ А3 .

3.6 Критерий Гурвица

Решение принимается в условиях неопределенности.

Гурвиц предложил критерий, показатель эффективности стратегии Аi при котором находится где-то между точками зрения крайнего оптимизма (критерий азартного игрока) и крайнего пессимизма (критерий максимина). Для этого вводят некий коэффициент l – уровень пессимизма. Выбор уровня пессимизма – процесс субъективный. Чаще всего его выбирают равным либо 0,6 либо 0,5. После этого показатель эффективности стратегии Аi по критерию Гурвица находится по формуле:

Z =

Для случая оптимизации потерь критерий будет таким:

Z = #

Таким образом, исходную матрицу необходимо дополнить справа еще тремя столбцами. В первый нужно внести значения наименьших элементов всех строк, умноженных на уровень пессимизма l = 0,6. Во второй нужно внести значения наибольших элементов всех строк, умноженных на уровень оптимизма 1 – l = 1 – 0,6 = 0,4 . В третий добавленный столбец внесем сумму значений первых двух добавленных столбцов:

Затем из элементов добавленного столбца нужно выбрать наибольший. Строка, в которой он стоит и будет оптимальной стратегией.

В нашем случае наибольший элемент в добавленном столбце 7,2 (в матрице он выделен). Таким образом, в нашем примере оптимальной стратегией будет А1, т.е. инвестор должен выбрать для вложения средств первый проект.

Ответ А1 .


Раздел 4. Принятие решения в условиях противодействия

4.1 Матричные игры

Раздел "Теории принятия решений" в условиях противодействия называется теорией игр. А так как в основном условия задач в "Теории принятия решений" задаются в виде матриц, то рассматриваемые конфликтные ситуации называются матричными играми. В матричных играх состояниями В1, В2, …, Вn управляет не беспристрастная природа, а активный противник, преследующий сугубо свои цели.

ЛПР, управляющий своими стратегиями (ходами) А1, А2, …, Аn, и его противник, управляющий стратегиями (ходами) В1, В2, …, Вn в данной ситуации называются игроками.

Элементы матрицы аij , заданной в условии, называются выигрышами(платежами) игрока А. А вся матрица называется матрицей платежей.

Далее возможны два случая. Если в матричной игре задана одна платежная матрица, то естественно предположить, что выигрыши первого игрока будут являться проигрышами второго игрока. Такая антагонистическая ситуация называется матричной игрой с нулевой суммой. Цель игры для первого игрока (ЛПР) – побольше выиграть, а для второго игрока – поменьше проиграть. Иными словами, цельюигры является определение оптимальной стратегии для каждого игрока – такой стратегии, при которой выигрыш первого игрока будет максимальным, а проигрыш второго игрока будет минимальным.

Однако, такая ситуация бывает не всегда. Зачастую в жизни ваш противник преследует сугубо свои цели, определенные своими выигрышами. В этом случае матричная игра задается двумя платежными матрицами. Или для краткости элементы одной платежной матрицы состоят из двух чисел: (аij, bij). Такая ситуация называется матричной игрой с ненулевой суммой. И для первого и для второго игроков цель игры – побольше выиграть.

Очевидно, что рассмотренная матричная игра предполагает, что каждый игрок делает только по одному ходу. Естественно, что многие конфликтные ситуации предполагают по нескольку ходов каждого игрока. Такие игры рассматриваются пошагово и решаются методами динамического программирования. На каждом отдельном шаге такая игра рассматривается как игра с одним ходом.

Матричные игры для двух игроков с нулевой и ненулевой суммой достаточно хорошо изучены и для них разработана теория оптимального поведения игроков.

Однако в жизненной практике в конфликтных ситуациях зачастую участвуют более чем две стороны. Чем больше игроков – тем больше проблем. Такие игры менее изучены и здесь есть просторное поле для новых фундаментальных научных исследований.

Несмотря на несколько легкомысленное звучание основных терминов, теория игр является строго научной дисциплиной с точными математическими выкладками.

На протяжении всего своего исторического пути развития человечество ежедневно сталкивается с конфликтными ситуациями: политическими, военными, экономическими, социальными и прочими, которые проявляются как в глобальных, так и в малых (вплоть до личных) формах. И если бы Человеку хватило бы ума в конфликтных ситуациях пользоваться не силой, не надеждой на "авось", а математикой, то жизнь наверняка была бы другой. Будем надеяться, что новое поколение, усвоив курс "Исследование операций" J, изменит жизнь к лучшему!

Итак, рассмотрим игру, в которой ЛПР противостоит "думающий" противник.

Возможны такие случаи:

1) Ходы игроками делаются одновременно.

2) Первым ходит игрок 2 – противник, но игрок 1 – ЛПР, не имеет информации о ходе противника.

3) Первым ходит игрок 2 – противник, но игрок 1 – ЛПР, знает о ходе противника.

4) Первым ходит игрок 1, но игрок 2 не имеет информации о ходе противника.

5) Первым ходит игрок 1, но игрок 2 знает о ходе противника.

Очевидно, что случаи 1), 2) и 4) идентичны – никто из игроков не знает о ходе противника ничего.

Рассмотрим случай 3). Так как ЛПР имеет полную информацию о ходе противника, то мы имеем ситуацию принятия решения в условиях полной определенности. Как уже отмечалось выше, такими задачами занимается математическое программирование.

Рассмотрим случай 5). Так как ЛПР ходит первым, то его противник наверняка выберет самую худшую для ЛПР стратегию. Поэтому в такой ситуации ЛПР необходимо принимать решение о своем ходе согласно принципу наибольшей осторожности, т.е. согласно принципу максимина. Это утверждение однозначно, легко математически доказывается и не должно подвергаться сомнению ни в каких жизненных ситуациях.

Итак, содержательны по своей сути только случаи 1), 2) и 4), которые сводятся к одному случаю. Это как мы видим, принятие решения в условиях неопределенности.

4.2 Матричные игры, разрешимые в чистых стратегиях

Рассмотрим парную конечную антагонистическую игру. Пусть игрок А располагает m личными стратегиями, которые обозначим А1, а2 ..., Аm. Пусть у игрока В имеется n личных стратегий, обозначим их В1, В2, ,.., Вn. Говорят, что игра имеет размерность m х n . В результате выбора игроками любой пары стратегий Аi и Вj (i = 1,2 …, m; j = 1,2, …, n).

Однозначно определяется исход игры, т.е. выигрыш аij игрока А (положительный или отрицательный) и проигрыш (-аij) игрока В . Предположим, что значения аij известны для любой пары стратегий (Аi Вj). Значения этих выигрышей заданы в платежной матрице

Строки этой таблицы соответствуют стратегиям игрока А , а столбцы – стратегиям игрока В .

С помощью хорошо нам знакомого принципа максимина найдем гарантированный наибольший выигрыш для игрока А:

Найденное число a называется нижней ценой игры.

Стратегия, соответствующая максимину, называется максиминной стратегией – она будет оптимальной стратегией игрока А.

Посмотрим на эту ситуацию с точки зрения второго игрока: ему необходимо уменьшить свои потери. В таком случае критерию максимина превратится в минимаксный и гарантированный наименьший проигрыш для игрока В будет таким:

Найденное число в называется верхней ценой игры

Стратегия, соответствующая минимаксу, называется минимаксной стратегией – она будет оптимальной стратегией игрока В.

Причем, для нижней и верхней цены игры всегда справедливо неравенство:

Если нижняя и верхняя цены игры совпадают, то общее значение верхней и нижней цены игры a = в = n называется чистой ценой игры, или ценой игры. Элемент платежной матрицы, в котором достигается чиста