Принятие решений в условиях риска
Задача о линейной регрессии
Предположим, что Х, Y – случайные величины, которые «связаны» какой-то зависимостью. Наша цель – построить такую функцию, которая бы позволяла для любого значения аргумента х «угадывать» значение случайной величины Y, соответствующее ситуации «{X = x}»:
y = а + kx (1),
где а, k – функции от выборки, т.е. а = a(X1 ,Y 1, ..., Xn ,Yn),
k = k(X1 ,Y 1, ..., Xn ,Yn) и X1, ..., Xn ; Y 1, ..., ,Yn - выборочные значения величин Х и Y, соответственно.
Предположим, что у второго игрока имеется стратегия:
θ = (X1 ,Y 1, ..., Xn ,Yn),
а первый игрок в качестве стратегии δ = (a,k) может использовать любую линейную функцию
δ = a + kх
При рассмотрении этой задачи как задачи о наименьшихквадратах, функция платежей задается так:
Тогда решением задачи о наименьших квадратах будет стратегия δ* = (a*,k*), для которой потери будут наименьшими:
.
Для нахождения экстремума составляется система:
.
Решая эту систему, находим
где – выборочное среднее Х;
– выборочное среднее Y;
– выборочная дисперсия Х;
– выборочный центрированный смешанный момент.
Таким образом, искомая линейная функция имеет вид:
Рассмотрим другую постановку этой задачи – как задачу о линейной регрессии. Пусть Х – неслучайная величина, а Y нормально распределенная случайная величина с параметрами
Линейную функцию (1) будем искать в виде
где α*, β* – какие-то оценки для параметров α, β. Поскольку оценки максимального правдоподобия обладают многими хорошими свойствами, остановимся на них.
Для построения оценок максимального правдоподобия рассмотрим функцию правдоподобия:
Логарифмическая функция правдоподобия:
Составляется система:
.
Решения этой системы и будут искомыми оценками:
Таким образом, искомая линейная функция найдена:
В данном подходе прогнозируется среднее значение случайной величины Y.
Задачи к § 12
12.1.Для исследования зависимости объемов производства (Y) от основных фондов (Х) получены данные по 8 предприятиям (в млн. руб.) за год:
(12, 210), (17, 220), (22, 230), (27,240),
(32, 250), (37, 260), (42, 270), (47, 280).
Найти уравнение линейной регрессии Y по X, отражающее зависимость объема производства от основных фондов.
12.2. Рассмотрим данные по совокупному денежному доходу населения (X) и по величине прожиточного минимума (Y) с 1992 по 1998 гг:
(7,1; 1,9), (79,9; 20,6), (360,9; 86,6), (942,3; 264,1),
(1374,5; 369,4), (1643,3; 411,2), (1700,4; 493,3).
Найти уравнение линейной регрессии Y по X, построить линию регрессии.
Как и в случае принятия решения в условиях неопределенности здесь решение принимается в условиях ограниченности или неточности информации. Степень неполноты данных выражается через функцию распределения. С точки зрения наличия исходных данных определенность и неопределенность представляет два крайних случая, а риск определяет промежуточную ситуацию.
Мы будем рассматривать следующие критерии принятия решения в условиях риска:
1) критерий ожидаемого значения (прибыль или расход);
2) комбинация ожидаемого значения и дисперсии;
3) критерий известного предельного уровня;
4) критерий наиболее вероятного события в будущем.
1. Критерий ожидаемого значения
Количественно этот критерий можно выразить в денежных единицах или в единицах полезности денег. Продемонстрируем это на примере. Предположим, что инвестиции $20 тыс. дают с равными вероятностями либо нулевой доход, либо $100 тыс. В денежных единицах ожидаемый доход составляет:
0,5·0 + 0,5·100 – 20 = $30 тыс.
Можно принять решение о вложении денег, однако это решение не в равной степени приемлемо для всех вкладчиков. Допустим имеются два вкладчика А и В. У А средства ограничены и потеря $20 тыс. приведет его к банкротству. В имеет средства, значительно превышающие $20 тыс., это бездействующий капитал и он может рисковать.
Предположим, что Z – случайная величина с математическим ожиданием EZ и дисперсией DZ. Пусть имеется выборка z1, z2,…, zn объема n. Тогда выборочное среднее равно .
Выборочное среднее имеет дисперсию
При n → ∞ .
Отсюда, можно сделать следующий вывод: использование критерия ожидаемого значения допустимо лишь в том случае, когда одно и то же решение приходится принимать достаточно большое число раз.
Пример 1.Предположим, что есть необходимость профилактического ремонта оборудования. Требуется принять решение о том, когда следует проводить ремонт какого-либо станка чтобы минимизировать потери. Если весь временной отрезок разбит на равные периоды, то решение заключается в определении оптимального числа периодов между двумя ремонтами.
Предположим, что имеется n станков, через Тинтервал времени выполняется профилактический ремонт всех n станков.
Определить оптимальное значение Т, при котором минимизируются затраты на ремонт вышедших из строя станков и проведение профилактического ремонта в расчете на один интервал времени.
Пусть pt – вероятность выхода из строя одного станка в момент времени Т; nt – случайная величина, число вышедших из строя станков (имеет биномиальное распределение с параметрами n, pt, таким образом математическое ожидание Ent = npt); c1 – затраты на ремонт вышедшего из строя станка; c2 – затраты на профилактический ремонт; EC(T) – ожидаемые затраты за один интервал времени. Из условий получим
Требуется найти значение Т, удовлетворяющее условиям
.
Покажем это на нашем примере.
Пусть c1 = 100, c2 = 10, n = 50. Составим следующую таблицу:
T | Pt | EC(T) | |
0,05 | |||
0,07 | 0,05 | ||
0,10 | 0,12 | 366,7 | |
0,13 | 0,22 | ||
0,18 | 0,35 |
Из таблицы видно, что Т* = minT = 366,7. Т.е. ремонт следует производить через 3 периода.
2. Критерий ожидаемое значение – дисперсия
Предположим, что z – случайная величина с дисперсией Dz. Выборочное среднее имеет дисперсию .
Если дисперсия Dz уменьшается, то дисперсия также уменьшается, и это означает, что вероятность того, что будет приближаться к Ez, увеличивается.
В условиях этого критерия выбирается:
max{Ez – kDz} или min{Ez + kDz},
где k – уровень не склонности к риску (постоянная величина).
Пример 2. В условиях предыдущего примера посчитаем дисперсию затрат за один период времени.
,
где nt – случайная величина, которая имеет биномиальное распределение (nt ~ Dnt = npt(1-pt)).
Выбираем то значение Т, которое удовлетворяет:
min{EC(T) + kDC(T)}.
Пусть k = 1, c1 = 100, c2 = 10, n = 50.
T | pt | pt2 | EC(T)+DC(T) | ||
0,05 | 0,0025 | ||||
0,07 | 0,0049 | 0,05 | 0,025 | 6312,5 | |
0,10 | 0,01 | 0,12 | 0,074 | 6622,22 | |
0,13 | 0,0169 | 0,22 | 0,0174 | 6731,25 | |
0,18 | 0,0324 | 0,35 | 0,0343 |
Из таблицы находим Т* = minT = 500.