Использование регрессионной модели для прогноза. Дисперсия ошибки прогноза.

Основное назначение регрессионной модели – использование ее для прогноза экономического показателя Y. Прогноз осуществляется подстановкой значения фактора в оценку детерминированной составляющей:

. (2.5.16)

Построим доверительный интервал для функции регрессии, т. е. для условного математического ожидания М(Y/xl), который с заданной надежностью (доверительной вероятностью) Р=1- накрывает неизвестное значение М(Y/xl).

Найдем дисперсию прогноза , представляющего собой выборочную оценку М(Y/xl). С этой целью уравнение (2.5.16) представим в виде:

 

. (2.5.17)

 

Дисперсия равна сумме дисперсий двух независимых (доказательство этого факта опускается) слагаемых выражения (2.5.17).

 

(2.5.18)

 

Здесь учтено, что – неслучайная величина, при вынесении которой за знак дисперсии ее необходимо возвести в квадрат.

Дисперсия выборочной средней

 

 

(2.5.19)

Для нахождения дисперсии воспользуемся формулой (2.5.15), т.е.

Найдем оценку дисперсии , учитывая (2.5.18), (2.5.19), (2.5.15) и заменяя ее оценкой .

 


(2.5.20)

 

Основываясь на предпосылках 1-5 регрессионного анализа, можно показать, что статистика

 

 

имеет распределение Стьюдента с ν=n-2 степенями свободы и построить доверительный интервал для условного математического ожидания

 

(2.5.21)

 

Из формул (2.5.20) и (2.5.21) видно, что величина доверительного интервала зависит от значения объясняющей переменной : при она минимальна, а по мере удаления от величина доверительного интервала увеличивается.

Ошибку прогноза можно представить следующим образом

(2.5.22)

Первая скобка представляет собой ошибку, вызванную наличием случайной составляющей ε. Ее дисперсия равна .

Вторая скобка представляет собой ошибку оценки среднего уровня. Ее дисперсия определяется по формуле (2.5.20).

Таким образом, для оценки дисперсии ошибки прогноза можно пользоваться следующим выражением

. (2.5.23)

Эта формула учитывает как погрешность оценки так и отклонение от своего математического ожидания, обусловленное наличием случайной составляющей.

Из (2.5.23) следует, что с ростом дисперсия ошибки прогноза увеличивается.