Оценка регрессии

1.3.1. Оценка дисперсии случайной составляющей – . Статистические свойства МНК-оценок (состоятельность, несмещенность, эффективность). Ковариационная матрица МНК-оценок параметров регрессии

Оценка дисперсии случайной составляющей в случае ной линейной регрессии.

Несмещенной оценкой дисперсии случайной составляющей является:

 

где ei – остаток, равный разности между фактическим и рассчитанным по уравнению регрессии значениями у:

Оценкой ковариационной матрицы случайных составляющих Сu будет матрица: .

При повторении выборок того же самого объема n из той же самой генеральной совокупности и при тех же самых значениях объясняющих переменных х наблюдаемые значения зависимой переменной у будут случайным образом варьироваться (за счет случайного характера случайной составляющей u). Следовательно, будут варьироваться и зависеть от у1,.., уn значения оценок параметров регрессии (j = 0; 1] и оценка дисперсии случайной составляющей.

Покажем на примере что значение МНК-оценки параметра регрессии зависит от случайной составляющей u.

МНК-оценка коэффициента регрессии, как было показано в п. 1.2.3, рассчитывается как отношение ковариации x и y к дисперсии х:

Так как y зависит от случайной составляющей u (y=b0+b1x+u), то ковариация может быть расписана следующим образом:

.

Причем из свойств ковариации (см п. 1.2.2) следует, что:

; ;

.

Тогда .

В результате МНК-оценка может быть разложена на случайную и неслучайную составляющие:

,

т.е. МНК-оценка может быть представлена как сумма слагаемых:
1) постоянной величины, равной истинному значению коэффициента b1;
2) случайной составляющей Cov(х, u), которая обусловливает отклонения оценки коэффициента регрессии от истинного значения.

Аналогично можно показать, что МНК-оценка , а так же оценка дисперсии имеют постоянную составляющую, равную истинному значению, и случайную составляющую зависящую от u.

Следует заметить, что на практике мы не можем разложить оценки параметров регрессии и на составляющие, так как истинные значения b0,b1 и нам не известны, кроме того, мы не знаем фактических значений u в выборке.

Однако приведенное выше разложение оценок позволяет получить некоторую теоретическую информацию об их свойствах.

Свойства МНК-оценок. Критериями лучшего способа оценивания является требование состоятельности, несмещенности и эффективности оценок, найденных данным способом.

Способ оценивания дает состоятельные оценки, если при бесконечно большом объеме выборки значение статистической оценки стремится к искомому значению параметра (характеристики) генеральной совокупности.

Способ оценивания дает несмещенные оценки, если математическое ожидание оценки при данном способе оценивания тождественно искомому параметру (характернее генеральной совокупности (при любом объеме выборки).

Оценка, полученная при данном способе оценивания называется эффективной, если ее дисперсия минимальна (при заданном объеме выборки n).

МНК-оценки параметров и дисперсии случайной составляющей являются «наилучшими» (состоятельными, несмещенными и эффективными) оценками.

Докажем, что является несмещенной оценкой b1 если выполняется 1-я предпосылка нормальной линейной модели регрессии. Если мы примем сильную форму 1-й предпосылки нормальной линейной регрессионной модели, т.е. предположим, что x –неслучайная величина, то мы можем считать известной константой, а математическое ожидание равным нулю. Тогда:

.

То есть , следовательно, является несмещенной оценкой b1.

Аналогично доказывается несмещенность оценки .

Эффективность МНК-оценок доказывается с помощью теоремы Гаусса-Маркова, которая гласит:

Метод наименьших квадратов дает оценки, имеющие наименьшую дисперсию в классе всех линейных несмещенных оценок, если выполняются предпосылки нормальной линейной регрессионной модели (см. п. 1.2.2).

Ковариационная матрица МНК-оценок параметров регрессии – матрица ковариаций оценок параметров. Для случая парной регрессии это матрица размером 2´2:

.

Данная матрица в соответствии с методом наименьших квадратов рассчитывается следующим образом:

.

На главной диагонали данной матрицы, находятся дисперсии МНК-оценок параметров. Для случая парной линейной регрессии формулы расчета дисперсий МНК-оценок параметров следующие:

 

, ,

где – дисперсия случайной составляющей;

– дисперсия факторного признака x.

Так как нам известна, то при расчете ковариационной матрицы пользуются оценкой дисперсии случайных составляющих – . Тогда получим оцененную ковариационную матрицу: .

Формулы расчета оценок дисперсий и (полученные через ) в случае парной линейной регрессии будут следующими:

,

Корень из оценки дисперсии и .