Гомоскедастичность и гетероскедастичность дисперсии остатков

Условие независимости дисперсии ошибки от номера наблюдения (от регрессора xi): Е(ei 2) = Var(ei) = s2. i = l,...,n. называется гомоскедастичностъю (homoscedasticity); случай, когда условие гомоскедастичности не выполняется, называется гетероскедастичностъю (heteroscedasticity). На рис. 7.2а приведен пример типичной картинки для случая гомоскедастичности ошибок; на рис. 7.26 — пример данных с гетероскедастичными ошибками (возможно, что в этом примере Var (ei) ~ xi2).

Рис 7.2а Рис. 7.2б

Условие Е(ei ej)= 0 при i ≠ j указывает на некоррелированность ошибок для разных наблюдений. Это условие часто нарушается в случае, когда наши данные являются временными рядами. В случае, когда это условие не выполняется, говорят об автокорреляции ошибок (serial correlation).

Для проверки случайного характера остатков ej , строится график их зависимости от теоретических значений результативного признака. Если на графике получена горизонтальная полоса, то остатки представляют собой случайные величины и МНК оправдан, теоретические значения хорошо аппроксимируют фактические значения yi.

Возможны следующие случаи, если ej зависит от , то:

· Остатки ej не случайны (рис 7.3а)

· Остатки ej не имеют постоянной дисперсии (рис. 7.3в)

· Остатки ej носят систематический характер (рис. 7.3б)

 

 

В таких случаях необходимо либо применять другую функцию (например, вводить кусочно-линейные- модели), либо вводить дополнительную информацию и заново строить уравнение регрессии до тех пор, пока остатки не будут случайными величинами.

Предпосылка о нормальном распределении остатков позволяет проводить проверку параметров регрессии с помощью критериев t, F.

Тем не менее, нарушение этого условия не оказывает решающего действия на свойства оценок регрессии, найденных с применением МНК.

 

20. Коэффициент детерминации R2

Для оценки качества подбора линейной функции рассчитывается коэффициент детерминации. Коэффициент детерминации характеризует долю дисперсии результативного признака y ,объясняемую регрессией, в общей регрессии результативного признака: Величина коэффициента детерминации служит одним из критериев оценки качества линейной модели. Чем больше доля объясненной вариации, тем соответственно меньше роль прочих факторов и, следовательно, линейная модель хорошо аппроксимирует исходные данные и ею можно воспользоваться для прогноза.

В силу определения R2 принимает значения между 0 и 1. Если коэффициент детерминации равен 0, то это означает, что регрессия ничего не дает, не улучшает качество предсказания у по сравнению с тривиальным предсказанием у среднее. Чем ближе к 1 значение R2, тем лучше качество подгонки, т.е точность аппроксимации.