Проверка предположения о нормальности распределения

Одно из требований классической регрессионной модели заключается в нормальности распределения случайной величины . Выполнимость или невыполнимость его не оказывает влияния на качество оценок параметров регрессии, но является достаточно важным. Оно позволяет использовать стандартные процедуры проверки статистических гипотез и построения доверительных интервалов.

Проверка на нормальность распределения без существенных вычислительных затрат может быть проведена с помощью стандартного теста, опирающегося на критерий Пирсона.

Второй способ тестирования имеет визуальный характер. Он ориентируется на характерные особенности графика плотности нормально распределенных случайных величин. Для этого строится гистограмма остатков и соединяются середины верхних сторон прямоугольников гистограммы. Если ломаная линия приближенно напоминает кривую плотности нормального распределения, то можно сделать грубый вывод о том, что остатки распределены по нормальному закону.

Применение визуального метода рекомендуется в случаях, когда число наблюдений сравнительно невелико (от 10 до 25) и невозможно применить критерий Пирсона хи-квадрат, где предполагается, что .

Достаточно простым методом диагностики нормальности распределения остатков является тест Жарка-Бера. Идея метода состоит в том, что для совокупности остатков оценивается «скошенность» (асимметрия) и «вытянутость» (эксцесс) фактического распределения ряда остатков и сравнивается с нормальным. При этом за оценку «скошенности» распределения отвечает коэффициент асимметрии , а за оценку «вытянутость» распределения – коэффициент эксцесса .

Алгоритм теста Жарка-Бера следующий.

1) Выдвигается гипотеза о нормальном распределении остатков выборки.

2) Вычисляется наблюдаемое значение критерия по формуле

 

.

 

3) По таблице критических точек распределения Пирсона (число степеней свободы 2) определяется критическое значение (на уровне значимости 0,05 оно равно 5,991).

4) Если , то гипотеза о нормальном распределении остатков отклоняется, т.е. распределение остатков не является нормальным. Если , то гипотеза о нормальном распределении остатков принимается.

Нахождение коэффициента асимметрии и коэффициента эксцесса можно осуществить с помощью вкладки «Описательная статистика» пакета «Анализ данных» Excel.