Суть, причины и последствия автокорреляции.
Одной из предпосылок регрессионного анализа является независимость случайного члена в любом наблюдении от его значений во всех других наблюдениях, т.е. .
Если данное условие не выполняется, то говорят, что случайный член подвержен автокорреляции. Поскольку значения случайных членов неизвестны, то проверяется статистическая некоррелированность остатков, в частности двух последовательных и . Автокорреляция остатков (отклонений) обычно встречается в регрессионном анализе при использовании данных временных рядов.
Пусть - коэффициент корреляции между двумя соседними случайными членами и :
· если > 0, то автокорреляция положительная;
· если < 0, то автокорреляция отрицательная;
· если = 0, то автокорреляция отсутствует, и третье условие Гаусса-Маркова удовлетворяется.
Среди основных причин, вызывающих появление автокорреляции, можно выделить следующие.
Ошибки спецификации: неучет в модели какой-либо важной объясняющей переменной либо неправильный выбор формы зависимости обычно приводят к системным отклонениям точек наблюдений от линии регрессии.
Инерция в изменении экономических показателей: многие экономические показатели обладают определенной цикличностью, связанной с волнообразностью деловой активности. Экономический подъем приводит к росту занятости, сокращению инфляции, увеличению ВНП и т.д. Этот рост продолжается до тех пор, пока изменение конъюнктуры рынка и ряда экономических характеристик не приведет к замедлению роста, затем остановке и движению вспять рассматриваемых показателей.
Эффект паутины: экономические показатели реагируют на изменение экономических условий с запаздыванием. Например, большая цена сельхозпродукции в прошедшем году вызовет (скорее всего) ее перепроизводство в текущем году, а, следовательно, цена на нее снизится и т.д.
Сглаживание данных: данные по некоторому продолжительному временному периоду получают усреднением данных по составляющим его подынтервалам.
Последствия автокорреляции схожи с последствиями гетероскедастичности:
1. Оценки параметров, оставаясь линейными и несмещенными, перестают быть эффективными.
2. Дисперсии оценок являются смещенными (заниженными), это влечет увеличение t-статистик, и признанию статистически значимыми объясняющие переменные, которые такими не являются.
3. Оценка дисперсии регрессии S2 является смещенной (заниженной).
4. Выводы по t- и по F-статистикам оказываются неверными, из-за чего ухудшаются прогнозные качества модели.