Тестирование стационарности временного ряда
Как было отмечено выше, стационарные временные ряды имеют следующие отличительные черты: значения ряда колеблются вокруг постоянного среднего значения с постоянной дисперсией, которая не зависит от времени, АКФ затухает с увеличением лага. При анализе экономических явлений чаще приходится иметь дело с нестационарными временными рядами, которые не имеют постоянного среднего, дисперсия которых зависит от времени, а АКФ затухает очень медленно. Для подбора модели ряда и прогнозирования его значений необходимо уметь распознавать тип временного ряда.
Рассмотрим процесс авторегрессии первого порядка
y(t)=my(t-1)+e(t).
Ряд y(t) является стационарным рядом, если –1<m<1. Если m=1, то y(t) – нестационарный временной ряд – случайное блуждание со сдвигом: в этом случае считают, что временной ряд y(t) имеет единичный корень.
Вычтем y(t-1) из обеих частей модели: Dy(t)=gy(t-1)+e(t), где g=m-1.
Дики и Фуллер рассмотрели три регрессии:
Dy(t)=gy(t-1)+e(t),
Dy(t)=m0+gy(t-1)+e(t),
Dy(t)=m0+gy(t-1)+m2t+e(t).
Вторая регрессия содержит постоянный элемент m0, а третья, кроме этого, и линейный временной тренд. Во всех трех регрессиях интересующий параметр g.
Нулевая гипотеза H0: g=0 против альтернативы H1: g<0.
Тест Дики-Фуллера (Dickey-Fuller) состоит в следующем. Оцениваются методом наименьших квадратов одно из указанных выше уравнений.
Прогнозирование
Рис. 5.11. Подход Бокса-Дженкинса
Рис. 5.12. Процесс выбора ARIMA модели
Получают оценку g, стандартную ошибку и соответствующее значение t – статистики. Сравнивая значение t-статистики с табличным, определяют, принять или отклонить H0. Критическое значение t-статистики имеет нестандартное распределение и зависит от формы регрессии и объема выборки – см в [5].
Критические значения не изменятся, если указанные выше модели заменить авторегрессионным процессом произвольного порядка:
Dy(t)=gy(t-1)++e(t),
Dy(t)=m0+gy(t-1)++e(t),
Dy(t)=m0+gy(t-1)+m2t++e(t).
Для последних моделей Дики и Фуллер предложили три дополнительные статистики для тестирования обобщенных гипотез о коэффициентах:
f1: H0: g=m0=0.
f2: H0: g=m0=m2=0.
f3: H0: g=m2=0.
Статистики fi конструируются как F тест: , i=1,2,3, где RSSr и RSSur – квадраты ошибок короткой и длинной регрессий, g – число исключенных переменных, n – число наблюдений, k – число параметров в длинной регрессии. Большие значения fi ведут к отклонению нулевой гипотезы. Критические значения статистик вычислены Дики и Фуллером и затабулированы.