Авторегрессионные модели
Рассмотрим класс авторегрессионных моделей, сокращенно обозначаемых АР(р) -модели (число в скобках указывает порядок авторегрессии) или, как принято в специальной англоязычной литературе и мировой статистической практике, AR(p) - models (AutoRegressive processes of order р).
В авторегрессии каждое значение ряда находится в линейной зависимости от предыдущих значений. Если анализируемый динамический процесс зависит от значений, отстоящих до р временных лагов назад, то это авторегрессионный процесс порядка, т.е. AR(р):
yt=a1 yt-1 + a2 yt-2 +…+ apyt-p + et
или
(1 - a1B + a2B 2+…+ apB p) yt = Ф(В) yt = et (3.1)
где В — оператор сдвига, т.е. преобразование ряда, смещающее его на один временной такт; Ф(В) — оператор авторегресии.
При этом для выполнения условия стационарности все корни многочлена Ф(В) должны лежать вне единичного круга, т.е. все корни соответствующего характеристического уравнения должны быть по модулю больше 1 и различны.
Рассмотрим простейший вариант линейного авторегрессионного процесса — модель авторегрессии 1-го порядка — AR(1), или марковский процесс.
Эта модель может быть представлена в виде:
yt = a yt-1 + et (3.2)
где a — числовой коэффициент, |a | < 1, et — последовательность случайных величин, образующих “белый шум”.
Основные свойства марковского процесса:
1. M(yt) = 0;
2. D(yt) = / (1 - a2);
3. Cov(yt, yt±t) = at D(yt);
4. r(yt, yt±t) = r(t) = at .
Представим yt = a yt-1 + et в виде:
yt = a (a yt-2 + et-1) + et = a2yt-2+a et-1+ et =a2(ayt-3+ et-2) +
+a et-1+ et =a3 yt-3 + a2yt-2+a et-1+ et = … =
et+a et-1+ a2yt-2+… = ; (3.3)
Очевидно, что yt зависит от всех предыдущих, но не от будущих случайных величин et . Отсюда c учетом характера “белого шума”. непосредственно следует, что М(уt)= 0.
Также получим выражение для дисперсии марковского процесса AR(1), с помощью выражения (3.3):
D(yt) = (1 + a2 + a4 + …) = /(1 - a2). (3.4)
Сумма бесконечной геометрической прогрессии записана при условии |a | < 1. Отсюда видно, что при значении a близком к ± 1 дисперсия ряда будет намного больше — дисперсии белого шума. Следовательно, если последовательные значения ряда сильно коррелированны, то даже незначительные возмущения будут порождать размашистые колебания.
Чтобы показать свойства 3 и 4, умножим обе части уравнения (3.2) на yt-1 и возьмем математическое ожидание:
M(yt yt-1) = aM(yt-1 yt-1) + M(et) M(yt-1)
где второе слагаемое M(et yt-1) записано с учетом некоррелируемости значений ряда с любыми будущими случайными величинами et. Окончательная запись этого соотношения
Сov(yt, yt-1) = aD(yt).
Таким образом,
a = Сov(yt, yt-1)/ D (yt),
т.е. a — коэффициент автокорреляции первого порядка (определяет значение коэффициента парной корреляции между соседними уровнями ряда):
r(1) = a.
Можно показать, что
Сov(yt, yt±t) = at D(yt)
а, следовательно,
r(yt, yt±t) = at = r(t).
Поэтому степень тесноты корреляционной связи между членами последовательности экспоненциально убывает по мере их взаимного удаления друг от друга во времени.
Все автокорреляции марковского процесса можно выразить через автокорреляцию первого порядка:
r(t) = r(1) r(t - 1) = r(1)2r(t - 2) = ... = r(1)t = at.
Значения частной автокорреляционной функции равны нулю для всех лагов k > 2, что может быть использовано при подборе модели. Этот результат верен для теоретической частной автокорреляционной функции и может не выполняться для выборочной автокорреляционной функции. Однако, если выборочные частные корреляции статистически незначимо отличаются от нуля при k > 2, то использование модели AR(1) не противоречит исходным данным.
Условие стационарности ряда для AR(1) определяется требованием к коэффициенту а: |a | < 1 или, что то же самое, корень z0 уравнения 1- az = 0, являющегося частным случаем характеристического уравнения для общего линейного процесса авторегрессии, должен быть по абсолютной величине больше 1.
Процесс с параметром |a| > 1 является нестационарным. Такие ряды маловероятны в реальных финансово-экономических задачах, так как это подразумевает взрывные ряды, а давление экономической среды не позволяет показателям принимать бесконечно большие значения.
Из авторегрессионных процессов выше первого порядка в экономической практике часто встречаются так называемые процессы Юла. Они описываются с помощью модели AR(2):
yt = a1 yt-1 + a2 yt-2 + et (3.5)
Определим выражение для вычисления значений автокорреляционной функции r(t), сокращенно АКФ, для любого значения сдвига ряда t . Для этого опять умножим обе части уравнения (3.5) на уt-t :
yt уt-t = a1 yt-1 уt-t + a2 yt-2 уt-t + et уt-t (3.6)
и возьмем математическое ожидание:
M(yt уt-t) = g(t) = a1g(t-1) + a2 g(t-2). (3.7)
Очевидно, что M(et уt-t ) = 0,так как y t-k зависит от et-t и предшествующих значений, а не от будущих значений et,. Разделим обе части равенства (3.7) на g(0):
r(t) = a1r (t-1) + a2 r (t-2). (3.8)
Это выражение позволяет вычислить значение АКФ для различных значений лагов t. Подставим последовательно в (3. 8) значение t = 1 и t = 2.
С учетом того, что r(0) = 1, а r(-1) = r(1), получим
r(1) = a1+a2 r(1);
r(2) = a1 r(1) + a2. (3.9)
Эта система называется системой Юла—Уокера (Yule— Walker) для AR(2).
Если разрешить эту систему относительно a1 и a2 ,то получим выражения:
a1 = r(1)[1 - r(2)]/ [1 - r2(1)];
a2 = [r(2) - r2(1)]/ [1 - r2(1)]. (3.10)
Выразим из системы (3.9) два первых значения АКФ:
r(1) = a1/(1- a2);
r(2) = a2 + a12 /(1 - a2). (3.11)
Определив r(1) и r(2), можно вычислить любые последующие значения АКФ с помощью (3.8).
Получим соотношение, связывающее между собой дисперсию ряда yt и дисперсию белого шума et,равную . Для этого умножим уравнение AR(2) на уt:
yt уt = a1 yt-1 уt + a2 yt-2 уt + et ( a1 yt-1 + a2 yt-2 + et )
Возьмем математическое ожидание:
g(0) = a1 g(l) +a2 g(2) + .
Очевидно, что М(et yt-1 ) = 0, М(et yt-2 ) = 0, так как уt не зависит от будущих значений et.
Следовательно,
= g(0) -a1 g(l) -a2 g(2).
От коэффициентов автоковариации перейдем к автокорреляционным коэффициентам, умножив и разделив правую часть уравнения на g(0):
= g(0) [ 1-a1 g(l) -a2 g(2)]. (3.12)
Подставим в него выражения (3.11) для r(1) и r(2) через a1 и a2:
g(0) = .
Отсюда, учитывая, что дисперсия должна быть положительна, получаем условия стационарности процесса AR(2). Условия стационарности ряда у, также могут быть получены с учетом (6.14) из требований
| r(1)| < 1, |r(2)| < 1.
Отметим, что те же самые условия получаются из требования, чтобы все корни соответствующего характеристического уравнения 1 - a1z - a2z2 = 0 лежали вне единичного круга.
Условия стационарности процесса AR(2) могут быть записаны в виде
| a2| < 1;
a1 + a2 < 1;
a2 ‑ a1 < 1. (3.13)
ЧАКФ для процесса AR(р) будет иметь ненулевые значения лишь при k £ р, а начиная с лага k = р + 1 теоретическая ЧАКФ равна нулю. Это свойство становится ключевым при подборе порядка р авторегрессионной модели для конкретных экономических временных рядов.
Рассмотренные свойства авторегрессионных моделей и изучение АКФ (ACF) и ЧАКФ (PACF) позволяют сформулировать следующие практические рекомендации по их идентификации:
1. У моделей AR(p) значения коэффициентов АКФ экспоненциально затухают (либо монотонно, либо попеременно меняя знак).
2. ЧАКФ для модели AR(p) имеет выбросы (пики) на первых) лагах, а значения коэффициентов для лагов, больших порядка авторегрессии, статистически незначимы.