Й учебный вопрос. Автокорреляция в остатках, критерий Дарбина-Уотсона.
Включение в модель регрессии фактора времени.
В корреляционно-регрессионном анализе устранить воздействие какого-либо фактора можно, если зафиксировать воздействие этого фактора на результат и другие включенные в модель факторы. Этот прием широко используется в анализе временных рядов, когда тенденция фиксируется через включение фактора времени в модель в качестве независимой переменной.
Модель вида относится к группе моделей, включающих фактор времени. Очевидно, что число независимых переменных в такой модели может быть больше единицы. Кроме того, это могут быть не только текущие, но и лаговые значения независимой переменной, а также лаговые значения результативной переменной.
Преимущество данной модели по сравнению с методами отклонений от трендов и последовательных разностей в том, что она позволяет учесть всю информацию, содержащуюся в исходных данных, поскольку значения yt и xt есть уровни исходных временных рядов. Кроме того, модель строится по всей совокупности данных за рассматриваемый период в отличие от метода последовательных разностей, который приводит к потере числа наблюдений. Параметры а и b модели с включением фактора времени определяются обычным МНК. Расчет и интерпретацию параметров покажем на примере.
Рассмотрим уравнение регрессии вида
(6.10)
где k— число независимых переменных модели.
Для каждого момента (периода) времени t = 1 : п значение компоненты определяется как
(6.11)
или к
(6.12)
Рассматривая последовательность остатков как временной ряд, можно построить график их зависимости от времени. В соответствии с предпосылками МНК остатки е, должны быть случайными (рис. 6.1 а). Однако при моделировании временных рядов нередко встречается ситуация, когда остатки содержат тенденцию (рис. 6.1 б) и в)) или циклические колебания (рис. 6.1 г)). Это свидетельствует о том, что каждое следующее значение остатков зависит от предшествующих. В этом случае говорят о наличии автокорреляции остатков.
Автокорреляция остатков может быть вызвана несколькими причинами, имеющими различную природу. Во-первых, иногда она связана с исходными данными и вызвана наличием ошибок измерения в значениях результативного признака. Во-вторых, в ряде случаев причину автокорреляции остатков следует искать в формулировке модели. Модель может не включать фактор, оказывающий существенное воздействие на результат, влияние которого отражается в остатках, вследствие чего последние могут оказаться автокоррелированными. Очень часто этим фактором
является фактор времени t. Кроме того, в качестве таких существенных факторов могут выступать лаговые значения переменных, включенных в модель. Либо модель не учитывает несколько второстепенных факторов, совместное влияние которых на результат существенно ввиду совпадения тенденций их изменения или фаз циклических колебаний.
От истинной автокорреляции остатков следует отличать ситуации, когда причина автокорреляции заключается в неправильной спецификации функциональной формы модели. В этом случае следует изменить форму связи факторных и результативного признаков, а не использовать специальные методы расчета параметров уравнения регрессии при наличии автокорреляции остатков.
Существуют два наиболее распространенных метода определения автокорреляции остатков. Первый метод — это построение графика зависимости остатков от времени и визуальное определение наличия или отсутствия автокорреляции. Второй метод — использование критерия Дарбина — Уотсона и расчет величины
. (6.13)
Таким образом, d есть отношение суммы квадратов разностей последовательных значений остатков к остаточной сумме квадратов па модели регрессии. Практически во всех статистических ППП значение критерия Дарбина — Уотсона указывается наряду с коэффициентом детерминации, значениями t- и F-критериев.
Коэффициент автокорреляции остатков первого порядка определяется как
. ( 6.14)
Где
(6.15)
Так как - остатки, полученные по уравнению регрессии, параметры которого определены обычным МНК, то в соответствии с предпосылками МНК их сумма и среднее значение равны нулю:
(6.16)
Следовательно, без уменьшения общности можно предположить, что
(6.17)
Предположим также
(6.18)
С учетом соотношений (6 Л 7) и (6.18) формула для расчета коэффициента автокорреляции остатков (6.14) преобразуется следующим образом:
(6.19)
Преобразуем теперь формулу (6.13) расчета критерия Дарбина — Уотсона следующим образом:
(6.21)
Сравнив выражения (6.19) и (6.21), нетрудно вывести следующее соотношение между критерием Дарбина - Уотcона и коэффициентом автокорреляции остатков первого порядка:
(6.22)
Таким образом, если в остатках существует полная положительная автокорреляция и = 1, то d = 0. Если в остатках полная отрицательная автокорреляция, то = -1 и, следовательно, d = 4. Если автокорреляция остатков отсутствует, то = 0 и d = 2. Следовательно,
Алгоритм выявления автокорреляции остатков на основе критерия Дарбина - Уотеона следующий. Выдвигается гипотеза H0 об отсутствии автокорреляции остатков. Альтернативные гипотезы состоят, соответственно, в наличии положительной или отрицательной автокорреляции в остатках. Далее по специальным таблицам (см. приложение) определяются критические значения критерия Дарбина - Уотеона dL и dU для заданного числа наблюдений я, числа независимых переменных модели k и уровня значимости . По этим значениям числовой промежуток [0;4] разбивают на пять отрезков. Принятие или отклонение каждой из гипотез с вероятностью (1 — а) рассматривается на рис. 6.2.
Если фактическое значение критерия Дарбина — Уотеона попадает в зону неопределенности, то на практике предполагают существование автокорреляции остатков и отклоняют гипотезу H0.
Пример 6.4. Проверка гипотезы о наличии автокорреляции в остатках.
Проверим гипотезу о наличии автокорреляции в остатках для модели зависимости расходов на конечное потребление от совокупного дохода, построенной по первым разностям исходных показателей, используя данные примера 6.2.
Было получено следующее уравнение регрессии:
Исходные данные, значения и результаты промежуточных расчетов представлены в табл. 6.5.
Фактическое значение критерия Дарбина - Уотсона для этой модели составляет:
Сформулируем гипотезы:
— в остатках нет автокорреляции;
— в остатках есть положительная автокорреляция;
— в остатках есть отрицательная автокорреляция.
Зададим уровень значимости = 0,05. По таблицам значений критерия Дарбина — Уотсона определим для числа наблюдений n= 7 и числа независимых переменных модели (6.32)
В формуле (6.32):
(6.34) | ||||
(6.35) | ||||
и b
3. Рассчитать параметр а исходного уравнения из соотношения (6.36) как
(6.38)
и
(6.40)
Аналогично
(6.42)
имеем:
(6.43)
Следовательно,
(6.44)
В сущности, в модели (6.44) мы определяем средние за два периода уровни каждого ряда, а затем по полученным усредненным уровням обычным МНК рассчитываем параметры а и b. Данная модель называется моделью регрессии по скользящим средним.
Основная проблема, связанная с применением данного метода, заключается в том, как получить оценку . Существует множество способов оценить численное значение коэффициента автокорреляции остатков первого порядка. Однако основными способами являются оценка этого коэффициента непосредственно по остаткам, полученным по исходному уравнению регрессии, и получение его приближенного значения из соотношения между коэффициентом автокорреляции остатков первого порядка и критерием Дарбина — Уотеона:
Расчет параметров уравнения регрессии при наличии автокорреляции остатков показан в примере 6.5.
4-й учебный вопрос. Коинтеграции временных рядов.
Общий недостаток методов исключения тенденции заключается в том, что эти методы предполагают некоторую модификацию модели (6.1) вследствие либо замены переменных, либо добавления в эту модель фактора времени. Однако большая часть соотношений, постулируемых экономической теорией, верификацией которых занимается эконометрика, сформулирована в терминах уровней временных рядов, а не их последовательных разностей или отклонений от трендов и предполагает измерение взаимосвязи переменных без включения в модель каких-либо дополнительных факторов (например, переменной времени).
В ряде случаев наличие в одном из временных рядов тенденции может быть следствием именно того факта, что другой ряд, включенный в модель, тоже содержит тенденцию, а не просто результатом прочих случайных причин. Поэтому одинаковая или противоположная направленность тенденций рядов может иметь устойчивый характер и наблюдаться на протяжении длительного промежутка времени, а коэффициент корреляции, рассчитанный по уровням временных рядов, может соответственно не содержать ложной корреляции и характеризовать истинную причинно-следственную зависимость между ними.
Начиная с 70-х гг. XX в. высказанные выше предположения были положены в основу новой теории о коинтеграции временных рядов. Под коинтеграцией понимается причинно-следственная зависимость в уровнях двух (или более) временных рядов, которая выражается в совпадении или противоположной направленности их тенденций и случайной колеблемости.
Не останавливаясь детально на положениях и концепциях теории коинтеграции (глубокое ее рассмотрение требовало бы подготовки отдельного учебного пособия), в данном параграфе мы кратко охарактеризуем основные статистические методы и критерии, применяемые для проверки гипотез о наличии коинтеграции временных рядов данных.
В соответствии с этой теорией между двумя временными рядами существует коинтеграция в случае, если линейная комбинация этих временных рядов есть стационарный временной ряд (т. е. ряд, содержащий только случайную компоненту и имеющий постоянную дисперсию на длительном промежутке-времени). Статистические критерии , предназначенные для проверки гипотезы о коинтеграции, основаны не на проверке статистических остатков, а на проверке менее жесткой гипотезы – гипотезы об отсутствии во временном ряде единичного корня.
Рассмотрим уравнения регрессии вида (6.1). Остатки в этом уравнении представляют собой линейную комбинацию рядов
(6.45)
Одним из методов тестирования гипотезы о коинтеграции временных рядов yt и хt является критерий Энгеля - Грангера. Алгоритм применения этого критерия следующий.
1. Выдвигается ноль-гипотеза об отсутствии коинтеграции между рядами yt и хt
2. Рассчитывают параметры уравнения регрессии вида
(6.46)
где - первые разности остатков, полученных из соотношения (6.45).
3. Определяют фактическое значение t-критерия для коэффициента регрессии а в уравнении (6.46).
4. Сравнивают полученное значение с критическим значением статистики τ. Критические значения τ, рассчитанные Энгелем и Грангером для уровня значимости 1, 5 и 10%, составляют 2,5899; 1,9439; I.6177. Если фактическое значение t больше критического значения τ для заданного уровня значимости α, ноль-гипотезу об отсутствии коинтеграции исследуемых временных рядов отклоняют и с вероятностью (1 - α) принимают альтернативную гипотезу о том, что между рядами yt и хt есть коинтеграция. В противном случае гипотеза об отсутствии коинтеграции между исследуемыми радами не отклоняется.
Другой метод тестирования ноль-гипотезы об отсутствии коинтеграции между двумя временными радами основан на использовании величины критерия Дарбина — Уотcона, полученной для уравнения (6.1). Однако в отличие от традиционной методики его применения в данном случае проводят проверку гипотезы о том, что полученное фактическое значение критерия Дарбина — Уотcона в генеральной совокупности равно нулю.
Ряд авторов называют следующие критические значения критерия Дарбина — Уотеона, полученные методом Монте-Карло для следующих уровней значимости: 1% - 0,511; 5% - 0,386; 10% - 0,322. Если результаты тестирования показали, что фактическое значение критерия Дарбина — Уотеона нельзя признать равным нулю (т. е. оно превышает критическое значение для заданного уровня значимости), ноль-гипотезу об отсутствии коинтеграции временных рядов отклоняют. Если фактическое значение критерия Дарбина - Уотеона меньше критического значения для заданного уровня значимости, то ноль-гипотеза об отсутствии коинтеграции не отклоняется.
Коинтеграция двух временных рядов значительно упрощает процедуры и методы, используемые в целях их анализа, поскольку в этом случае можно строить уравнение регрессии и определять показатели корреляции, используя в качестве исходных данных непосредственно уровни изучаемых рядов, учитывая тем самым информацию, содержащуюся в исходных данных, в полном объеме. Однако поскольку коинтеграция означает совпадение динамики временных рядов в течение длительного промежутка времени, то сама эта концепция применима только к временным рядам, охватывающим сравнительно длительные (например, в несколько десятилетий) промежутки времени. При наличии коротких временных рядов данных, даже если формальные критерии показали наличие их коинтеграции, моделирование взаимосвязей по уровням этих рядов может привести к неверным результатам ввиду нарушения предпосылок теории коинтеграции.
Пример 6.5. Анализ взаимосвязи временных рядов среднедушевого располагаемого дохода и среднедушевого расхода на конечное потребление.
Пусть имеются данные о среднедушевом располагаемом доходе и среднедушевом расходе на конечное потребление в США в период с 1960 по 1991 г. (табл. 6.6). Требуется охарактеризовать тесноту связи между изучаемыми временными рядами и определить предельную склонность к потреблению в США за рассматриваемый период. Построим графики временных рядов среднедушевого дохода и потребления (рис. 6.3). Графический анализ показывает, что тенденции этих рядов совпадают. Проведем тестирование временных рядов среднедушевого дохода и расхода на потребление на коинтеграцию.
Ноль-гипотеза состоит в том, что коинтеграция между этими рядами отсутствует. По имеющимся исходным данным определим обычным МНК параметры уравнения регрессии зависимости среднедушевых расходов на конечное потребление уt от среднедушевого дохода хt
Регрессионный анализ зависимости среднедушевых расходов на конечное потребление от среднедушевого располагаемого дохода показал следующее:
Уравнение регрессии имеет вид:
Применим критерий Энгеля - Грангера. Воспользовавшись полученным уравнением регрессии, определим остатки , (гр. 3 табл. 6.6). Определим параметры уравнения регрессии (6.46);
Фактическое значение t-критерия, рассчитанное по данным уравнения регрессии, равно -2,154. Так как полученное фактическое значение по абсолютной величине превышает критическое значение τ 0,05 = 1,9439, то с вероятностью 95% можно отклонить ноль-гипогезу и сделать вывод о коинтеграции временных рядов среднедушевого дохода и среднедушевых расходов на конечное потребление. Этот же вывод подтверждается и другим критерием. Полученное значение критерия Дарбина — Уотсона для уравнения регрессии, рассчитанного по уровням временных рядов, d = 0,521 превышает для уровня значимости 0,01 его критическое значение, равное 0,511, и тем более превышает его критические значения при повышении уровня значимости. Это свидетельствует о том, что в генеральной совокупности критерий Дарбина — Уотсона не равен нулю и, следовательно, временные ряды дохода и потребления коинтегрируют. Для определения показателей силы и тесноты их взаимосвязи можно работать с уровнями рядов. Коэффициент корреляции, рассчитанный по уровням временных рядов, равен 0,997. Это говорит об очень тесной прямой связи между расходами на конечное потребление и среднедушевым доходом в США в период с 1960 по 1991 г. Однако при расчете параметров уравнения регрессии мы сталкиваемся с другой проблемой — автокорреляцией в остатках (фактическое значение критерия Дарбина — Уотcона составляет 0,521, что свидетельствует о наличии положительной автокорреляции в остатках). Поэтому найденные оценки параметров уравнения регрессии - 174,75 и 0,922 не являются эффективными ввиду нарушения предпосылок МНК в этом уравнении. Для получения новых оценок параметров, для которых не нарушается свойство эффективности, воспользуемся методом расчета параметров уравнения регрессии при наличии автокорреляции в остатках, изложенным в п. 6.4. 1. Найдем оценку коэффициента автокорреляции остатков первого порядка. Ее можно получить двумя способами. Воспользовавшись приближенным соотношением между критерием Дарбина — Уотеона и коэффициентом автокорреляции остатков первого порядка, которое описывается формулой (6.21), имеем:
Приблизительно этот же результат можно получить, если рассчитать коэффициент автокорреляции уровней первого порядка по временному ряду остатков (гр. 3 табл. 6.6): = 0,728. 2. Произведем пересчет исходных данных в соответствии с формулами (6.33) и (6.34). Новые переменные приведены в гр. 4 и 5 табл. 6.6 соответственно. При пересчете данных мы использовали величину коэффициента автокорреляции 0,728. Однако в равной степени допустимо применять и другую его оценку 0,731, полученную из соотношения между коэффициентом автокорреляции остатков и критерием Дарбина - Уотcона. 3. Определим параметры уравнения регрессии y't на |