Сравнение двух регрессий (тест Чоу)
В рассматриваемых примерах, предполагалось, что изменение значения качественного фактора влияет лишь на изменение свободного члена. Но это, не всегда так. В частности, предполагалось, что заработная плата сотрудника увеличивается пропорционально стажу с одним и тем же коэффициентом пропорциональности вне зависимости от пола сотрудника, хотя зачастую коэффициент γ1 для сотрудников мужского пола больше аналогичного коэффициента для женщин. Следовательно, необходимо представить, что изменение качественного фактора может привести как к изменению свободного члена уравнения, так и наклона прямой регрессии.
Обычно это характерно для временных рядов экономических данных при изменении институциональных условии, введении новых правовых или налоговых ограничений. Например, можно предположить, что до некоторого года в стране обменный курс был фиксированным, а затем плавающим. Или налог, на ввозимые автомобили был одним, а затем он существенно изменился. В этом случае зависимость может быть выражена следующим образом:
Yt = β0 + β1 Xt + r1Dt + r2DtXt + e,
В этой ситуации ожидаемое значение зависимой переменной определяется следующим образом:
M(Yt|Dt =0) = β0 + β1Xt
M(Yt|Dt =1) = (β0 + γ1) + (β1 + γ2)Xt
Коэффициенты yi и у2 в уравнении называются дифференциальным свободным членом и дифференциальным угловым коэффициентом соответственно. Фиктивная переменная Dt в уравнении используется как в аддитивном виде (yiDt), так и в мультипликативном (yiDtXt), что позволяет фактически разбивать рассматриваемую зависимость на две части, связанные с периодами изменения некоторого рассматриваемого в модели качественного фактора. Уравнение регрессии достаточно хорошо моделирует ситуацию, изображенную на рис.
На рис. а зависимость отражается обыкновенной линейной регрессией. На рис. б в модели учитываются изменения, произошедшие с некоторого момента t в характере расположения точек наблюдений. На данном примере хорошо видно, каким образом можно проанализировать, имеет ли смысл разбивать выборку на части и строить для каждой из них уравнение регрессии (т. е. фактически строить сложную регрессию с фиктивными переменными) (рис. б) либо можно ограничиться общей "обыкновенной" регрессией для всех точек наблюдений (рис. а).
Для этого можно использовать тест Чоу, суть которого состоит в следующем.
Пусть имеются две выборки объемами ni и п2 соответственно. Для каждой из этих выборок оценено уравнение регрессии вида: Y=a0k + a0kX1+a1kX2+ ... +amkXm+ek, k=1,2.
Проверяется нулевая гипотеза о равенстве друг другу соответствующих коэффициентов регрессии
aj1 = aj2 j=0,1,…,m
Другими словами, будет ли уравнение регрессии одним и тем же для обеих выборок?
Пусть суммы Σеik2 (k = 1,2) квадратов отклонений значений уi от линий регрессии равны S1 и S2 соответственно для первого и второго уравнений регрессии.
Пусть по объединенной выборке объема (n1 + n2) оценено еще одно уравнение регрессии, для которого сумма квадратов отклонений уi от уравнения регрессии равна S().
Для проверки гипотезы Н0 в этом случае строится следующая F-статистика:
В случае справедливости Н0 построенная F-статистика имеет распределение Фишера с числами степеней свободы v1= m + 1; v2 = n1 + n2 - 2m - 2
Очевидно, F-статистика близка к нулю, если So =S1+ S2 , и это фактически означает, что уравнения регрессии для обеих выборок практически одинаковы. В этом случае F < Fкр. Если же F > Fкр то нулевая гипотеза отклоняется. Приведенные выше рассуждения особенно важны для ответа на вопрос, можно ли за весь рассматриваемый период времени построить единое уравнение регрессии (рис. 6.1, а), или же нужно разбить временной интервал на части и на каждой из них строить свое уравнение регрессии (рис. 6.1, б).
Рис. 6.1
Использование теста Чоу осуществляется достаточно просто. Однако оно менее информативно, нежели общий анализ сложной регрессии с фиктивными переменными, осуществляемый на базе t-статистик, коэффициента детерминации и статистики Дарбина-Уотсона. Однако тест Чоу вполне достаточен, если требуется установить, что зависимости в подвыборках различаются.
3. Временные ряды и прогнозирование
При рассмотрении классической модели регрессии характер экспериментальных данных, как правило, не имеет принципиального значения. Методы исследования моделей, основанных на данных пространственных выборок и временных рядов, вообще говоря, существенно отличаются. Объясняется это тем, что в отличие от пространственных выборок наблюдения во временных рядах, как правило, нельзя считать независимыми.
Под временным рядом (динамическим рядом, или рядом динамики) в экономике подразумевается последовательность наблюдений некоторого признака (случайной величины) Y в последовательные моменты времени. Отдельные наблюдения называются уровнями ряда, которые будем обозначать yt (t = 1,2,..., n), где n — число уровней.
В табл. – спрос на некоторый товар за 8-летний период (усл. ед), т. е. временной ряд спроса yt .
Год, t | ||||||||
Спрос, yt |
В качестве примера на рис. временной ряд yt изображен графически.
В общем виде при исследовании экономического временного ряда yt выделяются несколько составляющих:
,
где ut — тренд, плавно меняющаяся компонента, описывающая чистое влияние долговременных факторов, т. е. длительную («вековую») тенденцию изменения признака (например, рост населения, экономическое развитие, изменение структуры потребления и т. п.);
vt — сезонная компонента, отражающая повторяемость экономических процессов в течение не очень длительного периода (года, иногда месяца, недели и т. д., например, объем продаж товаров или перевозок пассажиров в различные времена года);
ct — циклическая компонента, отражающая повторяемость экономических процессов в течение длительных периодов (наример, влияние волн экономической активности Кондратьева, демографических «ям», циклов солнечной активности и т. п.);
εt — случайная компонента, отражающая влияние не поддающихся учету и регистрации случайных факторов.
Следует обратить внимание на то, что в отличие от εtпервые три составляющие (компоненты) являются закономерными, неслучайными.
Важнейшей классической задачей при исследовании экономических временных рядов является выявление и статистическая оценка основной тенденции развития изучаемого процесса и отклонений от нее.
Отметим основные этапы анализа временных рядов:
· графическое представление и описание поведения временного ряда;
· выделение и удаление закономерных (неслучайных) составляющих временного рада (тренда, сезонных и циклических составляющих);
· сглаживание и фильтрация (удаление низко- или высокочастотных составляющих временного ряда);
· исследование случайной составляющей временного ряда, построение и проверка адекватности математической модели для ее описания;
· прогнозирование развития изучаемого процесса на основе имеющегося временного ряда;
· исследование взаимосвязи между различными временными рядами.
Среди наиболее распространенных методов анализа временных рядов выделим корреляционный и спектральный анализ, модели авторегрессии и скользящей средней.
В отличие от элементов случайной выборки члены временного ряда, как правило, не являются статистически независимыми. Во-вторых, члены временного ряда не являются одинаково распределенными.
Одна из важнейших задач анализа временного ряда состоит в прогнозировании на его основе развития изучаемого процесса. При этом исходят из того, что тенденция развития, установленная в прошлом, может быть распространена (экстраполирована) на будущий период. Задача ставится так: имеется временной (динамический) ряд yt (t = l, 2, ... ,n) и требуется дать прогноз уровня этого ряда на момент n +τ.
Прогноз развития изучаемого процесса на основе экстраполяции временных рядов может оказаться эффективным, как правило, в рамках краткосрочного, в крайнем случае, среднесрочного периода прогнозирования.