Модель парной линейной регрессии
В парном регрессионном анализе исследуется зависимость переменной y от одной объясняющей переменной х. В экономической теории эта проблема решается путем приведения соотношения, как если бы оно было точным, и предупреждением читателя о том, что это аппроксимация. Отметим, что не следует ожидать получения точного соотношения между какими-либо двумя экономическим показателями, за исключением тех случаев, когда оно существует по определению. В эконометрике факт неточности соотношения признается путем явного включения в него случайного фактора, описываемого случайным остаточным членом.
Модель парной линейной регрессии имеет вид:
, | (8) |
где ‑ зависимая переменная (объясняемая),
‑ независимая переменная (объясняющая),
‑ параметры модели,
‑ случайный остаточный член (случайная ошибка).
Константу α называют также свободным членом, а угловой коэффициент β ‑ регрессионным коэффициентом.
Оценка параметров модели основана на имеющейся выборке парных наблюдений объема n: (x1 , y1), … (xn , yn).
Для оценки используется уравнение:
, | (9) |
где ‑ прогнозируемое значение объясняемой переменной;
a – статистическая оценка параметра α;
b ‑ статистическая оценка параметра β.
Уравнение (9) задает прямую линию на плоскости (в пространстве двух измерений). Более подробно: переменная может быть выражена через константу (a) и угловой коэффициент (b), умноженный на переменную x.
Разность между фактическим значение зависимой переменной и значением, прогнозируемым по уравнению регрессии, называется остатком. Остатки ei вычисляются по формуле:
. | (10) |
Принципиальная схема модели парной линейной регрессии приведена на рис. 1.
Рисунок 1 – Принципиальная схема модели парной линейной регрессии
Есть два предварительных шага для определения существования и степени линейной зависимости между переменными.
Первый шаг заключается в построении диаграммы рассеяния – графическом отображении точек (x1 , y1), … (xn , yn) на плоскости. Анализируя диаграмму рассеяния, мы можем эмпирически решить, допустимо ли предположение о линейной зависимости между х и y. Пример построения диаграммы рассеяния приведен на рис. 2.
Вторым шагом является вычисление выборочного коэффициента корреляции r по формуле:
, | (11) |
Рисунок 2 – Пример диаграммы рассеяния: зависимость между среднедушевым потреблением и производством молока по регионам Российской Федерации (каждая точка на диаграмме представляет данные для одного региона)
где
, | (12) |
соответствующие выборочные средние для переменных х и y.
В рассматриваемом примере коэффициент корреляции между среднедушевым потреблением и среднедушевым производством молока в регионах Российской Федерации r=0.76.