Предположения модели

Классическая линейная модель множественной регрессии

 

Рассмотрим обобщение линейной регрессионной модели для случая более двух переменных.

Всякий раз, когда изучаемый процесс или явление является результатом совместного действия нескольких факторов, у исследователя возникает потребность в оценке влияния каждого фактора в отдельности. Один из стандартных методов[3], позволяющий успешно решить эту задачу, суть множественная регрессия.

 

Пусть мы располагаем выборочными наблюдениями над k переменными Yi и , j=1,..., k, i=1,2,…,n, где n – количество наблюдений:

i n
Y1, Y2, Yi, Yn
X11, X12, X1i, X1n
Xk1, Xk2, Xki, Xkn

Предположим, что существует линейное соотношение между результирующей переменной Y и k объясняющими переменными X1, X3, ..., Xk. Тогда с учетом случайной ошибки ui запишем уравнение:

(3.1)

В (3.1) неизвестны коэффициенты , j=0,2,…,k и параметры распределения ui. Задача состоит в оценивании этих неизвестных величин. Модель (3.1) называется классической линейной моделью множественной регрессии (КЛММР). Заметим, что часто имеют в виду, что переменная X0 при b0 равна единице для всех наблюдений i=1,2,…,n.

Относительно переменных модели в уравнении (3.1) примем следующие основные гипотезы:

E(ui)=0; (3.2)

(3.3)

X1, X3, ..., Xk – неслучайные переменные; (3.4)

Не должно существовать строгой линейной

зависимости между переменными X1, X3, ..., Xk. (3.5)

Первая гипотеза (3.2) означает, что переменные ui имеют нулевую среднюю.

Суть гипотезы (3.3) в том, что все случайные ошибки ui имеют постоянную дисперсию, то есть выполняется условие гомоскедастичности дисперсии (см. подробнее раздел 4).

Согласно (3.4) в повторяющихся выборочных наблюдениях источником возмущений Y являются случайные колебания ui, а значит, свойства оценок и критериев обусловлены объясняющими переменными X1, X3, ..., Xk.

Последняя гипотеза (3.5) означает, в частности, что не существует линейной зависимости между объясняющими переменными, включая переменную X0, которая всегда равна 1.

Понятно, что условия (3.2)-(3.4) соответствуют своим аналогам для случая двух переменных в п.2.2.