Линейная регрессионная модель со многими переменными.

В простейшем случае анализируется линейная зависимость у от х. Уравнение множественной линейной регрессии (аддитивная модель) имеет вид

у=a0+a1х1 +a2х2 +…+amхm+e. (3.1)

Если имеется n наблюдений факторов х и переменной у, то отклонение зависимой переменной у в j-м наблюдении от линии регрессии

ej= уj – a0 – a1хj1 – a2хj2 – … – amхjm (j=1,2,…, n).

На втором этапе для оставшихся факторов применяется метод наименьших квадратов. Метод наименьших квадратов предполагает поиск коэффициентов ai таких, что Q=åej2®min. Для отыскания минимума берутся частные производные Q по искомым параметрам (мы использовали этот метод в случае однофакторной регрессии для нахождения a0 и a1) и приравниваются к нулю. После выполнения элементарных преобразований получают так называемую систему нормальных уравнений, из которой и находятся искомые параметры.

Система нормальных уравнений для многофакторной регрессии имеет вид:

a0 + a1 1 + a2 2 + … + am m = ,

a0 1 + a1 + a2 + … + am = , (3.2)

……………………………………………..

a0 + a1 + a2 + … + am = .

Для решения системы (3.2) можно использовать любой метод решения системы линейных уравнений (Гаусса, Крамера и пр.). Оцененное уравнение описывает как общий тренд (тенденцию) изменения зависимой переменной у, так и отклонения от этого тренда. Проблема здесь состоит не только в том, чтобы объяснить возможно большую долю колебаний переменной у, но и отделить влияние каждого из факторов.