И нахождения параметров уравнения регрессии.
Классический метод наименьших квадратов (МНК)
На первом этапе проведения регрессионного анализа была выбрана функция
f(
x), отражающая зависимость результативного признака
y от факторного признака
x. Необходимо оценить неизn вестные параметры модели. В качестве методов оценки неизвестn ных параметров
уравнения регрессии b ,
ј, b
могут выступать:
1) сумма квадратов отклонений наблюдаемых значений реn зультативного признака
y от теоретических значений
y, расn считанных на основании регрессионной функции,
f(
x):
n
F = (
yi−
f (
xi, ))2
i=
n
или
F = (
yi−
yi)2.
i=
Этот метод оценивания неизвестных параметров уравнения регрессии называется методом наименьших квадратов (МНК). Термин МНК был впервые использован в работе А.М.Лежанйдра в 1805 г. Можно выделить следующие достоинства метода:
а) расчеты сводятся к механической процедуре нахождеn ния коэффициентов;
б) доступность полученных математических выводов. Основным недостатком МНК является чувствительность оцеn нок к резким выбросам, которые встречаются в исходных данn ных.
2) сумма модулей отклонений наблюдаемых значений резульn тативного признака
y от теоретических значений
y(рассчиn танных на основании регрессионной функции )
f(
x):
n
F =
yi−
f (
xi, )
i=1
n
или
F =
yi−
yi.
i=1
Основным достоинством метода является нечувствительность оценок к резким выбросам (в отличие от МНК). Среди недоГ статков можно выделить следующие:
а) сложности в ходе вычислительной процедуры;
б) зачастую большим отклонениям в исходных данных следует придавать больший вес для уравновешивания их в общей сумме наблюдений;
в) неодинаковым значениям оцениваемых параметров b, ј, b могут соответствовать одинаковые суммы модулей отклоn нений;
n n
F =
g(
yi−
f (
xi, )) или
F =
g(
yi−
yi),
i=1
i=1
где g — мера или вес, с которой отклонение (yi— f(xi,b)) входит в функционал F. Примером меры g является функn
ция Хубера, которая при малых значениях переменной x является квадратичной, а при больших значениях x — лиn
нейной:
ì
x2,
x<
c
g(
x)= 2
cx−
c2,
x ³
c −2
cx−
c2,
x£−
c ,
где c — ограничения функции.
Третий метод оценки неизвестных параметров уравнения реn грессии b, ј, b — объединие достоинства предыдущих двух меn тодов. Оценки неизвестных параметров, найденные с его помоn щью, являются менее чувствительными к случайным выбросам в исходных данных, чем оценки, полученные МНК. Этот метод применяют, когда выборка сильно «засорена».
Для нахождения оптимальных значений неизвестных паn раметров b, ј, b
необходимо минимизировать функционал F по данным параметрам:
n
1)
F = (
yi−
f (
xi, ))2®min —процессминимизации
i1 функционала
F состоит в отыскании таких параметров b, ј, b, при которых сумма квадратов отклонений наблюдаемых значений результативноn го признака
yот теоретических значений
y была бы минимальной;
n
2)
F =
y −
f (
x , ) ®min —процессминимизации
i=1 функционала
F состоит
в отыскании таких параметров b, ј, b, при которых сумма
модулей отклонений наблюдаемых значений результативного признака
yот теоретических значений
yбыла бы минимальной;
n
3)
F =
g (
yi−
f (
xi, ))®min
i=1
— процесс минимизации функционала F состоит
в отыскании таких параметров b, ј, b, при которых сумма отклонений наблюдаемых значений результативного признаn ка
y от теоретических значений
yс учетом заданных весов g была бы минимальной.
Наиболее распространенным методом оценивания параметn ров уравнения регрессии является метод наименьших квадратов.