Уравнение регрессии.

. Уравнение регрессии, его смысл и назначение. Выбор типа матем-й функции при построении уравнения регрессии.

Смысл регрессионного анализа – построение функциональных зависимостей между двумя группами переменных величин Х1, Х2, … Хр и Y. При этом речь идет о влиянии переменных Х (это будут аргументы функций) на значения переменной Y (значение функции). Переменные Х мы будем называть факторами, а Y – откликом.

Сегодня мы разберем наиболее простой случай – установление зависимости одного отклика y от одного фактора х. Такой случай называется парной (простой) регрессией.

Построение модели

Исходные данные: заранее известные (экспериментальные, наблюденные) значения фактора хi – экзогенная переменная и соответствующие им значения отклика yi, (i = 1,…,n) - эндогенная переменная;

Активный и пассивный эксперимент.

Выборочные характеристики – позволяют кратко охарактеризовать выборку, т. е., получить ее модель, хотя и очень грубую а) среднее арифметическое:

Среднее арифметическое – это «центр», вокруг которого колеблются значения случайной величины.

.6) Выбор типа матем-й функции при построении уравнения регрессии.

.Выбор типа математической функции при построении уравнения регрессии

В парной регрессии выбор вида математической функции ŷх = f(x) может быть осуществлен тремя методами:

1. графическим;

2. аналитическим, т.е. исходя из теории изучаемой взаимосвязи;

3. экспериментальным.

Класс математических ф-ий для описания связи двух переменных достаточно широк. Основными явл-ся следующие:

1. ŷх = a + b*x;

2. ŷх = a + b/x;

3. ŷх = a*xb;

4. ŷх = a + b*x + c*x2;

5. ŷх = a + b*x + c*x2 + d*x3;

6. ŷх = a*bx.

Для построения уравнения множественной регрессии чаще используются следующие функции:

 Линейная – y=a+b1x1+b2x2+…+bpxp+ε

 Степенная -

 Экспонента -

 Гипербола -

Можно использовать и другие функции, приводимые к линейному виду

Спецификация модели включает в себя два круга вопросов: отбор факторов и выбор вида уравнения регрессии. Требования к факторам:

1.Они должны быть количественно измеримы.

2.Факторы не должны быть коррелированы между собой и тем более находиться в точной функциональной зависимости

МНК.

Метод оценивания заключается в построении двух уравнений регрессии средних значений интересующего нас показателя для двух сравниваемых групп индивидов в зависимости от контрольных показателей методом наименьших квадратов. Общий принцип данного метода мы сравниваем средние значения интересующего нас показателя. мы можем составить уравнение регрессии для каждой группы:

Yi = βxi + sDi + ui

 

Где Yi — среднее значение интересующего нас показателя, Di — так называемая «дамми» — переменная участия в программе (D=0, 1), а s — показатель эффекта от проведения программы. в рамках метода построения регрессии мы вводим некоторый контроль ряда переменных (xi), решая тем самым проблему «несопоставимости» сравниваемых индивидов также мы можем контролировать переменную xi — «уровень дохода» и сравнить уровень образования участвовавших и не участвовавших в программе индивидов, изначально обладающих одинаковым уровнем дохода (живущих в одном регионе и т. д.).

 

Благодаря этому методу, таким образом, мы можем получить два уравнения регрессии — то есть две линейные зависимости интересующего нас показателя от контрольных характеристик, на основании чего можем делать соответствующие оценивающие выводы. В простейшем виде это может выглядеть так: для простоты рассмотрим все тот же пример реализации образовательной программы. Для получения оценки её эффективности необходимо сравнить средний уровень образования после проведения программы у тех, кто в ней участвовал (Y (D1), и тех, кого данная программа не касалась (Y (D0). Однако теперь мы производим сравнение только между индивидами, обладающими одним уровнем дохода (Xi) тем самым решая проблему несопоставимости индивидов: сравнивать бенефициара с индивидов больше не придется.