Уравнение регрессии.
. Уравнение регрессии, его смысл и назначение. Выбор типа матем-й функции при построении уравнения регрессии.
Смысл регрессионного анализа – построение функциональных зависимостей между двумя группами переменных величин Х1, Х2, … Хр и Y. При этом речь идет о влиянии переменных Х (это будут аргументы функций) на значения переменной Y (значение функции). Переменные Х мы будем называть факторами, а Y – откликом.
Сегодня мы разберем наиболее простой случай – установление зависимости одного отклика y от одного фактора х. Такой случай называется парной (простой) регрессией.
Построение модели
Исходные данные: заранее известные (экспериментальные, наблюденные) значения фактора хi – экзогенная переменная и соответствующие им значения отклика yi, (i = 1,…,n) - эндогенная переменная;
Активный и пассивный эксперимент.
Выборочные характеристики – позволяют кратко охарактеризовать выборку, т. е., получить ее модель, хотя и очень грубую а) среднее арифметическое:
Среднее арифметическое – это «центр», вокруг которого колеблются значения случайной величины.
.6) Выбор типа матем-й функции при построении уравнения регрессии.
.Выбор типа математической функции при построении уравнения регрессии
В парной регрессии выбор вида математической функции ŷх = f(x) может быть осуществлен тремя методами:
1. графическим;
2. аналитическим, т.е. исходя из теории изучаемой взаимосвязи;
3. экспериментальным.
Класс математических ф-ий для описания связи двух переменных достаточно широк. Основными явл-ся следующие:
1. ŷх = a + b*x;
2. ŷх = a + b/x;
3. ŷх = a*xb;
4. ŷх = a + b*x + c*x2;
5. ŷх = a + b*x + c*x2 + d*x3;
6. ŷх = a*bx.
Для построения уравнения множественной регрессии чаще используются следующие функции:
Линейная – y=a+b1x1+b2x2+…+bpxp+ε
Степенная -
Экспонента -
Гипербола -
Можно использовать и другие функции, приводимые к линейному виду
Спецификация модели включает в себя два круга вопросов: отбор факторов и выбор вида уравнения регрессии. Требования к факторам:
1.Они должны быть количественно измеримы.
2.Факторы не должны быть коррелированы между собой и тем более находиться в точной функциональной зависимости
МНК.
Метод оценивания заключается в построении двух уравнений регрессии средних значений интересующего нас показателя для двух сравниваемых групп индивидов в зависимости от контрольных показателей методом наименьших квадратов. Общий принцип данного метода мы сравниваем средние значения интересующего нас показателя. мы можем составить уравнение регрессии для каждой группы:
Yi = βxi + sDi + ui
Где Yi — среднее значение интересующего нас показателя, Di — так называемая «дамми» — переменная участия в программе (D=0, 1), а s — показатель эффекта от проведения программы. в рамках метода построения регрессии мы вводим некоторый контроль ряда переменных (xi), решая тем самым проблему «несопоставимости» сравниваемых индивидов также мы можем контролировать переменную xi — «уровень дохода» и сравнить уровень образования участвовавших и не участвовавших в программе индивидов, изначально обладающих одинаковым уровнем дохода (живущих в одном регионе и т. д.).
Благодаря этому методу, таким образом, мы можем получить два уравнения регрессии — то есть две линейные зависимости интересующего нас показателя от контрольных характеристик, на основании чего можем делать соответствующие оценивающие выводы. В простейшем виде это может выглядеть так: для простоты рассмотрим все тот же пример реализации образовательной программы. Для получения оценки её эффективности необходимо сравнить средний уровень образования после проведения программы у тех, кто в ней участвовал (Y (D1), и тех, кого данная программа не касалась (Y (D0). Однако теперь мы производим сравнение только между индивидами, обладающими одним уровнем дохода (Xi) тем самым решая проблему несопоставимости индивидов: сравнивать бенефициара с индивидов больше не придется.