Парная линейная регрессия.

ПАРНАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ.

ЛЕКЦИЯ 4.

Цель: рассмотреть вопросы взаимосвязи экономических переменных, суть регрессионного анализа, парной линейной регрессии и корреляции. Для нахождения параметров уравнения линейной регрессиинаучиться использовать метод наименьших квадратов.

Ключевые слова: корреляционная связь, уравнение парной регрессии, метод наименьших квадратов, коэффициент корреляции.

План лекции:

1. Парная линейная регрессия.

2. Метод наименьших квадратов.

3. Коэффициент корреляции.

Различные экономические показатели, как на микро, так и на макроуровне не являются независимыми, а связаны между собой. Например, цена какого - либо товара и величина спроса на этот товар, объем производства и прибыль фирмы, располагаемый доход и объем личного потребления, инфляция и безработица. Задачей регрессионного анализа является установление формы зависимости между переменными.

В естественных науках часто речь идет о функциональной зависимости, когда каждому значению одной переменной соответствует единственное значение другой.

Взаимосвязи экономических показателей редко имеют простой функциональный вид, так как на интересующий нас показатель, оказывают влияние и множество других случайных факторов. В результате чего каждому значению одной переменной может соответствовать множество значений другой переменной. Например, домохозяйства с одинаковым среднемесячным доходом имеют разный объем расходов на продукты питания в месяц. Т.е. под влиянием каких-то неучтенных факторов расставляются приоритеты в потребительской корзине. Связь переменных, на которую воздействуют случайные факторы называется статистической связью. Статистическая зависимость называется корреляционной, если каждому значению одной переменной соответствует определенное условное математическое ожидание (среднее значение) другой.

Пусть требуется оценить связь между переменными Х и У, т.е. нужно найти формулы этой связи. Для решения такой задачи используются статистические данные о динамике этих показателей. Пусть имеется ряд значений показателя Х: х₁, х₂, …, х_n и ряд значений показателя У: у₁, у₂, …, у_n. Построим точки (х₁, у₁), (х₂, у₂), ..., (х_n, у_n) на графике и соединим их линией. Если это реальные статистические данные, то мы никогда не получим простую линию - линейную, квадратичную, экспоненциальную и т.д. Всегда будут присутствовать отклонения зависимой переменной, вызванные ошибками, измерения или влиянием случайных факторов.

Рассмотрим в качестве примера зависимость между прибылью (тыс. тг.) и выработкой продукции на одного человека (ед.) по 12 предприятиям:

№ предприятия

Прибыль, у

Выработка, х

На рисунке представлено поле корреляции эмпирических значений переменных, которые были аппроксимированы линейным уравнением регрессии:

Уравнение регрессии – это формула статистической связи между переменными. Уравнение линейной регрессии имеет вид:

у = а + b·х

Величина у является объясняемой (зависимой) переменной или результирующим признаком, а х - объясняющей (независимой) переменной или факторным признаком. Постоянные а и b называются параметрами уравнения.

В зависимости от количества факторов, включенных в уравнение регрессии, принято различать парную (от двух переменных) и множественную (от нескольких переменных) регрессии.