Понятие о функциональной, статистической и корреляционных связях. Основные задачи корреляционно-регрессионного анализа.
Различают 2 основных формы причинных зависимостей:
Функциональная зависимость между двумя переменными величинами характеризуется тем, что каждому значению одной из них соответствует определённое значение другой. Такой зависимостью связаны, например, радиус круга и его площадь, количество купленного товара и его стоимость, количество потребляемой абонентом электроэнергии и плата за неё и другое.
Однако часто встречаются переменные величины, которые являются зависимыми, но каждому значению одной соответствует не определённое, а некоторое множество значений другой, причём число значений и сами эти значения не отражают определённой закономерности.
Множество значений переменной y, соответствующих фиксированному значению переменной x, будем рассматривать как соответствующее ему распределение переменной y.
Переменные величины x и y связаны статистически, если каждому значению одной из них соответствует распределение другой, меняющееся с изменением первой величины и по вариантам и по частотам.
Таким образом, при корреляционной связи каждому значению аргумента соответствует не одно, а несколько значений функции и между ними нет тесной зависимости. Корреляционной зависимостью между двумя переменными величинами называется функциональная зависимость между значениями одной из них и групповыми средними другой.
(y на x) (x на y)
Уравнения, выражающие в общем виде корреляционные зависимости, называются корреляционными уравнениями или уравнениями регрессии.
Различают линейные и нелинейные регрессии.
Линейная регрессия: или .
Нелинейные регрессии делятся на два класса:
1) регрессии, нелинейные относительно включённых в анализ объясняющих переменных, но линейные по оцениваемым параметрам:
· полиномы разных степеней: ;
· равносторонняя гипербола: ;
2) регрессии, нелинейные по оцениваемым параметрам:
· степенная: ;
· показательная: ;
· экспоненциальная: .
В зависимости от количества факторов, включённых в уравнение регрессии, принято различать: простую (парную) и множественную регрессии.
Простая регрессия – представляет собой регрессию между двумя переменными y и x, то есть вида , где - зависимая переменная (результативный признак); - независимая или объясняющая переменная (признак – фактор).
Множественная регрессия – представляет собой регрессию результативного признака с двумя и большим числом факторов, то есть модель вида .
Любое эконометрическое исследование начинается о спецификации модели, то есть с формулировки вида модели, исходя из соответствующей теории связи между переменными. То есть исследование начинается с теории, устанавливающей связь между явлениями.
Прежде всего, из всего круга факторов, влияющих на результативный признак, необходимо выделить наиболее существенно влияющие факторы. Парная регрессия достаточна, если имеется доминирующий фактор, который и используется в качестве объясняющей переменной.
Рассмотрим гипотезу: величина спроса y на товар А находится в обратной зависимости от цены x
в уравнении регрессии корреляционная связь признаков представлена в виде функциональной связи, выраженной соответствующей математической функцией.
Статистические связи между переменными изучаются методами корреляционного и регрессионного анализа.
Основной задачей регрессионного анализа является установление формы и изучение зависимости между переменными.
Основной задачей корреляционного анализа – выявление связей между случайными переменными и оценка её тесноты.
Этапы эконометрического моделирования.
1. Постановочный этап, на котором определяются конечные цели и задачи исследования, а также число включенных в модель факторных и результативных экономических переменных.
Цели эконометрического исследования:
1) анализ изучаемого экономического процесса (явления, объекта);
2) прогноз экономических показателей, характеризующих изучаемый процесс (явление, объект);
3) моделирование поведения процесса при различных значениях факторных переменных;
4) формирование управленческих решений.
Количество переменных, включенных в эконометрическую модель, не должно быть слишком большим и должно быть теоретически обоснованным. В модели должна отсутствовать функциональная или тесная корреляционная связь между факторными переменными, что может привести к явлению мультиколлинеарности.
2. Априорный этап, на котором осуществляется теоретический анализ сущности изучаемого процесса, а также формализуется априорная информация.
3. Этап параметризации, на котором происходит выбор общего вида модели, а также определяется состав и формы формирующих ее связей.
Задачи, решаемые на этапе параметризации:
1) задача выбора наиболее подходящего вида функциональной зависимости результативной переменной от факторных переменных.
При возникновении ситуации выбора между линейной и нелинейной формами зависимости предпочтение всегда отдается линейной форме как более простой;
2) задача спецификации модели:
а) аппроксимация математической формой обнаруженных связей и соотношений между параметрами модели;
б) определение зависимых и независимых переменных;
в) выражение исходных предпосылок и ограничений модели.
4. Информационный этап, на котором собирается требуемая статистическая информация и осуществляется анализ качества собранных данных.
5. Этап идентификации модели, на котором реализуется статистический анализ модели и происходит оценивание ее параметров.
6. Этап оценки качества модели, на котором проверяются достоверность и адекватность модели. Созданная модель должна быть адекватна реальному экономическому процессу. При неудовлетворительном качестве модели возвращаются ко второму этапу моделирования.
7. Этап интерпретации результатов моделирования.
В эконометрике применяется два основных типа выборочных данных:
1) пространственные;
2) временные.
Пространственные данные — это совокупность экономической информации, характеризующей разные объекты и полученной за определенный период или момент времени.
Пространственные данные являются выборочной совокупностью из некоторой генеральной совокупности (например, совокупность различной информации по какому-либо предприятию—размер основных фондов, численность работников).
Временные данные — это совокупность экономической информации, характеризующей определенный объект, но за различные периоды времени. Отдельный временной ряд можно считать выборкой из бесконечного ряда значений показателей во времени (например, данные о динамике фондовых индексов).
Существуют определенные отличия временного ряда или ряда динамики от пространственной выборки:
1) элементы ряда динамики естественным образом упорядочены во времени в отличие от пространственных данных;
2) элементы ряда динамики не являются статистически независимыми в отличие от элементов случайной пространственной выборки, т.е. они подвержены зависимости между прошлыми и настоящими наблюдениями временного ряда (автокорреляции);
3) элементы ряда динамики не являются одинаково распределенными величинами.
Набор переменных — это совокупность экономической информации, характеризующей
изучаемый процесс или объект. В эконометрической модели используются:
1) результативные (зависимые) переменные, которые в эконометрике называются объясняемыми переменными;
2) факторные (независимые) переменные, которые в эконометрике называются объясняющими переменными.
Среди экономических переменных, включенных в эконометрическую модель, выделяют:
1) экзогенные (независимые) переменные (х), значения которых задаются извне. В определенной степени данные переменные являются управляемыми;
2) эндогенные (зависимые или взаимозависимые) переменные (у), значения которых определяются внутри модели;
3) лаговые (экзогенные или эндогенные) переменные, которые относятся к предыдущим моментам времени и находятся в уравнении с переменными, относящимися к текущему моменту времени. Например, хt-1 — лаговая экзогенная переменная, уt-1 — лаговая эндогенная переменная;
4) предопределенные (объясняющие) переменные, к которым относятся лаговые (хt-1), текущие (х) экзогенные переменные и лаговые эндогенные переменные (уt-1).
Основная цель эконометрического моделирования — это характеристика значений одной или нескольких текущих эндогенных переменных в зависимости от значений предопределенных (объясняющих) переменных.
Данные, характеризующие различные объекты (например, квартиры) и относящиеся к одному моменту или периоду времени, называются пространственными.
Отметим, что экзогенные переменные (например, характеристики конкретной квартиры, см. пример I) могут быть как количественными (жилая площадь), так и качественными (панельный или кирпичный дом). Ясно, что никакая, даже очень подробная модель, не в состоянии учесть все факторы, влияющие на пену квартиры, поэтому цена каждой конкретной квартиры зависит от экзогенных переменных неоднозначно, содержит случайную составляющую.
При построении регрессионных моделей приходится решать следующие основные задачи:
1) определение вида функциональной связи между зависимой и независимыми (объясняющими) переменными (спецификация модели) с точностью до параметров;
2) формулировка гипотез относительно случайной составляющей;
3) подгонка некоторого, в общем случае не обязательно линейного, уравнения к заданному набору пространственных данных (оценка параметров модели);
4) проверка адекватности модели, т. е. ее соответствия наблюдаемым данным.