Основные этапы регрессионного анализа
Понятие эконометрики и ее место в экономических исследованиях
Эконометрика – математическое моделирование реальных экономических объектов (бюджета семьи, отдельного предприятия, отрасли промышленности, региона, экономики страны, мировой экономики). Эконометрика изучает количественные закономерности и взаимозависимости между анализируемыми экономическими показателями при помощи методов математической статистики.
В основе этих методов лежит корреляционно-регрессионный анализ. Впервые современные методы математической статистики стали использоваться в биологии. В конце XIX века английский биолог К. Пирсон положил начало современной математической статистике изучением кривых распределения числовых характеристик организма. Затем он и его школа перешли к изучению корреляций в биологии и построению линейных функций регрессии.
Эконометрические модели позволяют определять особенности поведения экономического объекта и на основе этого предсказывать его функционирование при изменении каких-либо параметров. Т.е. эконометрическое исследование предполагает получение конкретного, количественного результата для исследуемого экономического объекта. Такое исследование должно базироваться на объединении теории (различных экономических моделей) и практики (данных статистических исследований). Как свидетельствует экономическая теория, в экономике действуют устойчивые количественные закономерности, поэтому возможно их строго формализованное математическое описание (описание знаковыми математическими средствами), построение математических моделей.
К основным этапам эконометрического исследования можно отнести следующие:
1. Постановка проблемы
На данном этапе выбирают ряд экономических показателей, зависимость между которыми нужно выявить и исследовать.
2. Сбор и анализ статистических данных
На данном этапе по выбранным ранее показателям собирают статистические данные. Сбор статистических данных может происходить либо методом опросов, анкетирования, либо используя официальную статистическую информацию, то есть статистические сборники, которые выходят ежегодно.
3. Построение эконометрической модели.
На данном этапе необходимо представить экономическую модель в математической форме, удобной для дальнейшего анализа. Этот этап называют этапом спецификации модели.
4. Оценка параметров модели
На данном этапе необходимо по отдельным методам количественно определить параметры выбранной модели, делающих эту модель наиболее адекватной к реальным статистическим данным, которые были получены на втором этапе исследования.
5. Проверка качества построенной модели и найденных параметров
На данном этапе по определенным критериям необходимо доказать, что построенная модель и найденные параметры надлежащего качества. Если построенная модель или найденные параметры низкого качества необходимо указать основные причины, по которым была получена модель низкого качества.
6. Использование построенной модели в экономических исследованиях
На данном этапе полученную модель необходимо уметь использовать для объяснения поведения исследуемых показателей, осмысленного проведения экономической политики и построения прогноза.
Между двумя показателями X и Y можно указать два вида взаимосвязей.
1. Оба показателя являются равнозначными, то есть не подразделяются на зависимый и независимый (цена на товар и объем спроса на этот товар). Основным в этом случае является вопрос о наличии и силе взаимосвязи. Для анализа таких показателей зачастую используют корреляционный анализ.
2. Один из показателей выделяется как независимый (объясняющий) Х, а другой как независимый (объясняемый) Y (среднемесячный доход и потребление продуктов питания). В данном случае изменение первого из них влечет изменение второго. Для анализа таких показателей используют корреляционно-регрессионный анализ.
В чем же разница между корреляцией и регрессией? На первый взгляд может показаться, что понятие регрессии сходно с понятием корреляции, так как в обоих случаях речь идет о статистической взаимосвязи между переменными. Однако между ними есть существенные различия.
Корреляция ничего не говорит о причинной зависимости между переменными, то есть если наличие корреляции между переменными Х и Y, этот факт не подразумевает того, что изменения значений Х обуславливают изменения значений Y, или наоборот. Корреляция всего лишь констатирует факт того, что изменения одной переменной в среднем соотносятся с изменениями другой.
Однако в случае регрессионного анализа подразумевается именно причинная взаимосвязь, то есть изменения одной переменной происходят вследствие изменений другой.
Регрессия – функциональная зависимость между объясняющими переменными и условным математическим ожиданием зависимой переменной, которая строится с целью прогнозирования среднего значения зависимой переменной, при фиксированных значениях первых.
(2.1)
у – зависимая переменная (результативный признак)
х1, х2,…,хm – объясняющие переменные (независимые)
ε – случайные отклонения
Причины присутствия в моделях случайных отклонений:
1. Не включение в модель всех объясняющих переменных
2. Неправильный выбор функциональной формы в модели
3. Агрегирование переменных
4. Ошибки измерения
5. Ограниченность статистических данных
6. Непредсказуемость человеческого фактора.
В зависимости от числа объясняющих переменных регрессия подразделяется на парную (однофакторная) и множественную, по типу связи – на линейную и нелинейную. Виды регрессионных связей можно увидеть на рис. 2.1.1.
В случае парной регрессии вид зависимости между переменными можно выбрать с помощью изображения корреляционного поля. Корреляционное поле – графическое изображение статистических данных на плоскости. По расположению точек на корреляционном поле выдвигают предположение о виде функциональной зависимости между переменными.
На рис.2.1.2, а взаимосвязь между переменными близка к линейной функции. На рис.2.1.2, б взаимосвязь между переменными, скорее всего, описывается квадратичной функцией.