Методические указания к выполнению лабораторной работы
Задача 1
По данным, представленным в таблице 1, изучается зависимость балансовой прибыли предприятия торговли Y (тыс. руб.) от следующих факторов:
X 1 - объем товарных запасов, тыс. руб.;
X 2 - фонд оплаты труда, тыс. руб.;
X 3 - издержки обращения, тыс. руб.;
X4 - объем продаж по безналичному расчету, тыс. руб.
Таблица 6.1.
Месяц | У | Х1 | Х2 | Х3 | Х4 |
41321,57 | 300284,10 | 19321,80 | 42344,92 | 100340,02 | |
40404,27 | 49107,21 | 20577,92 | 49000,43 | 90001,35 | |
37222,12 | 928388,75 | 24824,91 | 50314,52 | 29301,98 | |
37000,80 | 724949,11 | 28324,87 | 48216,41 | 11577,42 | |
29424,84 | 730855,33 | 21984,07 | 3301,30 | 34209,84 | |
20348,19 | 2799881,13 | 11000,02 | 21284,21 | 29300,00 | |
11847,11 | 1824351,20 | 4328,94 | 28407,82 | 19531,92 | |
14320,64 | 1624500,80 | 7779,41 | 40116,00 | 17343,20 | |
18239,46 | 1115200,93 | 18344,11 | 32204,98 | 4391,00 | |
22901,52 | 1200947,52 | 20937,31 | 30105,29 | 14993,25 | |
27391,92 | 1117850,93 | 27344,30 | 40294,40 | 104300,00 | |
44808,37 | 1379590,02 | 31939,52 | 42239,79 | 119804,33 | |
40629,28 | 588365,77 | 29428,60 | 55584,35 | 155515,15 | |
31324,80 | 434281,91 | 30375,82 | 49888,17 | 60763,19 | |
34847,92 | 1428243,59 | 33000,94 | 59866,55 | 8763,25 | |
33241,32 | 1412181,59 | 31322,60 | 49975,79 | 4345,42 | |
29971,34 | 1448274,10 | 20971,82 | 3669,92 | 48382,15 | |
17114,90 | 4074616,71 | 11324,93 | 26032,95 | 10168,00 | |
8944,94 | 1874298,99 | 8341,52 | 29327,21 | 22874,40 | |
17499,58 | 1525436,47 | 10481,14 | 40510,01 | 29603,05 | |
19244,80 | 1212238,89 | 18329,90 | 37444,69 | 16605,16 | |
34958,32 | 1154327,22 | 29881,52 | 36427,22 | 32124,63 | |
44900,83 | 1173125,03 | 34928,60 | 51485,62 | 200485,00 | |
57300,25 | 1435664,93 | 41824,92 | 49959,92 | 88558,62 |
Задание:
1. Для заданного набора данных постройте линейную модель множественной регрессии.
2. Оцените точность и адекватность построенного уравнения регрессии.
3. Выделите значимые и незначимые факторы в модели.
4. Постройте уравнение регрессии со статистически значимыми факторами. Дайте экономическую интерпретацию параметров модели.
5.Для полученной модели проверить выполнение условия гомоскедастичности остатков, применив тест Голдфельда-Квандта.
6.Проверить полученную модель на наличие автокорреляции остатков с помощью теста Дарбина-Уотсона.
Решение.
Для получения отчета по построению модели в среде EXCEL необходимо выполнить следующие действия:
1. В меню Сервис выбираем строку Анализ данных. На экране появится окно
Рис. 6.1. Анализ данных
2. В появившемся окне выбираем пункт Регрессия. Появляется диалоговое окно, в котором задаем необходимые параметры.
3. Диалоговое окно заполняется следующим образом:
Входной интервал Y - диапазон (столбец), содержащий данные со знамениями объясняемой переменной;
Входной интервал X - диапазон (столбцы), содержащий данные со значениями объясняющих переменных.
Метки - флажок, который указывает, содержат ли первые элементы отмеченных диапазонов названия переменных (столбцов) или нет;
Константа-ноль - флажок, указывающий на наличие или отсутствие свободного члена в уравнении регрессии ( );
Выходной интервал - достаточно указать левую верхнюю ячейку будущего диапазона, в котором будет сохранен отчет по построению модели;
Новый рабочий лист - можно задать произвольное имя нового листа, в котором будет сохранен отчет.
Если необходимо получить значения и графики остатков (еi), установите соответствующие флажки в диалоговом окне. Нажмите на кнопку ОК.
Вид отчета о результатах регрессионного анализа представлен на рис. 6.2.
Рис. 6.2. Вывод итогов
Рассмотрим таблицу "Регрессионная статистика".
Множественный R - это , где R2 - коэффициент детерминации.
R-квадрат — это R2. В нашем примере значение R2 = 0,8178 свидетельствует о том, что изменения зависимой переменной Y (балансовой прибыли) в основном (на 81,78%) можно объяснить изменениями включенных в модель объясняющих переменных – X1, Х2, X3, X4. Такое значение свидетельствует об адекватности модели.
Нормированный R-квадрат - поправленный (скорректированный по числу степеней свободы) коэффициент детерминации.
Стандартная ошибка регрессии S = , где S2 = - необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии); п — число наблюдений (в нашем примере равно 24), т - число объясняющих переменных (в нашем примере равно 4).
Наблюдения - число наблюдений п.
Рассмотрим таблицу с результатами дисперсионного анализа.
df - degrees of freedom - число степеней свободы связано с числом единиц совокупности п и с числом определяемых по ней констант (m+1).
55 - sum of squares - сумма квадратов (регрессионная (RSS-regression sum of squares), остаточная (ESS — error sum of squares) и общая (TSS— total sum of squares), соответственно). MS-mean sum - сумма квадратов на одну степень свободы.
F - расчетное значение F-критерия Фишера. Если нет табличного значения, то для проверки значимости уравнения регрессии в целом можно посмотреть Значимость F. На уровне значимости уравнение регрессии признается значимым в целом, если Значимость F < 0.05, и незначимым, если Значимость F 0.05.
Для нашего примера имеем следующие значения (таблица 6.2.)
Таблица 6.2.
Результаты дисперсионного анализа
df | SS | MS | F | Значимость F | |
Регрессия | m = 4 | RSS=2,82E+09 | RSS/df=7,04E+08 | 21,32 | 8,28E-07 |
Остаток | n-m-1=19 | ESS=6,27E+08 | ESS/df=3,30E+07 | ||
Итого | n-1 = 23 | TSS=3,44E+09 |
Расчетное значение F-критерия Фишера составляет 21,32.
Значимость F= 8,28Е-07, что меньше 0,05. Таким образом, полученное уравнение в целом значимо.
В таблице 6.3. приведены значения параметров (коэффициентов) модели, их стандартные ошибки и расчетные значения t-критерия Стьюдента для оценки значимости отдельных параметров модели.
Таблица 6.3.
Оценка коэффициентов регрессии
Коэффициенты | Стандартная ошибка | t-статистика | Р-Значение | Нижние 95% | Верхние 95% | |
Y | b0 = 7825.51 | mb0=5350.78 | tb0 = 7825.51 / 5350.78 = = 1,4625 | 0.1599 | -3373.80 b0 19024.83 | |
X1 | b1=-0.00098 | mb1=0.00172 | tb1=-0.569 | 0.5762 | -0,0046 b1 0,0026 | |
X2 | b2=0.8806 | mb2=0.15891 | tb2=5.5417 | 0.00002 | 0,5480 b2 1,2132 | |
X3 | b3=0.0094 | mb3=0.09754 | tb3=0.0961 | 0.9244 | -0,1948 b3 0,2135 | |
X4 | b4=0.0617 | mb4=0.02647 | tb4=2.3312 | 0.0309 | 0,0063 b4 0,1171 |
Анализ таблицы 6.3. позволяет сделать вывод о том, что на уровне значимости = 0.05 значимыми оказываются лишь коэффициенты при факторах X2 и Х4, так как только для них Р-значение меньше 0,05. Таким образом, факторы X1 и Х3не существенны, и их включение в модель нецелесообразно.
Поскольку коэффициент регрессии в эконометрических исследованиях имеют четкую экономическую интерпретацию, то границы доверительного интервала для коэффициента регрессии не должны содержать противоречивых результатов, как, например -0,1948 b3 0,2135. Такого рода запись указывает, что истинное значение коэффициента регрессии одновременно содержит положительные и отрицательные величины и даже ноль, чего не может быть. Это также подтверждает вывод о статистической незначимости коэффициентов регрессии при факторах X1 и Х3.
Исключим несущественные факторы X1 и Х3и построим уравнение зависимости Y (балансовой прибыли) от объясняющих переменных X2 и Х4. Результаты регрессионного анализа приведены в таблицах 6.4., 6.5., 6.6.
Таблица 6.4.
Регрессионная статистика
Множественный R | 0,9024465 |
R-квадрат | 0,8144098 |
Нормированный R-квадрат | 0,7967345 |
Стандартная ошибка | 5515,53984 |
Наблюдения |
Таблица 6.4.
Дисперсионный анализ
df | SS | MS | F | Значимость F | |
Регрессия | 46,076253 | 2,08847E-08 | |||
Остаток | 638844774,1 | 30421179,72 | |||
Итого |
Таблица 6.4.
Оценка коэффициентов регрессии
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | |
Y-пересечение | 5933,1025 | 2844,611998 | 2,085733487 | 0,0493883 | 17,40698 | 11848,798 |
Переменная X 2 | 0,9162546 | 0,132496978 | 6,915286693 | 7,834E-07 | 0,640712 | 1,1917972 |
Переменная X 4 | 0,0645183 | 0,024940789 | 2,58686011 | 0,0172036 | 0,012651 | 0,1163856 |
Оценим точность и адекватность полученной модели.
Значение R2 = 0,8144 свидетельствует о том, что вариация зависимой переменной Y (балансовой прибыли) по-прежнему в основном (на 81,44%) можно объяснить вариацией включенных в модель объясняющих переменных – Х2 и Х4.Это свидетельствует об адекватности модели.
Значение поправленною коэффициента детерминации (0,7967) возросло по сравнению с первой моделью, в которую были включены все объясняющие переменные (0,7794).
Стандартная ошибка регрессии во втором случае меньше, чем в первом (5515 < 5745).
Расчетное значение F-критерия Фишера составляет 46,08. Значимость F = 2.08847Е-08, что меньше 0,05. Таким образом, полученное уравнение в целом значимо.
Далее оценим значимость отдельных параметров построенной модели. Из таблицы 3 видно, что теперь на уровне значимости = 0.05 все включенные в модель факторы являются значимыми: Р-значение < 0,05.
Границы доверительного интервала для коэффициентов регрессии не содержат противоречивых результатов:
с надежностью 0.95 (с вероятностью 95%) коэффициент b1 лежит в интервале 0.64 b1 1,19;
- с надежностью 0.95 (с вероятностью 95%) коэффициент b2 лежит в интервале 0,01 b2 0,12
Таким образом, модель балансовой прибыли предприятия торговли запишется в следующем виде:
= 5933,1 + 0,916*Х2+ 0,065*Х4
Параметры модели имеют следующую экономическую интерпретацию. Коэффициент b1 = 0,916, означает, что при увеличении только фонда оплаты труда (X2)на 1 тыс. руб. балансовая прибыль в среднем возрастает на 0,916 тыс. руб., а то, что коэффициент b2 = 0,065, означает, что увеличение только объема продаж по безналичному расчету (Х4) на 1 тыс. руб. приводит в среднем к увеличению балансовой прибыли на 0,065 тыс. руб. Как было отмечено выше, анализ Р-значений показывает, что оба коэффициента значимы.
Средние коэффициенты эластичности рассчитываются по формуле, приведенной выше в теме 2.
Эх1=0,53*35,75/88,38=0,214
Согласно коэффициенту эластичности по первому фактору - рост цены на 1% приводит к увеличению объема предложения на 0,214%.
Эх2=-9,89*5,44/88,38=-0,609
Второй средний коэффициент эластичности доказывает снижение объема предложения блага на 0,609% при увеличении заработной платы сотрудников фирмы на 1%.
Для выполнения задания 5 снова воспользуемся “Пакетом анализа”, встроенным в EXCEL.
В соответствии со схемой теста Голдфельда-Квандта упорядочим данные по возрастанию переменной X4, предполагая, что дисперсии ошибок зависят от величины этой переменной.
В нашем примере т =n/3 = 8.
Результаты дисперсионного анализа модели множественной регрессии, построенной по первым 8 наблюдениям (после ранжирования по возрастанию переменной Х4), приведены в таблице 6.5.
Таблица 6.5.
Дисперсионный анализ | |||||
df | SS | MS | F | Значимость F | |
Регрессия | 5,07Е+08 | 2.53E+08 | 20,95996 | 0.003707 | |
Остаток | ЕSS1=6.04E+07 | 1.21E+07 | |||
Итого | 5.67E+08 |
Результаты дисперсионного анализа модели, построенной по последним 8 наблюдениям, приведены в таблице 6.6.
Таблица 6.6.
Дисперсионный анализ | |||||
df | SS | MS | F | Значимость F | |
Регрессия | 1,77Е+08 | 1.000617 | 0.398654 | ||
Остаток | ЕSS2=3.98E+08 | ||||
Итого | 5.75E+08 |
Рассчитаем статистику Fрасч, = ESS2/ESS1 (т.к. ESS2>ESS1). Для нашего примера получаем: F= 3,98Е+08/6,04Е+07 = 6,58.
Для того, чтобы узнать табличное значение, воспользуемся встроенной в EXCEL функцией FРАСПОБР(0,05;6;6) с параметрами 0,05 - заданная вероятность ошибки гипотезы Н0; m-р = 8-2 = 6; m-р = 6 - параметры распределения Фишера. Данная функция находится в категории «статистических» функций.
Статистика Fрасч больше табличного значения F= FPACIIOБP(0,05;6;6) = 4,28. Следовательно, модель гетероскедастична.
Для выполнения задания 6 по уравнению регрессии определим значения отклонений еi = yi - , для каждого наблюдения i (i=1,2,..., n).
Для этого в диалоговом окне Регрессия в группе Остатки следует установить одноименный флажок Остатки.
Затем рассчитываем статистику Дарбина-Уотсона по формуле:
Результаты расчетов представлены в таблице 6.7.
Таблица 6.7.
Таким образом, расчетное значение равно d=6,5Е+08/6,4Е+08 = 1,02.
По таблице критических точек распределения Дарбина-Уотсона для заданного уровня значимости , числа наблюдений п и количества объясняющих переменных т определить два значения: dн- нижняя граница и dв,- верхняя граница (таблица 6.8.).
Таблица 6.8
В нашем случае модель содержит 2 объясняющие переменные (m=2), ниж
контрольные вопросы
1.Цели и задачи дисциплины. Место дисциплины в системе экономических дисциплин.
2.История отечественных и зарубежных эконометрических исследований.
3.Состояние и перспективы развития эконометрики.
4.Классификация эконометрических моделей.
5.Определения и основные понятия эконометрики.
6.Исследование взаимосвязи социально-экономических явлений.
7.Причинность, регрессия, корреляция.
8.Корреляционно-регрессионный анализ в экономике. Анализ и обобщение статистической информации.
9.Линейные модели регрессии.
10.Построение модели линейной множественной регрессии.
11.Понятие результативных и факторных признаков.
12.Построение модели связи в стандартизованном масштабе.
13.Интерпретация моделей регрессии.
14.Частные коэффициенты эластичности.
15.Способы расчета параметров уравнения регрессии.
16.Линейные регрессионные модели с гетероскедастичными и автокоррелированными остатками.
17.Тест Голдфельда-Квандта.
18.Тест Дарбина-Уотсона.
19. Метод наименьших квадратов (МНК). Свойства оценок МНК.
20. Обобщенный метод наименьших квадратов (ОМНК).
21.Оценка качества регрессии. Проверка адекватности и достоверности модели.
22. Значимость коэффициентов регрессии (критерий Стъюдента).
23.Дисперсионный анализ. Проверка достоверности модели связи (по F-критерию Фишера).
24. Коэффициенты и индексы корреляции. Мультиколлениарность.
25.Оценка значимости корреляции. Детерминация.
26.Средняя ошибка аппроксимации.
27.Принятие решений на основе уравнений регрессии.
28.Нелинейные регрессионные модели и их линеаризация
29.Нелинейные регрессионные модели. Типы моделей.
30.Регрессионные модели с переменной структурой (фиктивные переменные).
31.Проверка однородности данных. Тест Чоу
32.Производственная функция как функциональная модель сферы производства.
33.Экономическая сущность производственной функции. Основные виды производственных функций. Геометрическая интерпретация (изокванты).
34.Характеристики производственных функций. Линейное уравнение, связывающее темпы прироста.
35.Модели стационарных и нестационарных временных рядов.
36.Временные ряды в экономике. Компоненты временного ряда. Тренд.
37.Проверка гипотезы о существовании тренда. Метод Фостера-Стюарта.
38.Проверка гипотезы о существовании тренда. Критерий Валлиса и Мура.
39.Проверка гипотезы о существовании тренда. Метод разности средних.
40.Оценка устойчивости тенденции.
41.Идентификация временного ряда. Авторегрессионные модели.
42.Модели с распределенными лагами.
43.Метод Алмон.
44.Метод Койка.
45.Прогнозирование на основе временных рядов.
46.Методы выявления периодической компоненты. Модели сезонных колебаний.
47.Системы линейных одновременных уравнений.
48.Идентификация систем эконометрических уравнений.
49.Косвенный, двухшаговый и трехшаговый метод наименьших квадратов.
50.Метод максимального правдоподобия.
8.Рекомендуемая литература