Методические указания к решению задач

Задача 1

По данным, представленным в таблице 1, изучается зависимость балансовой прибыли предприятия торговли Y (тыс. руб.) от следующих факторов:

X 1 - объем товарных запасов, тыс. руб.;

X 2 - фонд оплаты труда, тыс. руб.;

X 3 - издержки обращения, тыс. руб.;

X4 - объем продаж по безналичному расчету, тыс. руб.

Таблица 6.1.

Месяц У Х1 Х2 Х3 Х4
41321,57 300284,10 19321,80 42344,92 100340,02
40404,27 49107,21 20577,92 49000,43 90001,35
37222,12 928388,75 24824,91 50314,52 29301,98
37000,80 724949,11 28324,87 48216,41 11577,42
29424,84 730855,33 21984,07 3301,30 34209,84
20348,19 2799881,13 11000,02 21284,21 29300,00
11847,11 1824351,20 4328,94 28407,82 19531,92
14320,64 1624500,80 7779,41 40116,00 17343,20
18239,46 1115200,93 18344,11 32204,98 4391,00
22901,52 1200947,52 20937,31 30105,29 14993,25
27391,92 1117850,93 27344,30 40294,40 104300,00
44808,37 1379590,02 31939,52 42239,79 119804,33
40629,28 588365,77 29428,60 55584,35 155515,15
31324,80 434281,91 30375,82 49888,17 60763,19
34847,92 1428243,59 33000,94 59866,55 8763,25
33241,32 1412181,59 31322,60 49975,79 4345,42
29971,34 1448274,10 20971,82 3669,92 48382,15
17114,90 4074616,71 11324,93 26032,95 10168,00
8944,94 1874298,99 8341,52 29327,21 22874,40
17499,58 1525436,47 10481,14 40510,01 29603,05
19244,80 1212238,89 18329,90 37444,69 16605,16
34958,32 1154327,22 29881,52 36427,22 32124,63
44900,83 1173125,03 34928,60 51485,62 200485,00
57300,25 1435664,93 41824,92 49959,92 88558,62

Задание:

1. Для заданного набора данных постройте линейную модель множественной регрессии.

2. Оцените точность и адекватность построенного уравнения регрессии.

3. Выделите значимые и незначимые факторы в модели.

4. Постройте уравнение регрессии со статистически значимыми факторами. Дайте экономическую интерпретацию параметров модели.

5.Для полученной модели проверить выполнение условия гомоскедастичности остатков, применив тест Голдфельда-Квандта.

6.Проверить полученную модель на наличие автокорреляции остатков с помощью теста Дарбина-Уотсона.

 

Решение.

Для получения отчета по построению модели в среде EXCEL необходимо выполнить следующие действия:

1. В меню Сервис выбираем строку Анализ данных. На экране появится окно

 

Рис. 6.1. Анализ данных

2. В появившемся окне выбираем пункт Регрессия. Появляется диалоговое окно, в котором задаем необходимые параметры.

3. Диалоговое окно заполняется следующим образом:

Входной интервал Y - диапазон (столбец), содержащий данные со знамениями объясняемой переменной;

Входной интервал X - диапазон (столбцы), содержащий данные со значениями объясняющих переменных.

Метки - флажок, который указывает, содержат ли первые элементы отмеченных диапазонов названия переменных (столбцов) или нет;

Константа-ноль - флажок, указывающий на наличие или отсутствие свободного члена в уравнении регрессии ( );

Выходной интервал - достаточно указать левую верхнюю ячейку будущего диапазона, в котором будет сохранен отчет по построению модели;

Новый рабочий лист - можно задать произвольное имя нового листа, в котором будет сохранен отчет.

Если необходимо получить значения и графики остатков (еi), установите соответствующие флажки в диалоговом окне. Нажмите на кнопку ОК.

Вид отчета о результатах регрессионного анализа представлен на рис. 6.2.

Рис. 6.2. Вывод итогов

Рассмотрим таблицу "Регрессионная статистика".

Множественный R - это , где R2 - коэффициент детерминации.

R-квадрат — это R2. В нашем примере значение R2 = 0,8178 свидетельствует о том, что изменения зависимой переменной Y (балансовой прибыли) в основном (на 81,78%) можно объяснить изменениями включенных в модель объясняющих переменных – X1, Х2, X3, X4. Такое значение свидетельствует об адекватности модели.

Нормированный R-квадрат - поправленный (скорректированный по числу степеней свободы) коэффициент детерминации.

Стандартная ошибка регрессии S = , где S2 = - необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии); п — число наблюдений (в нашем примере равно 24), т - число объясняющих переменных (в нашем примере равно 4).

Наблюдения - число наблюдений п.

Рассмотрим таблицу с результатами дисперсионного анализа.

df - degrees of freedom - число степеней свободы связано с числом единиц совокупности п и с числом определяемых по ней констант (m+1).

55 - sum of squares - сумма квадратов (регрессионная (RSS-regression sum of squares), остаточная (ESS — error sum of squares) и общая (TSS— total sum of squares), соответственно). MS-mean sum - сумма квадратов на одну степень свободы.

F - расчетное значение F-критерия Фишера. Если нет табличного значения, то для проверки значимости уравнения регрессии в целом можно посмотреть Значимость F. На уровне значимости уравнение регрессии признается значимым в целом, если Значимость F < 0.05, и незначимым, если Значимость F 0.05.

Для нашего примера имеем следующие значения (таблица 6.2.)

Таблица 6.2.

Результаты дисперсионного анализа

  df SS MS F Значимость F
Регрессия m = 4 RSS=2,82E+09 RSS/df=7,04E+08 21,32 8,28E-07
Остаток n-m-1=19 ESS=6,27E+08 ESS/df=3,30E+07    
Итого n-1 = 23 TSS=3,44E+09      

 

Расчетное значение F-критерия Фишера составляет 21,32.

Значимость F= 8,28Е-07, что меньше 0,05. Таким образом, полученное уравнение в целом значимо.

В таблице 6.3. приведены значения параметров (коэффициентов) модели, их стандартные ошибки и расчетные значения t-критерия Стьюдента для оценки значимости отдельных параметров модели.

Таблица 6.3.

Оценка коэффициентов регрессии

  Коэффициенты Стандартная ошибка t-статистика Р-Значение Нижние 95% Верхние 95%
Y b0 = 7825.51 mb0=5350.78 tb0 = 7825.51 / 5350.78 = = 1,4625 0.1599 -3373.80 b0 19024.83
X1 b1=-0.00098 mb1=0.00172 tb1=-0.569 0.5762 -0,0046 b1 0,0026
X2 b2=0.8806 mb2=0.15891 tb2=5.5417 0.00002 0,5480 b2 1,2132
X3 b3=0.0094 mb3=0.09754 tb3=0.0961 0.9244 -0,1948 b3 0,2135
X4 b4=0.0617 mb4=0.02647 tb4=2.3312 0.0309 0,0063 b4 0,1171

 

Анализ таблицы 6.3. позволяет сделать вывод о том, что на уровне значимости = 0.05 значимыми оказываются лишь коэффициенты при факторах X2 и Х4, так как только для них Р-значение меньше 0,05. Таким образом, факторы X1 и Х3не существенны, и их включение в модель нецелесообразно.

Поскольку коэффициент регрессии в эконометрических исследованиях имеют четкую экономическую интерпретацию, то границы доверительного интервала для коэффициента регрессии не должны содержать противоречивых результатов, как, например -0,1948 b3 0,2135. Такого рода запись указывает, что истинное значение коэффициента регрессии одновременно содержит положительные и отрицательные величины и даже ноль, чего не может быть. Это также подтверждает вывод о статистической незначимости коэффициентов регрессии при факторах X1 и Х3.

Исключим несущественные факторы X1 и Х3и построим уравнение зависимости Y (балансовой прибыли) от объясняющих переменных X2 и Х4. Результаты регрессионного анализа приведены в таблицах 6.4., 6.5., 6.6.

 

 

Таблица 6.4.

Регрессионная статистика

Множественный R 0,9024465
R-квадрат 0,8144098
Нормированный R-квадрат 0,7967345
Стандартная ошибка 5515,53984
Наблюдения

 

 

Таблица 6.4.

Дисперсионный анализ

df SS MS F Значимость F
Регрессия 46,076253 2,08847E-08
Остаток 638844774,1 30421179,72    
Итого      

 

Таблица 6.4.

Оценка коэффициентов регрессии

Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95%
Y-пересечение 5933,1025 2844,611998 2,085733487 0,0493883 17,40698 11848,798
Переменная X 2 0,9162546 0,132496978 6,915286693 7,834E-07 0,640712 1,1917972
Переменная X 4 0,0645183 0,024940789 2,58686011 0,0172036 0,012651 0,1163856

 

Оценим точность и адекватность полученной модели.

Значение R2 = 0,8144 свидетельствует о том, что вариация зависимой переменной Y (балансовой прибыли) по-прежнему в основном (на 81,44%) можно объяснить вариацией включенных в модель объясняющих переменных – Х2 и Х4.Это свидетельствует об адекватности модели.

Значение поправленною коэффициента детерминации (0,7967) возросло по сравнению с первой моделью, в которую были включены все объясняющие переменные (0,7794).

Стандартная ошибка регрессии во втором случае меньше, чем в первом (5515 < 5745).

Расчетное значение F-критерия Фишера составляет 46,08. Значимость F = 2.08847Е-08, что меньше 0,05. Таким образом, полученное уравнение в целом значимо.

Далее оценим значимость отдельных параметров построенной модели. Из таблицы 3 видно, что теперь на уровне значимости = 0.05 все включенные в модель факторы являются значимыми: Р-значение < 0,05.

Границы доверительного интервала для коэффициентов регрессии не содержат противоречивых результатов:

с надежностью 0.95 (с вероятностью 95%) коэффициент b1 лежит в интервале 0.64 b1 1,19;

- с надежностью 0.95 (с вероятностью 95%) коэффициент b2 лежит в интервале 0,01 b2 0,12

Таким образом, модель балансовой прибыли предприятия торговли запишется в следующем виде:

= 5933,1 + 0,916*Х2+ 0,065*Х4

Параметры модели имеют следующую экономическую интерпретацию. Коэффициент b1 = 0,916, означает, что при увеличении только фонда оплаты труда (X2)на 1 тыс. руб. балансовая прибыль в среднем возрастает на 0,916 тыс. руб., а то, что коэффициент b2 = 0,065, означает, что увеличение только объема продаж по безналичному расчету (Х4) на 1 тыс. руб. приводит в среднем к увеличению балансовой прибыли на 0,065 тыс. руб. Как было отмечено выше, анализ Р-значений показывает, что оба коэффициента значимы.

Средние коэффициенты эластичности рассчитываются по формуле, приведенной выше в теме 2.

Эх1=0,53*35,75/88,38=0,214

Согласно коэффициенту эластичности по первому фактору - рост цены на 1% приводит к увеличению объема предложения на 0,214%.

Эх2=-9,89*5,44/88,38=-0,609

Второй средний коэффициент эластичности доказывает снижение объема предложения блага на 0,609% при увеличении заработной платы сотрудников фирмы на 1%.

Для выполнения задания 5 снова воспользуемся “Пакетом анализа”, встроенным в EXCEL.

В соответствии со схемой теста Голдфельда-Квандта упорядочим данные по возрастанию переменной X4, предполагая, что дисперсии ошибок зависят от величины этой переменной.

В нашем примере т =n/3 = 8.

Результаты дисперсионного анализа модели множественной регрессии, построенной по первым 8 наблюдениям (после ранжирования по возрастанию переменной Х4), приведены в таблице 6.5.

Таблица 6.5.

Дисперсионный анализ          
df SS MS F Значимость F
Регрессия 5,07Е+08 2.53E+08 20,95996 0.003707
Остаток ЕSS1=6.04E+07 1.21E+07    
Итого 5.67E+08      

 

Результаты дисперсионного анализа модели, построенной по последним 8 наблюдениям, приведены в таблице 6.6.

Таблица 6.6.

Дисперсионный анализ          
df SS MS F Значимость F
Регрессия 1,77Е+08 1.000617 0.398654
Остаток ЕSS2=3.98E+08    
Итого 5.75E+08      

 

Рассчитаем статистику Fрасч, = ESS2/ESS1 (т.к. ESS2>ESS1). Для нашего примера получаем: F= 3,98Е+08/6,04Е+07 = 6,58.

Для того, чтобы узнать табличное значение, воспользуемся встроенной в EXCEL функцией FРАСПОБР(0,05;6;6) с параметрами 0,05 - заданная вероятность ошибки гипотезы Н0; m-р = 8-2 = 6; m-р = 6 - параметры распределения Фишера. Данная функция находится в категории «статистических» функций.

Статистика Fрасч больше табличного значения F= FPACIIOБP(0,05;6;6) = 4,28. Следовательно, модель гетероскедастична.

Для выполнения задания 6 по уравнению регрессии определим значения отклонений еi = yi - , для каждого наблюдения i (i=1,2,..., n).

Для этого в диалоговом окне Регрессия в группе Остатки следует установить одноименный флажок Остатки.

Затем рассчитываем статистику Дарбина-Уотсона по формуле:

Результаты расчетов представлены в таблице 6.7.

Таблица 6.7.

 


Таким образом, расчетное значение равно d=6,5Е+08/6,4Е+08 = 1,02.

По таблице критических точек распределения Дарбина-Уотсона для заданного уровня значимости , числа наблюдений п и количества объясняющих переменных т определить два значения: dн- нижняя граница и dв,- верхняя граница (таблица 6.8.).

 

Таблица 6.8

 


В нашем случае модель содержит 2 объясняющие переменные (m=2), нижняя и верхняя границы равны соответственно dн = 1,19 и dв = 1,55.

Расчетное значение d-статистики лежит в интервале 0 d dн. Следовательно, в ряду остатков существует положительная автокорреляция.

 

Задача 2

Задачи 2 во всех вариантах решаются в соответствии с материалом темы 4 «Нелинейные модели регрессии и их линеаризация».

 

Решение задачи №3

Среднесписочная численность промышленно-производственного персонала

промышленности Курской области, тыс. чел

Годы
y 194,8 194,5 192,9 189,8 189,2 185,6 180,4 180,5 166,8 155,5 146,8 133,4 131,2 124,5 122,3 122,8 121,5 114,5 104,1

 

Параметры уравнения тренда могут быть найдены добавлением линии тренда в диаграмме Excel или решением системы уравнений по МНК.

 

 

Рис.1 Аппроксимация линейной функцией

 

 

Рис.2 Аппроксимация параболической функцией

В случае использования уравнения прямой линии согласно МНК:

После преобразований получим систему:

 

В случае использования уравнения параболы согласно МНК:

 

 

Для решения системы и расчета показателей адекватности составляются технологические таблицы. Решение систем уравнений предполагает расчет необходимых сумм по фактическим данным.

 

Технологическая таблица для решения систем уравнений

 

t y t2 yt t3 t4 yt2
194,8          
194,5          
192,9          
           
104,1          
= = = = = = =

 


 

Технологическая таблица расчета показателей

адекватности функции уt = а+bt

 

t y yt y- yt (y- yt)2
194,8 205,828 11,028 11,028 0,057 121,619
194,5 200,216 5,716 5,716 0,029 32,675
192,9 194,604 1,704 1,704 0,009 2,905
189,8 188,992 -0,808 0,808 0,004 0,652
189,2 183,381 -5,820 5,820 0,031 33,867
185,6 177,769 -7,831 7,831 0,042 61,331
180,4 172,157 -8,243 8,243 0,046 67,952
180,5 166,545 -13,955 13,955 0,077 194,748
166,8 160,933 -5,867 5,867 0,035 34,423
155,5 155,321 -0,179 0,179 0,001 0,032
146,8 149,709 2,909 2,909 0,020 8,463
133,4 144,097 10,697 10,697 0,080 114,430
131,2 138,485 7,285 7,285 0,056 53,076
124,5 132,873 8,373 8,373 0,067 70,114
122,3 127,262 4,962 4,962 0,041 24,616
122,8 121,650 -1,150 1,150 0,009 1,323
121,5 116,038 -5,462 5,462 0,045 29,837
114,5 110,426 -4,074 4,074 0,036 16,599
104,1 104,814 0,714 0,714 0,007 0,510
Сумма 0,692 869,170

 

- средняя ошибка аппроксимации

Стандартное отклонение:

 


Технологическая таблица расчета показателей

адекватности функции

t y yt y- yt (y- yt)2
194,8 202,958 8,158 8,158 0,042 66,559
194,5 198,304 3,804 3,804 0,020 14,472
192,9 193,537 0,637 0,637 0,003 0,406
189,8 188,658 -1,142 1,142 0,006 1,304
189,2 183,666 -5,534 5,534 0,029 30,625
185,6 178,561 -7,039 7,039 0,038 49,542
180,4 173,344 -7,056 7,056 0,039 49,784
180,5 168,014 -12,486 12,486 0,069 155,890
166,8 162,572 -4,228 4,228 0,025 17,876
155,5 157,017 1,517 1,517 0,010 2,301
146,8 151,349 4,549 4,549 0,031 20,697
133,4 145,569 12,169 12,169 0,091 148,089
131,2 139,676 8,476 8,476 0,065 71,849
124,5 133,671 9,171 9,171 0,074 84,107
122,3 127,553 5,253 5,253 0,043 27,594
122,8 121,322 -1,478 1,478 0,012 2,183
121,5 114,979 -6,521 6,521 0,054 42,521
114,5 108,523 -5,977 5,977 0,052 35,720
104,1 101,955 -2,145 2,145 0,021 4,601
Сумма 0,723 826,123

 

Стандартное отклонение:

 

Сравним уравнения трендов по показателям адекватности.

 

Уравнения трендов
0,954 3,64% 7,15
0,956 3,81% 7,19

 

По показателям адекватности выбираем функцию уt = а+bt, которую будем использовать для расчета показателей колеблемости и устойчивости.

Показатель колеблемости равен

Показатель устойчивости -

Показатель устойчивости характеризует близость фактических уровней к тренду на 95,4%.

 

2.Для оценки устойчивости уровней временного ряда как процесса их направленного изменения рассчитаем коэффициент корреляции рангов Ч.Спирмэна:

, где

n – число уровней временного ряда;

- разность рангов уровней и номеров периодов времени.

 

t y Ранг (y)
194,8
194,5
192,9
189,8
189,2
185,6
180,4
180,5
166,8
155,5
146,8 -2
133,4 -4
131,2 -6
124,5 -8
122,3 -11
122,8 -11
121,5 -14
114,5 -16
104,1 -18
Сумма

Коэффициент Спирмена , достаточно близок к -1, что доказывает устойчивость снижения показателей ряда.

 

 

7.контрольные вопросы

1.Цели и задачи дисциплины. Место дисциплины в системе экономических дисциплин.

2.История отечественных и зарубежных эконометрических исследований.

3.Состояние и перспективы развития эконометрики.

4.Классификация эконометрических моделей.

5.Определения и основные понятия эконометрики.

6.Исследование взаимосвязи социально-экономических явлений.

7.Причинность, регрессия, корреляция.

8.Корреляционно-регрессионный анализ в экономике. Анализ и обобщение статистической информации.

9.Линейные модели регрессии.

10.Построение модели линейной множественной регрессии.

11.Понятие результативных и факторных признаков.

12.Построение модели связи в стандартизованном масштабе.

13.Интерпретация моделей регрессии.

14.Частные коэффициенты эластичности.

15.Способы расчета параметров уравнения регрессии.

16.Линейные регрессионные модели с гетероскедастичными и автокоррелированными остатками.

17.Тест Голдфельда-Квандта.

18.Тест Дарбина-Уотсона.

19. Метод наименьших квадратов (МНК). Свойства оценок МНК.

20. Обобщенный метод наименьших квадратов (ОМНК).

21.Оценка качества регрессии. Проверка адекватности и достоверности модели.

22. Значимость коэффициентов регрессии (критерий Стъюдента).

23.Дисперсионный анализ. Проверка достоверности модели связи (по F-критерию Фишера).

24. Коэффициенты и индексы корреляции. Мультиколлениарность.

25.Оценка значимости корреляции. Детерминация.

26.Средняя ошибка аппроксимации.

27.Принятие решений на основе уравнений регрессии.

28.Нелинейные регрессионные модели и их линеаризация

29.Нелинейные регрессионные модели. Типы моделей.

30.Регрессионные модели с переменной структурой (фиктивные переменные).

31.Проверка однородности данных. Тест Чоу

32.Производственная функция как функциональная модель сферы производства.

33.Экономическая сущность производственной функции. Основные виды производственных функций. Геометрическая интерпретация (изокванты).

34.Характеристики производственных функций. Линейное уравнение, связывающее темпы прироста.

35.Модели стационарных и нестационарных временных рядов.

36.Временные ряды в экономике. Компоненты временного ряда. Тренд.

37.Проверка гипотезы о существовании тренда. Метод Фостера-Стюарта.

38.Проверка гипотезы о существовании тренда. Критерий Валлиса и Мура.

39.Проверка гипотезы о существовании тренда. Метод разности средних.

40.Оценка устойчивости тенденции.

41.Идентификация временного ряда. Авторегрессионные модели.

42.Модели с распределенными лагами.

43.Метод Алмон.

44.Метод Койка.

45.Прогнозирование на основе временных рядов.

46.Методы выявления периодической компоненты. Модели сезонных колебаний.

47.Системы линейных одновременных уравнений.

48.Идентификация систем эконометрических уравнений.

49.Косвенный, двухшаговый и трехшаговый метод наименьших квадратов.

50.Метод максимального правдоподобия.

 

8.Рекомендуемая литература