Ссылка на архив

Особенности решения задач в эконометрике

Задание 1.

По 15 предприятиям, выпускающим один и тот же вид продукции известны значения двух признаков:

х - выпуск продукции, тыс. ед.;

у - затраты на производство, млн. руб.

x

y

5,318,4
15,122,0
24,232,3
7,116,4
11,022,2
8,521,7
14,523,6
10,218,5
18,626,1
19,730,2
21,328,6
22,134,0
4,114,2
12,022,1
18,328,2

Требуется:

4. Построить поле корреляции и сформулировать гипотезу о форме связи;

5. Построить модели:

2.1 Линейной парной регрессии;

2.2 Полулогарифмической парной регрессии;

2.3 Степенной парной регрессии; Для этого:

1. Рассчитать параметры уравнений;

2. Оценить тесноту связи с помощью коэффициента (индекса) корреляции;

3. Оценить качество модели с помощью коэффициента (индекса) детерминации и средней ошибки аппроксимации;

4. Дать с помощью среднего коэффициента эластичности сравнительную оценку силы связи фактора с результатом;

5. С помощью F-критерия Фишера оценить статистическую надежность результатов регрессионного моделирования;

3. По значениям характеристик, рассчитанных в пунктах 2-5 выбрать лучшее уравнение регрессии;

4. Используя метод Гольфрельда-Квандта проверить остатки на гетероскедастичность;

5. Рассчитать прогнозное значение результата, если прогнозное значение фактора увеличится на 5% от его среднего уровня. Для уровня значимости =0,05 определить доверительный интервал прогноза.

Решение.

1. Строим поле корреляции.


Анализируя расположение точек поля корреляции, предполагаем, что связь между признаками х и у может быть линейной, т.е. у=а+х, или нелинейной вида: у=а+blnх, у = ахb.

Основываясь на теории изучаемой взаимосвязи, предполагаем получить зависимость у от х вида у=а+х, т. к. затраты на производство y можно условно разделить на два вида: постоянные, не зависящие от объема производства - a, такие как арендная плата, содержание администрации и т.д.; и переменные, изменяющиеся пропорционально выпуску продукции х, такие как расход материала, электроэнергии и т.д.


2.1 Модель линейной парной регрессии

2.1.1 Рассчитаем параметры a и линейной регрессии у=а+х.

Строим расчетную таблицу 1.

Таблица 1

x

y

yx

x2

y2

Аi

15,318,497,5228,09338,5616,212,1911,92
215,122,0332,20228,01484,0024,74-2,7412,46
324,232,3781,66585,641043,2932,67-0,371,14
47,116,4116,4450,41268,9617,77-1,378,38
511,022,2244,20121,00492,8421,171,034,63
68,521,7184,4572,25470,8918,992,7112,47
714,523,6342,20210,25556,9624,22-0,622,62
810,218,5188,70104,04342,2520,47-1,9710,67
918,626,1485,46345,96681,2127,79-1,696,48
1019,730,2594,94388,09912,0428,751,454,81
1121,328,6609,18453,69817,9630,14-1,545,39
1222,134,0751,40488,411156,0030,843,169,30
134,114,258,2216,81201,6415,16-0,966,77
1412,022,1265,20144,00488,4122,040,060,26
1518,328,2516,06334,89795,2427,530,672,38
Σ212,0358,55567,833571,549050,25358,500,0099,69
среднее14,13323,900371,189238,103603,35023,900,006,65

Параметры aи уравнения

Yx = a + bx


определяются методом наименьших квадратов:

Разделив на и решая методом Крамера, получаем формулу для определения :

Уравнение регрессии:

=11,591+0,871x

С увеличением выпуска продукции на 1 тыс. руб. затраты на производство увеличиваются на 0,871 млн. руб. в среднем, постоянные затраты равны 11,591 млн. руб.

2.1.2. Тесноту связи оценим с помощью линейного коэффициента парной корреляции.

Предварительно определим средние квадратические отклонения признаков.

Средние квадратические отклонения:


Коэффициент корреляции:

Между признаками X и Y наблюдается очень тесная линейная корреляционная связь.

2.1.3 Оценим качество построенной модели.

Определим коэффициент детерминации:

т. е. данная модель объясняет 90,5% общей дисперсии у, на долю необъясненной дисперсии приходится 9,5%.

Следовательно, качество модели высокое.

Найдем величину средней ошибки аппроксимации Аi .

Предварительно из уравнения регрессии определим теоретические значения для каждого значения фактора.

Ошибка аппроксимации Аi,i=1…15:

Средняя ошибка аппроксимации:

Ошибка небольшая, качество модели высокое.


5.1.4. Определим средний коэффициент эластичности:

Он показывает, что с увеличением выпуска продукции на 1% затраты на производство увеличиваются в среднем на 0,515%.

2.1.5.Оценим статистическую значимость полученного уравнения. Проверим гипотезу H0, что выявленная зависимость у от х носит случайный характер, т. е. полученное уравнение статистически незначимо. Примем α=0,05. Найдем табличное (критическое) значение F-критерия Фишера:

Найдем фактическое значение F- критерия Фишера:

следовательно, гипотеза H0 отвергается, принимается альтернативная гипотеза H1: с вероятностью 1-α=0,95 полученное уравнение статистически значимо, связь между переменными xиy неслучайна.

Построим полученное уравнение.


2.2. Модель полулогарифмической парной регрессии.

2.2.1. Рассчитаем параметры а и в регрессии:

уx =а +blnх.

Линеаризуем данное уравнение, обозначив:

z=lnx.

Тогда:

y=a + bz.


Параметры aи уравнения

= a + bz

определяются методом наименьших квадратов:

Рассчитываем таблицу 2.

Таблица 2

x

y

z

yz

z2

y2

Аi

15,318,41,66830,6862,781338,5615,383,0216,42
215,122,02,71559,7237,370484,0025,75-3,7517,03
324,232,33,186102,91910,1531043,2930,421,885,83
47,116,41,96032,1463,842268,9618,27-1,8711,42
511,022,22,39853,2335,750492,8422,61-0,411,84
68,521,72,14046,4394,580470,8920,061,647,58
714,523,62,67463,1107,151556,9625,34-1,747,39
810,218,52,32242,9645,393342,2521,86-3,3618,17
918,626,12,92376,2958,545681,2127,81-1,716,55
1019,730,22,98190,0158,884912,0428,381,826,03
1121,328,63,05987,4799,356817,9629,15-0,551,93
1222,134,03,096105,2509,5831156,0029,524,4813,18
134,114,21,41120,0361,991201,6412,841,369,60
1412,022,12,48554,9166,175488,4123,47-1,376,20
1518,328,22,90781,9758,450795,2427,650,551,95
Σ212,0358,537,924947,186100,0039050,25358,500,00131,14
Средн.14,13323,9002,52863,1466,667603,35023,900,008,74

Разделив на и решая методом Крамера, получаем формулу для определения :

Уравнение регрессии:

= -1,136 + 9,902z

2.2.2. Оценим тесноту связи между признаками у и х.

Т. к. уравнение у = а + bln x линейно относительно параметров а и и его линеаризация не была связана с преобразованием зависимой переменной _у, то теснота связи между переменными у и х, оцениваемая с помощью индекса парной корреляции Rxy, также может быть определена с помощью линейного коэффициента парной корреляции ryz

среднее квадратическое отклонение z:

Значение индекса корреляции близко к 1, следовательно, между переменными у и х наблюдается очень тесная корреляционная связь вида = a + bz.


2.2.3 Оценим качество построенной модели.

Определим коэффициент детерминации:

т. е. данная модель объясняет 83,8% общей вариации результата у, на долю необъясненной вариации приходится 16,2%.

Следовательно, качество модели высокое.

Найдем величину средней ошибки аппроксимации Аi .

Предварительно из уравнения регрессии определим теоретические значения для каждого значения фактора.

Ошибка аппроксимации Аi, i=1…15:

Средняя ошибка аппроксимации:

Ошибка небольшая, качество модели высокое.

2.2.4.Определим средний коэффициент эластичности:

Он показывает, что с увеличением выпуска продукции на 1% затраты на производство увеличиваются в среднем на 0,414%.


2.2.5.Оценим статистическую значимость полученного уравнения. Проверим гипотезу H0, что выявленная зависимость у от х носит случайный характер, т.е. полученное уравнение статистически незначимо. Примем α=0,05.

Найдем табличное (критическое) значение F-критерия Фишера:

Найдем фактическое значение F-критерия Фишера:

следовательно, гипотеза H0отвергается, принимается альтернативная гипотеза H1: с вероятностью 1-α=0,95 полученное уравнение статистически значимо, связь между переменными xиy неслучайна.

Построим уравнение регрессии на поле корреляции


2.3. Модель степенной парной регрессии.

2.3.1. Рассчитаем параметры а и степенной регрессии:

Расчету параметров предшествует процедура линеаризации данного уравнения:

и замена переменных:


Y=lny, X=lnx, A=lna

Параметры уравнения:

Y=A+bX

определяются методом наименьших квадратов:

Рассчитываем таблицу 3.

Определяем :

Уравнение регрессии:

Построим уравнение регрессии на поле корреляции:


2.3.2. Оценим тесноту связи между признаками у и х с помощью индекса парной корреляции Ryx.

Предварительно рассчитаем теоретическое значение для каждого значения фактора x, и , тогда:

Значение индекса корреляции Rxyблизко к 1, следовательно, между переменными у и х наблюдается очень тесная корреляционная связь вида:

2.3.3.Оценим качество построенной модели.

Определим индекс детерминации:


R2=0,9362=0,878,

т. е. данная модель объясняет 87,6% общей вариации результата у, а на долю необъясненной вариации приходится 12,4%.

Качество модели высокое.

Найдем величину средней ошибки аппроксимации.

Ошибка аппроксимации Аi, i=1…15:

Средняя ошибка аппроксимации:

Ошибка небольшая, качество модели высокое.

2.3.4. Определим средний коэффициент эластичности:

Он показывает, что с увеличением выпуска продукции на 1% затраты на производство увеличиваются в среднем на 0,438%.

2.3.5.Оценим статистическую значимость полученного уравнения.

Проверим гипотезу H0, что выявленная зависимость у от х носит случайный характер, т. е. полученное уравнение статистически незначимо. Примем α=0,05.

табличное (критическое) значение F-критерия Фишера:


фактическое значение F-критерия Фишера: