Особенности оценки параметров нелинейных моделей

 

Соотношение между социально-экономическими явлениями и процессами далеко не всегда можно выразить линейными функциями. Так, нелинейными оказываются производственные функции (зависимости между объемом произведенной продукции и основными факторами производства – трудом, капиталом и т. д.), функции спроса (зависимость между спросом на товары, услуги и их ценами или доходом) и др.

Если между экономическими явлениями существуют нелинейные соотношения, то они выражаются с помощью соответствующих нелинейных функций.

Нелинейность может проявляться как относительно переменных, так и относительно входящих в функцию коэффициентов (параметров).

Различают два класса нелинейных регрессий

Для оценки параметров нелинейных моделей используются два подхода.

Первый подход основан на линеаризации модели и заключается в том, что с помощью подходящих преобразований исходных переменных исследуемую зависимость представляют в виде линейного соотношения между преобразованными переменными.

Второй подход обычно применяют в случаях, когда подобрать соответствующее линеаризующее преобразование не удается. Тогда использует методы нелинейной оптимизации на основе исходных переменных.

Применяемые чаще всего в экономическом анализе виды нелинейных регрессий следующие: полином второго порядка, гипербола, степенная функция и показательная функция.

Однако параметров нелинейной регрессии по переменным, включенным в анализ, но линейным по оцениваемым параметрам, проводиться с помощью МНК путем решения нормальных уравнений.

Регрессии, нелинейные по переменным, но линейные по оцениваемым параметрам:

1. полином второго порядка ŷx = a0 + a1xi + a2xi2

Нормальные уравнения:

;

;

.

 

2. гипербола ŷx = a0 + a1

Нормальные уравнения

;

.

Или заменим 1/xi на новую переменную X. В результате получим линейное уравнение:

Ŷx = a0 +a1X.

Параметры определяются из следующих формул:

a0 =

Линеаризация регрессий, нелинейных по оцениваемым параметрам:

1. степенная функция ŷx

Для определения параметров степенной функции с помощью МНК необходимо привести ее к линейному виду путем логарифмирования обеих частей уравнения:

ln ŷx

Это уравнение представляет собой прямую линию на графике, по осям которого откладываются не сами числа, а их логарифмы (так называемая логарифмическая школа или логарифмическая сетка).

Пусть Y=ln ŷx, X=ln xi, A=ln a0. Тогда уравнение примет вид

Y = A + a1X

Параметры модели определяются по следующим формулам:

2. показательная функция

ŷx

Линеаризацию переменных проведем путем логарифмирования обеих частей уравнения:

ln ŷx =

Уравнение изображается прямой линией на полулогарифмической сетке, которая получается как сочетание натуральной шкалы для значения независимой переменной х и логарифмической шкалы – для значения зависимой переменной у.

Пусть Y = ln ŷx, A = ln a0, B =ln a1. Тогда уравнение примет вид

Параметры модели определяются по следующим формулам:

При использовании любой формы криволинейной корреля­ционной зависимости теснота связи между переменными может быть измерена с помощью индекса корреляции, который опреде­ляется аналогично коэффициенту корреляции для линейной формы связи.

Уравнение корреляционной связи должно быть по возмож­ности более простым, чтобы сущность изучаемой зависимости между переменными проявлялась достаточно четко, а параметры уравнения поддавались определенному экономическому толкованию. Вопрос выбора соответствующего уравнения связи решается в каждом случае отдельно.

3. Методика построения модели парной регрессии

По пятнадцати сельскохозяйственным предприятиям Орловской области за 200х г. известны значения двух признаков:

Таблица 3.1. – Исходные данные для анализа

Валовой доход отрасли растениеводства, приходящийся на 100 га пашни (тыс. руб.) Затраты труда в растениеводстве на 100 га пашни, тыс. чел.-час./га
111,03 1,94
128,90 3,45
120,31 1,83
112,54 2,78
93,13 1,68
64,82 2,55
107,75 2,37
211,15 4,10
103,97 3,20
199,31 3,40
138,95 3,42
105,81 2,80
88,15 3,24
121,25 2,45
105,62 2,27
Итого 1812,68 41,48
Среднее 120,85 2,74

Требуется:

1. Вычислить описательные статистики. Проверить характер распределения признаков. При необходимости удалить аномальные наблюдения.

2. Построить поле корреляции. Выдвинуть гипотезу о форме связи признаков.

3. Для характеристики зависимости у от х:

а) построить линейное уравнение парной регрессии у от х;

б) дать экономическую интерпретацию уравнению регрессии исчислив средний коэффициент эластичности , парный линейный коэффициент корреляции – r, коэффициент детерминации – D;

в) оценить полученную модель через среднюю ошибку аппроксимации и F-критерий Фишера и сделать вывод;

г) провести статистическую оценку значимости коэффициентов регрессии и корреляции (с помощью t-статистики Стьюдента и путем расчета доверительного интервала каждого из показателей).

4) Рассчитать параметры регрессии, построенной по уравнению равносторонней гиперболы. Оценить полученную модель через среднюю ошибку аппроксимации и F-критерий Фишера, сделать вывод.

5) Рассчитать параметры степенной регрессионной модели. Оценить полученную модель через среднюю ошибку аппроксимации и F-критерий Фишера, сделать вывод.

6). Обосновано выбрать лучшую модель и рассчитать по ней прогнозное значение результата, если прогнозное значение фактора увеличится на 25% от среднего уровня. Определить доверительный интервал прогноза при уровне значимости α = 0,05.

Порядок выполнения:

Для нашего примера:

Y – Валовой доход отрасли растениеводства, приходящийся на 100 га пашни (тыс. руб.) (результативный признак);

Х – Затраты труда в растениеводстве на 100 га пашни, тыс. чел.-час./га (факторный признак).

Прежде чем приступить непосредственно к анализу, необходимо проверить выполнение трех основных условий применения корреляционно-регрессионного анализа.

1) 1.1.Проверим, насколько для данной совокупности действует Закон больших чисел. В данном случае рекомендуется отобрать из генеральной совокупности с помощью случайной бесповторной выборки как минимум 10 объектов для исследования (число наблюдений должно хотя бы в 10 раз превышать количество факторных признаков в модели). Данное правило соблюдено. Зависимость изучается по данным 15 предприятий.

1.2. Проверим характер распределения. Для этого рассчитаем среднее квадратическое отклонение (σ) и коэффициент вариации (v) для каждого из показателей по формулам:

(1)

(2)

(3)

По исходным данным рассчитаем X2, Y2, ΣX2, ΣY2(таблица 3.2) Рассчитаем среднее квадратическое отклонение для каждого из признаков:

Таблица 3.2. - Расчетные величины, необходимые для определения среднего квадратического отклонения и коэффициента вариации

Х, тыс. чел.-час./га У, (тыс. руб.) Расчетные величины
1,94 111,03 3,7751 12327,8885 215,7293
3,45 128,90 11,8829 16614,7449 444,3333
1,83 120,31 3,3334 14473,8934 219,6517
2,27 105,62 5,1705 11156,0468 240,1704
Итого 41,48 1812,68 121,4840 239812,3499 5240,1270
Среднее знач. 2,77 120,85 8,0989 15987,4900 349,3418

Рассчитаем среднее квадратическое отклонение по получившимся данным для каждого из признаков

Рассчитаем коэффициент вариации для каждого из признаков:

Поскольку коэффициенты вариации по каждому из признаков не превышают значения 0,35, то может сделать вывод об однородности изучаемой совокупности.

1.3. Для применения метода наименьших квадратов при нахождении параметров уравнения регрессии необходимо, чтобы распределение по результативному признаку подчинялось нормальному закону.

Проверить распределение на нормальность можно путем расчета показателей асимметрии первого, второго и третьего порядков и показатель эксцесса.

При нормальном распределении вариационный укладывается в границы ± 3σ; размах вариации R = 6σ. Это означает, что при нормальном распределении вероятность попадания единичного наблюдения в интервал ± 3σ равна 0,997. Величину 3σ считают максимально допустимой ошибкой и отбрасывают результаты экспериментов, для которых величина отклонения от среднего превышает это значение («правило 3 сигм»).

 

Rу =211,15-64,82 = 146,33 ц/га; Rу < 223,14.

Mo=111,03 тыс. руб.;

Me=111,03 тыс. руб.;

Рассчитаем асимметрию первого порядка:

 

Таблица 3.3. – Расчетные величины

№ хозяйства У (тыс. руб.) Расчетные величины
64,82 -56,0237 3138,6517 -175838,7919 9851134,6449
88,15 -32,6964 1069,0538 -34954,1956 1142875,9206
93,13 -27,7167 768,2136 -21292,3203 590152,1421
103,97 -16,8769 284,8314 -4807,0856 81128,9418
105,62 -15,2230 231,7388 -3527,7525 53702,8682
105,81 -15,0382 226,1472 -3400,8438 51142,5346
107,75 -13,0948 171,4733 -2245,4050 29403,0864
111,03 -9,8141 96,3172 -945,2700 9277,0058
112,54 -8,3011 68,9085 -572,0171 4748,3784
120,31 -0,5377 0,2891 -0,1554 0,0836
121,25 0,4040 0,1632 0,0660 0,0266
128,90 8,0530 64,8514 522,2509 4205,7062
138,95 18,1014 327,6607 5931,1179 107361,5426
199,31 78,4611 6156,1474 483018,2164 37898150,2459
211,15 90,3029 8154,6189 736385,9636 66497808,9091
Итого 1812,68 0,0000 20759,0661 978273,7774 116321092,0368
Среднее 120,85 х х х х

 

Асимметрия второго порядка рассчитывается по формулам:

Рассчитаем асимметрию третьего порядка:

Найдем значение эксцесса:

Полученные данные позволяют сделать следующий вывод. Значения асимметрии первого, второго, третьего порядков и эксцесса достаточно малы, мода, медиана и среднее значение результативного признака приближенно равны, следовательно, совокупность подчиняется нормальному закону и для нахождения параметров уравнения регрессии применим Метод наименьших квадратов (МНК).