II часть ККР
(для своего варианта)
При оценке параметров уравнения регрессии мы использовали МНК. При этом делаются определенные предпосылки относительно случайной составляющей ei. Исследование остатков предполагает наличие следующих пяти предпосылок МНК:
1. Случайный характер остатков.
Чтобы проверить случайный характер остатков строим график зависимости ei от .
|
|
|
|
|
Если на графике получена горизонтальная полоса, то остатки представляют собой случайные величины и МНК оправдан.
Построив график, можно сделать вывод о случайном характере остатков (зависимость отсутствует), т.е. хорошо аппроксимирует фактические значения.
2. Нулевая средняя величина остатков, не зависящая от хj
Нужно проверить математическое ожидание . Зависимость отсутствует.
|
|
|
|
|
Из графика следует, что нет зависимости между и j, т.е. модель адекватна. Остатки независимы от значений х.
3. Проверка на гомоскедастичность.
При малых объемах выборки для оценки гетероскедастичности используется метод Гольдфельда – Квандта (1965 г.). Он рассматривает однофакторную линейную модель, для которой дисперсия остатков возрастает пропорционально квадрату фактора. Чтобы оценить нарушение гомоскедастичности необходимо:
1) упорядочить наблюдения по мере возрастания Х;
2) исключить из рассмотрения С центральных наблюдений (n-c):2>p, где р – число оцениваемых параметров;
3) разделение оставшейся (n-c) совокупности на 2 группы (соответственно с малыми и большими значениями фактора Х), и определение для каждой группы уравнений регрессии:
4) определение остаточной суммы квадратов для первой (S1) и второй (S2) групп и нахождение R сравнивается с Fтабл.
№ | х | у | х2 | уx | |||
622,9 | 4,9 | 388004,41 | 3052,21 | 5,404667 | -0,50467 | 0,254689 | |
5,2 | 3421,6 | 5,345795 | -0,14579 | 0,021256 | |||
700,4 | 5,5 | 490560,16 | 3852,2 | 5,274679 | 0,225321 | 0,05077 | |
740,6 | 5,6 | 548488,36 | 4147,36 | 5,207253 | 0,392747 | 0,15425 | |
774,4 | 5,6 | 599695,36 | 4336,64 | 5,150561 | 0,449439 | 0,201995 | |
816,2 | 5,3 | 666182,44 | 4325,86 | 5,080451 | 0,219549 | 0,048202 | |
853,5 | 728462,25 | 4267,5 | 5,017889 | -0,01789 | 0,00032 | ||
876,8 | 4,7 | 768778,24 | 4120,96 | 4,978809 | -0,27881 | 0,077734 | |
4,6 | 4,939896 | -0,3399 | 0,11553 | ||||
S | 6942,8 | 46,4 | 5433135,2 | 35664,33 | 46,4 | 8,88Е-16 | 0,924746 |
Ср.зн. | 771,4222 | 5,1556 | 603681,69 | 3962,703 | 5,155556 | 9,87Е-17 | 0,10275 |
№ | х | у | х2 | ху | |||||||
4,2 | 5073,6 | 4,1239 | 0,0761 | 0,005791 | |||||||
1056,2 | 4,6 | 1115558,4 | 4858,52 | 4,747849 | -0,14785 | 0,021859 | |||||
1105,4 | 4,4 | 1221909,2 | 4863,76 | 4,54562 | -0,14562 | 0,021205 | |||||
1162,3 | 4,7 | 1350941,3 | 5462,81 | 4,311742 | 0,388258 | 0,150744 | |||||
1200,7 | 4,7 | 1441680,5 | 5643,29 | 4,153905 | 0,546095 | 0,298219 | |||||
1209,5 | 3,9 | 1462890,3 | 4717,05 | 4,117734 | -0,21773 | 0,047408 | |||||
1248,6 | 3,6 | 4494,96 | 3,95702 | -0,35702 | 0,127463 | ||||||
1254,4 | 3,6 | 1573519,4 | 4515,84 | 3,93318 | -0,33318 | 0,111009 | |||||
1284,6 | 1650197,2 | 5138,4 | 3,809048 | 0,190952 | 0,036463 | ||||||
S | 10729,7 | 37,7 | 44768,23 | 37,7 | 5,77Е-15 | 0,820163 | |||||
Ср.зн. | 1192,189 | 4,1889 | 1426106,9 | 4974,248 | 4,188889 | 6,14Е-16 | 0,091129 | ||||
R=0,820163/0,924746=0,8869, что не превышает табличное значение F-критерия 3,59 при 5 %-ном уровне значимости для числа степеней свободы 7 на 7, подтверждая тем самым наличие гомоскедастичности (R < F).
4. Отсутствие автокорреляции остатков.
Это значит, что остатки i распределены независимо друг от друга. Автокорреляция остатков означает наличие корреляции между остатками текущих и предыдущих (последующих) наблюдений. i – текущие, j – предыдущие.Пусть j=i-1, n=20
j | i | i* j | j2 | i2 |
-0,5952 | -0,211 | 0,125587 | 0,354263 | 0,044521 |
-0,211 | 0,1908 | -0,04026 | 0,044521 | 0,0364405 |
0,1908 | 0,3872 | 0,073878 | 0,03605 | 0,149924 |
0,3872 | 0,4684 | 0,181364 | 0,149924 | 0,219399 |
0,4684 | 0,2687 | 0,125859 | 0,219399 | 0,0722 |
0,2687 | 0,0582 | 0,015638 | 0,0722 | 0,003387 |
0,0582 | -0,1859 | -0,01082 | 0,003387 | 0,034559 |
-0,1859 | -0,2302 | 0,042794 | 0,034559 | 0,052992 |
-0,2302 | 0,2932 | -0,06749 | 0,052992 | 0,085966 |
0,2932 | 0,8288 | 0,243004 | 0,085966 | 0,686909 |
0,8288 | -0,3787 | -0,31387 | 0,686909 | 0,143414 |
-0,3787 | -0,3643 | 0,13796 | 0,143414 | 0,132714 |
-0,3643 | -0,1447 | -0,05271 | 0,132714 | 0,020938 |
-0,1447 | 0,0628 | 0,009087 | 0,020938 | 0,003944 |
0,0628 | 0,4993 | 0,031356 | 0,003944 | 0,2493 |
0,4993 | 0,5915 | 0,295336 | 0,2493 | 0,349872 |
0,5915 | -0,1874 | -0,11085 | 0,349872 | 0,035119 |
-0,1874 | -0,3936 | 0,073761 | 0,035119 | 0,154921 |
-0,3936 | -0,3796 | 0,149411 | 0,154921 | 0,144096 |
-0,3796 | 0,0928 | -0,03523 | 0,144096 | 0,008612 |
0,8677 | 1,5557 | 0,873808 | 2,974843 | 2,629192 |
ср. зн. 0,043385 | 0,077785 | 0,04369 | 0,148742 | 0,13146 |
при 18 степенях свободы явно незначимо (F-отношение < 1) и демонстрирует отсутствие автокорреляции остатков.
5. Остатки подчиняются нормальному распределению.
Эта предпосылка позволяет проводить проверку параметров регрессии и корреляции с помощью t- и F-критериев. Даже если предпосылка не выполняется, МНК дает хорошие результаты.
Вывод: все предпосылки проверены, метод наименьших квадратов использован верно для расчета коэффициентов уравнения регрессии.
Библиографический список рекомендуемой литературы