Примеры решения задач
Исследуется зависимость расходов на приобретение некоторого товара (группы товаров) семейными хозяйствами от располагаемого дохода.
В течение года i-я семья, имеющая располагаемый доход xi, затратила на приобретение этого товара Vi руб.
Таблица 8
Номер наблюдения, i | Располагаемый доход семейного хозяйства, (руб.) | Расходы семейного хозяйства на приобретение некоторого товара, V (руб.) |
150537,1 | 3736,022 | |
136570,9 | 3155,929 | |
151518,1 | 4091,394 | |
110318,6 | 3037,814 | |
155144,1 | 3603,569 | |
129398,2 | 3025,638 | |
3041,839 | ||
153232,6 | 3907,761 | |
174761,2 | 3961,124 | |
158744,2 | 4072,685 | |
151702,4 | 3991,685 | |
143872,3 | 3692,751 | |
166110,4 | 4227,418 | |
3783,255 | ||
114337,7 | 3174,847 | |
136811,3 | 3265,973 | |
135744,2 | 3359,623 | |
120100,7 | 2737,437 | |
169115,2 | 3801,232 | |
156830,3 | 3828,464 |
1. Подберите модель зависимости, в которой эластичность потребления рассматриваемого товара по отношению к располагаемому доходу не зависит от размера располагаемого дохода. Постоянство эластичности предполагает оценивание модели, линейной в логарифмах уровней.
2. Постройте график подбора значений регрессии. Рассчитайте среднюю ошибку аппроксимации. Сделайте выводы.
3. Проверьте значимость подобранной модели на уровне α=0,05, используя коэффициент детерминации и критерий Фишера.
4. С помощью графического метода оцените соответствие используемых для построения модели статистических данных стандартным предположениям регрессионного анализа.
5. В рамках подобранной модели проверьте гипотезы о том, что:
А) Потребление данного товара эластично по отношению к располагаемому доходу. Эластичное потребление соответствует значению эластичности, большему единицы по абсолютной величине ( );
Б) Потребление данного товара неэластично по отношению к располагаемому доходу ( ).
Решение
1. Предположим, что модель зависимости затрат на приобретение некоторого товара V от располагаемого дохода семейного хозяйства имеет постоянную эластичность потребления. Постоянство эластичности означает модель вида (3.2):
Для подтверждения нашего предположения построим поле корреляции.
Рисунок 4. Поле корреляции
По форме облака рассеяния видно, что наше предположение о степенной модели наблюдений (см. рис. 3.1) подтверждается. При оценивании коэффициентов такой модели метод наименьших квадратов применяют к логарифмам уровней. Степенная модель линеаризуется путем логарифмирования:
.
Если обозначить , , , то
.
Рассчитаем логарифмы уровней и оценки наименьших квадратов для линейного уравнения парной регрессии . Промежуточные вычисления будем заносить в таблицу 9.
Таблица 9
i | xi | Vi | |||||
150537,1 | 3736,022 | 11,922 | 8,226 | 0,047 | 0,0022 | 98,067 | |
136570,9 | 3155,929 | 11,825 | 8,057 | -0,05 | 0,0025 | 95,271 | |
151518,1 | 4091,394 | 11,928 | 8,317 | 0,0535 | 0,0029 | 99,205 | |
110318,6 | 3037,814 | 11,611 | 8,019 | -0,264 | 0,0696 | 93,108 | |
155144,1 | 3603,569 | 11,952 | 8,19 | 0,0771 | 0,0059 | 97,884 | |
129398,2 | 3025,638 | 11,771 | 8,015 | -0,104 | 0,0109 | 94,34 | |
3041,839 | 11,679 | 8,02 | -0,196 | 0,0385 | 93,666 | ||
153232,6 | 3907,761 | 11,94 | 8,271 | 0,0647 | 0,0042 | 98,75 | |
174761,2 | 3961,124 | 12,071 | 8,284 | 0,1962 | 0,0385 | ||
158744,2 | 4072,685 | 11,975 | 8,312 | 0,1 | 0,01 | 99,537 | |
151702,4 | 3991,685 | 11,93 | 8,292 | 0,0547 | 0,003 | 98,921 | |
143872,3 | 3692,751 | 11,877 | 8,214 | 0,0017 | 3E-06 | 97,557 | |
166110,4 | 4227,418 | 12,02 | 8,349 | 0,1454 | 0,0211 | 100,36 | |
3783,255 | 12,011 | 8,238 | 0,1356 | 0,0184 | 98,948 | ||
114337,7 | 3174,847 | 11,647 | 8,063 | -0,228 | 0,052 | 93,909 | |
136811,3 | 3265,973 | 11,826 | 8,091 | -0,049 | 0,0024 | 95,691 | |
135744,2 | 3359,623 | 11,819 | 8,12 | -0,056 | 0,0032 | 95,962 | |
120100,7 | 2737,437 | 11,696 | 7,915 | -0,179 | 0,032 | 92,572 | |
169115,2 | 3801,232 | 12,038 | 8,243 | 0,1633 | 0,0267 | 99,233 | |
156830,3 | 3828,464 | 11,963 | 8,25 | 0,0879 | 0,0077 | 98,697 | |
Итого | 71496,46 | 237,5 | 163,5 | 0,3518 | 1941,7 | ||
Среднее значение | 3574,82 | 11,875 | 8,174 | 0,0176 | 97,084 |
Воспользуемся формулами (2.6) и (2.7):
;
.
Получили уравнение: , связывающее логарифмы уровней. Перейдем к исходной форме модели . Для этого рассчитаем коэффициент Таким образом, подобранная модель с постоянной эластичностью η = b = 0,808 имеет вид: .
2. Построим график подбора значений регрессии. Для этого вычислим значения , подставляя в найденную модель наблюдаемые значения x. Эти и дальнейшие вычисления отразим в таблице 10.
Таблица 10
i | xi | Vi | , % | ||||
150537,1 | 3736,022 | 3685,715 | 50,30694 | 2530,7886 | 1,347 | 25985,12 | |
136570,9 | 3155,929 | 3407,013 | -251,084 | 63043,247 | 7,956 | 175472,2 | |
151518,1 | 4091,394 | 3705,099 | 386,2947 | 149223,56 | 9,442 | 266845,6 | |
110318,6 | 3037,814 | 2867,513 | 170,3007 | 29002,319 | 5,606 | 288378,7 | |
155144,1 | 3603,569 | 3776,54 | -172,971 | 29918,989 | 4,8 | 826,3325 | |
129398,2 | 3025,638 | 3261,766 | -236,128 | 55756,234 | 7,804 | 301604,2 | |
3041,839 | 3028,447 | 13,39168 | 179,33707 | 0,44 | 284071,9 | ||
153232,6 | 3907,761 | 3738,92 | 168,8414 | 28507,433 | 4,321 | 110847,7 | |
174761,2 | 3961,124 | 4157,697 | -196,573 | 38640,771 | 4,963 | 149228,5 | |
158744,2 | 4072,685 | 3847,153 | 225,5317 | 50864,562 | 5,538 | 247866,6 | |
151702,4 | 3991,685 | 3708,738 | 282,9466 | 80058,797 | 7,088 | 173773,9 | |
143872,3 | 3692,751 | 3553,367 | 139,3845 | 19428,035 | 3,775 | 13907,01 | |
166110,4 | 4227,418 | 3990,686 | 236,7319 | 56042,005 | 5,6 | 425880,2 | |
3783,255 | 3959,277 | -176,022 | 30983,852 | 4,653 | 43443,9 | ||
114337,7 | 3174,847 | 2951,586 | 223,2607 | 49845,327 | 7,032 | 159980,8 | |
136811,3 | 3265,973 | 3411,855 | -145,882 | 21281,685 | 4,467 | 95388,32 | |
135744,2 | 3359,623 | 3390,349 | -30,7257 | 944,06702 | 0,915 | 46311,04 | |
120100,7 | 2737,437 | 3071,155 | -333,718 | 111367,99 | 12,19 | 701215,3 | |
169115,2 | 3801,232 | 4048,882 | -247,65 | 61330,322 | 6,515 | 51261,04 | |
156830,3 | 3828,464 | 3809,652 | 18,81159 | 353,87606 | 0,491 | 64333,76 | |
Итого | 71496,46 | 879303,2 | 104,9 | ||||
Среднее значение | 3574,82 | 5,25 |
На одном графике изобразим поле корреляции и подобранную по модели кривую.
Рисунок 5. График подбора
По графику видно, что подобранная модель хорошо аппроксимирует исходные данные.
Среднюю ошибку аппроксимации находим по формуле (2.31) с помощью столбцов 5 и 7 таблицы 10. свидетельствует о хорошем подборе модели к исходным данным.
3. Проверим значимость подобранной модели на уровне α=0,05, используя коэффициент детерминации и критерий Фишера.
Одной из наиболее эффективных оценок значимости уравнения регрессии являетсякоэффициент детерминации. Он характеризует степень выраженности связи между переменными. Определяется по формуле (2.35):
,
где - полная сумма квадратов;
- сумма квадратов, объясненная моделью;
- остаточная сумма квадратов.
Коэффициент детерминации показывает, что уравнением регрессии объясняется 75,8% дисперсии результативного признака, а на долю прочих факторов приходится 24,2%. То есть 75,8% вариации расходов на приобретение некоторого товара (V) объясняется вариацией фактора – дохода семейного хозяйства.
Оценим качество уравнения регрессии в целом с помощью -критерия Фишера. Рассчитаем фактическое значение -критерия. Так как коэффициент детерминации уже известен, проще всего использовать формулу (2.36):
где m – число оцениваемых параметров уравнения регрессии;
n – число наблюдений.
Табличное значение -критерия найдем по приложению 1 : . Так как , то признается статистическая значимость уравнения в целом.
4. С помощью графического метода оценим соответствие используемых для построения модели статистических данных стандартным предположениям регрессионного анализа.
Подобранная модель проверяется на отсутствие автокорреляционной зависимости остатков от номера наблюдения, на независимость случайных ошибок ε1, ε2,..., εn, математическое ожидание которых должно стремиться к нулю (Mεi=0), на постоянство или гомоскедастичность дисперсии ошибок [ ]. Анализ соблюдения перечисленных условий, проводят, используя графики стандартизированных остатков (формула 2.42)
где - оценка дисперсии остатков (формула 2.43)
Данные для построения графика зависимости стандартизированных остатков (как ординат) от оцененных значений (по оси абсцисс) занесем в таблицу 11.
Таблица 11
i | xi | Vi | ||||
150537,1 | 3736,022 | 3685,715 | 50,30694 | 2530,7886 | 0,372 | |
136570,9 | 3155,929 | 3407,013 | -251,084 | 63043,247 | -1,86 | |
151518,1 | 4091,394 | 3705,099 | 386,2947 | 149223,56 | 2,854 | |
110318,6 | 3037,814 | 2867,513 | 170,3007 | 29002,319 | 1,258 | |
155144,1 | 3603,569 | 3776,54 | -172,971 | 29918,989 | -1,28 | |
129398,2 | 3025,638 | 3261,766 | -236,128 | 55756,234 | -1,74 | |
3041,839 | 3028,447 | 13,39168 | 179,33707 | 0,099 | ||
153232,6 | 3907,761 | 3738,92 | 168,8414 | 28507,433 | 1,247 | |
174761,2 | 3961,124 | 4157,697 | -196,573 | 38640,771 | -1,45 | |
158744,2 | 4072,685 | 3847,153 | 225,5317 | 50864,562 | 1,666 | |
151702,4 | 3991,685 | 3708,738 | 282,9466 | 80058,797 | 2,091 | |
143872,3 | 3692,751 | 3553,367 | 139,3845 | 19428,035 | 1,03 | |
166110,4 | 4227,418 | 3990,686 | 236,7319 | 56042,005 | 1,749 | |
3783,255 | 3959,277 | -176,022 | 30983,852 | -1,3 | ||
114337,7 | 3174,847 | 2951,586 | 223,2607 | 49845,327 | 1,65 | |
136811,3 | 3265,973 | 3411,855 | -145,882 | 21281,685 | -1,08 | |
135744,2 | 3359,623 | 3390,349 | -30,7257 | 944,06702 | -0,23 | |
120100,7 | 2737,437 | 3071,155 | -333,718 | 111367,99 | -2,47 | |
169115,2 | 3801,232 | 4048,882 | -247,65 | 61330,322 | -1,83 | |
156830,3 | 3828,464 | 3809,652 | 18,81159 | 353,87606 | 0,139 | |
Итого | 71496,46 | 879303,2 | ||||
Среднее значение | 3574,82 | |||||
18318,82 | ||||||
135,35 |
Проанализируем полученный график:
Рисунок 6. График стандартизированных остатков
На графике нет выделяющихся наблюдений, что могло бы указывать на отличие математического ожидания ошибок от нуля , либо на неоднородность дисперсии ошибок. Не наблюдается функциональной зависимости от величины , то есть дисперсия ошибок гомоскедастична.Судя по графику, условие выполняется, то есть спецификация модели подобрана правильно.
Таким образом, используемые для построения модели статистические данные соответствуют стандартным предположениям регрессионного анализа.
5. Проверим гипотезу А о том, что потребление данного товара эластично по отношению к располагаемому доходу. Эластичное потребление соответствует значению эластичности, большему единицы по абсолютной величине (А: ).
Воспользуемся формулой (3.41):
,
где – среднеквадратическое (стандартное) отклонение параметра модели b. Для его расчета используем формулу (3.40) и таблицу 12.
Таблица 12
i | xi | ||
150537,1 | 5668,175 | 32128207,83 | |
136570,9 | -8298,025 | 68857218,9 | |
151518,1 | 6649,175 | 44211528,18 | |
110318,6 | -34550,325 | ||
155144,1 | 10275,175 | 105579221,3 | |
129398,2 | -15470,725 | ||
-26832,925 | 720005864,1 | ||
153232,6 | 8363,675 | 69951059,51 | |
174761,2 | 29892,275 | 893548104,7 | |
158744,2 | 13875,275 | 192523256,3 | |
151702,4 | 6833,475 | 46696380,58 | |
143872,3 | -996,625 | 993261,3906 | |
166110,4 | 21241,475 | 451200260,2 | |
19624,075 | 385104319,6 | ||
114337,7 | -30531,225 | ||
136811,3 | -8057,625 | 64925320,64 | |
135744,2 | -9124,725 | 83260606,33 | |
120100,7 | -24768,225 | 613464969,7 | |
169115,2 | 24246,275 | 587881851,4 | |
156830,3 | 11961,375 | 143074491,9 | |
Итого | |||
Среднее значение | 144868,9 |
Значение критерия Стьюдента определим по приложению 2: t1-0,05;18=2,1.
Нетрудно видеть, что при подстановке любого числа, большего 1 по абсолютной величине, данное неравенство выполняется. Так как наблюдаемое значение отношения больше табличного по абсолютной величине, такую гипотезу с вероятностью 0,95 следует отвергнуть. Это означает слишком большое отклонение оценки b от гипотетического значения параметра в сравнении с оценкой стандартного отклонения этого параметра.
Аналогично проверим гипотезу Б, состоящую в том, что потребление данного товара неэластично по отношению к располагаемому доходу (В: ). Данная гипотеза будет выполняться только при условии подстановки в неравенство чисел из интервала или .
Таким образом, гипотеза Б (потребление товара неэластично по отношению к располагаемому доходу) с вероятностью 0,95 принимается для значений , и отвергается с этой же вероятностью для других значений эластичности, меньших 1.
Как видим, при значениях параметра, не принадлежащих 0,95-процентному доверительному интервалу, обе гипотезы отвергаются. Следовательно, проверить обе гипотезы, то есть осуществить прогноз по подобранной модели, можно только в рассчитанном интервале.