Задача№ 1
Практическая часть
Вариант 1
1. Построитьполекорреляции,сформулироватьгипотезуоформесвязиипостроитьэмпирическуюлиниюрегрессии(линиютренда).
Рассмотрим пример использования данных функций. Исходные данные, в которых содержатся цена и спрос на некоторый товар, представлены в таблице 1.
x | y | |
17,09 | 130,18 | |
17,71 | 130,06 | |
16,78 | 124,93 | |
16,49 | 119,41 | |
17,29 | 124,24 | |
17,42 | 122,57 | |
18,10 | 129,59 | |
17,91 | 122,09 | |
17,42 | 119,92 | |
17,70 | 122,72 | |
18,41 | 121,45 | |
18,63 | 117,21 | |
18,70 | 120,35 | |
18,59 | 114,86 | |
18,51 | 114,40 | |
С помощью возможностей программного комплекса Excel построил поле корреляции. Т.е задал точечную диаграмму и добавил линию тренда. В параметрах установил – Показывать уравнение на диаграмме, Поместить на диаграмме величину достоверности аппроксимации (R2).
y = -3,069x + 176,8 (линейное уравнение)
R² = 0,187 (коэффициент детерминации)
В данном случае можно сформулировать гипотезу о наличии связи между ценой и спросом на товар, носящей скорее всего линейный характер.
2. Построим уравнение регрессии.
Линейная модель в виде:
Неизвестные значения определяются методом наименьших квадратов (МНК)
Решение системы нормальных уравнений являются оценки неизвестных параметров:
Вспомогательная таблица расчетов
x | y | xy | y2 | i | ||
17,09 | 130,18 | 292,07 | 2224,74 | 85303,775 | 124,36 | |
17,71 | 130,06 | 313,64 | 2303,352 | 98372,621 | 122,45 | |
16,78 | 124,93 | 281,57 | 2096,242 | 79280,764 | 125,31 | |
16,49 | 119,41 | 271,92 | 1969,142 | 73940,541 | 126,2 | |
17,29 | 124,24 | 298,94 | 2148,097 | 89367,575 | 123,74 | |
17,42 | 122,57 | 303,46 | 2135,136 | 92085,787 | 123,34 | |
18,10 | 129,59 | 327,61 | 2345,555 | 107328,31 | 121,26 | |
17,91 | 122,09 | 320,77 | 2186,591 | 102892,17 | 121,84 | |
17,42 | 119,92 | 303,46 | 2089,005 | 92085,787 | 123,34 | |
17,70 | 122,72 | 313,29 | 2172,119 | 98150,624 | 122,4 | |
18,41 | 121,45 | 338,93 | 2235,909 | 114872,26 | 120,3 | |
18,63 | 117,21 | 347,08 | 2183,557 | 120462,37 | 119,63 | |
18,70 | 120,35 | 349,69 | 2250,594 | 122283,1 | 119,41 | |
18,59 | 114,86 | 345,59 | 2135,166 | 119431,13 | 119,75 | |
18,51 | 114,40 | 342,62 | 2117,509 | 117388,53 | ||
итого | 266,75 | 1833,96 | 4750,6 | 32592,71 | 1513245,4 | 1833,33 |
ср.знач | 17,78 | 122,26 | 316,7 | 2172,85 | 100833,02 | 122,22 |
Промежуточные расчеты:
=32592.71/15=2172.85
= 17.78*122.26= 2173.78
= 316.7
=316.12
=-1.603
=122.26+1.603*17.78=150.76
Произведя расчеты получим линейную модель зависимости y от x которая имеет следующий вид:
=150.76-1.603*
3. Коэффициент парной корреляции
Промежуточные расчеты:
= 100833.02
=14947.5
=293,06
=316.7
=316.12
=0.76
=
Коэффициент корреляции |r|<0.19, что свидетельствует об очень слабой связи.
Коэффициент детерминации равен:
=(0,0041)2 =0,0000168
Показатель средней ошибки аппроксимации рассчитывается по формуле:
В нашем случае, = 2,7% , что свидетельствует о высоком качестве модели.
Строим основную гипотезу =0, строим альтернативную гипотезу 0,
, где величина стандартной ошибки.
= , e=| - |
В нашем случае n=15, произведя расчеты получили =2.56
=150, 76, получаем:
t= =58.9.
Формула значения t-критерия Стьюдента для проверки гипотезы =0 имеет вид:
t= *(n-2)
Получаем: t= *(n-2)= *13=0,054
Fнабл= *(n-2), получаем:
Fнабл = *13=0,0022
ВЫВОД ИТОГОВ | ||||||||
Регрессионная статистика | ||||||||
Множественный R | 0,361913 | |||||||
R-квадрат | 0,130981 | |||||||
Нормированный R-квадрат | 0,058563 | |||||||
Стандартная ошибка | 4,515274 | |||||||
Наблюдения | ||||||||
Дисперсионный анализ | ||||||||
df | SS | MS | F | Значимость F | ||||
Регрессия | 36,87476 | 36,87476 | 1,808677 | 0,203535 | ||||
Остаток | 244,6524 | 20,3877 | ||||||
Итого | 281,5271 | |||||||
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | Нижние 95,0% | Верхние 95,0% | |
Y-пересечение | 164,4716 | 31,82725 | 5,167637 | 0,000234 | 95,12604 | 233,8173 | 95,12604 | 233,8173 |
17,09 | -2,39854 | 1,78347 | -1,34487 | 0,203535 | -6,28438 | 1,487311 | -6,28438 | 1,487311 |