Проверка гипотез
Лабораторная работа № 3
Цель: научиться обосновывать умозаключения о состоятельности регрессионной модели.
Основные формулы и понятия:
— доверительный интервал для b;
— доверительный интервал для a;
— стандартная ошибка для параметра b;
1. t-тест (тест Стьюдента). Тест на значимость коэффициента b.
Нулевая гипотеза H0: b = 0
Альтернативная гипотеза H1: b¹0
t-статистика имеет вид:
— область принятия нулевой гипотезы.
Если выполняется данное условие, то принимается нулевая гипотеза, и регрессор признается незначимым. В противном случае принимается альтернативная гипотеза, и регрессор признаётся значимым.
2. F-тест (тест Фишера). Тест на значимость всей регрессии.
Нулевая гипотеза H0: R2 = 0
Альтернативная гипотеза H1: R2 ¹ 0
область принятия нулевой гипотезы.
Если выполняется данное условие, то принимается нулевая гипотеза, и вся регрессионная модель признается незначимой. В противном случае принимается альтернативная гипотеза, и модель признаётся значимой.
3. t-тест (тест Стьюдента). Тест на значимость коэффициента корреляции во всей генеральной совокупности
Нулевая гипотеза H0: rx,y = 0
Альтернативная гипотеза H1: rx,y ¹ 0
t-статистика имеет вид:
— область принятия нулевой гипотезы.
В парном регрессионном анализе результаты проверки всех трех гипотез эквивалентны.
Электронная таблица Excel
В лабораторной работе № 2 нами были проведено исследование зависимости спроса от цены на основании таблицы 1, для которой посредством надстройки была получена итоговая таблица 4 и регрессионная модель вида y = –7,7145x + 240,14. Часть полученной таблицы нами уже рассматривалась.
При этом мы не учитывали, что на диалоговом окне надстройки Регрессия(рис. 8) имеется независимый переключатель Уровень надежности, который по умолчанию равен 95 %. Уровень надежности — это то значение, посредством которого строятся доверительные интервалы для коэффициентов. Можно говорить о том, что Уровень надежности + Уровень значимости = 1, то есть уровень надежности в 95 % отвечает уровню значимости в 5 % и т. д. Данное значение может быть изменено. Для этого в диалоговом окне Регрессиянеобходимо отметить опцию Уровень надежности, после чего можно поставить любое числовое значение от 0 до 100. Чаще всего используются уровни надежности в 99 % или 90 %.
В итоговой таблице имеется значения t-тестов для каждого из коэффициентов регрессии и значение F-теста на состоятельность регрессии. Рассмотрим данную таблицу ещё раз.
Таблица 9
ВЫВОД ИТОГОВ | |
Регрессионная статистика | |
Множественный R | 0,887036 |
R-квадрат | 0,786833 |
Нормированный R-квадрат | 0,770435 |
Стандартная ошибка | 2,264609 |
Наблюдения |
Продолжение табл. 9
Дисперсионный анализ | ||||||
df | SS | MS | F | Значимость F | ||
Регрессия | 246,0889 | 246,0889 | 47,985 | 1,04E–05 | ||
Остаток | 66,66991 | 5,128455 | ||||
Итого | 312,7588 | |||||
Коэффи циенты | Стандартная ошибка | t-ста тистика | P- значение | Нижние 95 % | Верхние 95 % | |
Y-пересечение | 240,142 | 17,70861 | 13,56075 | 4,76E–09 | 201,8849 | 278,3991 |
X | –7,71453 | 1,113671 | –6,92712 | 1,04E–05 | –10,1205 | –5,30859 |
В разделе Дисперсионный анализ выдается значение F-теста. Данное значение равно 47,985. Однако не происходит проверки гипотезы с некоторым уровнем значимости, а находится само значение данного уровня. Поскольку, как правило, используются уровни в 5 % и 1 %, то при условии, что данное значение меньше 0,01, регрессия считается значимой, и при значении больше 0,05 — незначимой. В данном случае Значимость F равна 1,04E – 5 = 0,000104, то есть всю регрессионную модель можно признать значимой.
При желании можно самостоятельно найти критическое значение. Так, критическое значение с уровнем значимости 95 % можно найти по формуле FРАСПОБР(0,05;1;13) = 4,6671. Первое число степеней свободы равно числу регрессоров 1, а второе равно числу наблюдений, уменьшенному на 2, то есть 13.
В последнем разделе, где выводится значение коэффициентов, также имеется t-статистика для каждого коэффициента, их значимость и доверительные интервалы значений. В данном случае также не производится проверка с некоторым уровнем значимости, а выдаются значения t-статистики и P-значение для каждого параметра.
Анализ полученных значений происходит подобным образом. Если значение меньше чем 0,01, то нулевая гипотеза отвергается, и регрессор признается значимым, если это значение больше чем 0,05, то нулевая гипотеза принимается, и соответственно регрессор признается незначимым. Как правило, эти рассуждения касаются только гипотезы H0: b = 0. В данном случае значение статистики равно 1,04E-05, а, следовательно, регрессор можно признать значимым. При необходимости можно самостоятельно получить значения критических точек распределения Стьюдента для проверки гипотезы с некоторым уровнем значимости.
В последних двух столбцах раздела “Коэффициенты” выдаются доверительные интервалы с некоторым уровнем значимости.
Если в итоговой таблице регрессии имеются результаты о значимости коэффициентов регрессии и всей модели в целом, то гипотезу о значимости коэффициента корреляции необходимо проводить самостоятельно. (Хотя в случае парной регрессионной модели это может и не понадобиться, поскольку все гипотезы эквивалентны.)