Проверка гипотез

Лабораторная работа № 3

Цель: научиться обосновывать умозаключения о состоятельности регрессионной модели.

 

Основные формулы и понятия:

— доверительный интервал для b;

— доверительный интервал для a;

— стандартная ошибка для параметра b;

1. t-тест (тест Стьюдента). Тест на значимость коэффициента b.

Нулевая гипотеза H0: b = 0

Альтернативная гипотеза H1:0

t-статистика имеет вид:

область принятия нулевой гипотезы.

Если выполняется данное условие, то принимается нулевая гипотеза, и регрессор признается незначимым. В противном случае принимается альтернативная гипотеза, и регрессор признаётся значимым.

 

2. F-тест (тест Фишера). Тест на значимость всей регрессии.

Нулевая гипотеза H0: R2 = 0

Альтернативная гипотеза H1: R2 ¹ 0

область принятия нулевой гипотезы.

Если выполняется данное условие, то принимается нулевая гипотеза, и вся регрессионная модель признается незначимой. В противном случае принимается альтернативная гипотеза, и модель признаётся значимой.

3. t-тест (тест Стьюдента). Тест на значимость коэффициента корреляции во всей генеральной совокупности

Нулевая гипотеза H0: rx,y = 0

Альтернативная гипотеза H1: rx,y ¹ 0

t-статистика имеет вид:

область принятия нулевой гипотезы.

В парном регрессионном анализе результаты проверки всех трех гипотез эквивалентны.

 

Электронная таблица Excel

В лабораторной работе № 2 нами были проведено исследование зависимости спроса от цены на основании таблицы 1, для которой посредством надстройки была получена итоговая таблица 4 и регрессионная модель вида y = –7,7145x + 240,14. Часть полученной таблицы нами уже рассматривалась.

При этом мы не учитывали, что на диалоговом окне надстройки Регрессия(рис. 8) имеется независимый переключатель Уровень надежности, который по умолчанию равен 95 %. Уровень надежности — это то значение, посредством которого строятся доверительные интервалы для коэффициентов. Можно говорить о том, что Уровень надежности + Уровень значимости = 1, то есть уровень надежности в 95 % отвечает уровню значимости в 5 % и т. д. Данное значение может быть изменено. Для этого в диалоговом окне Регрессиянеобходимо отметить опцию Уровень надежности, после чего можно поставить любое числовое значение от 0 до 100. Чаще всего используются уровни надежности в 99 % или 90 %.

В итоговой таблице имеется значения t-тестов для каждого из коэффициентов регрессии и значение F-теста на состоятельность регрессии. Рассмотрим данную таблицу ещё раз.

Таблица 9

ВЫВОД ИТОГОВ
   
Регрессионная статистика
Множественный R 0,887036
R-квадрат 0,786833
Нормированный R-квадрат 0,770435
Стандартная ошибка 2,264609
Наблюдения

Продолжение табл. 9

     
Дисперсионный анализ  
df SS MS F Значимость F  
Регрессия 246,0889 246,0889 47,985 1,04E–05  
Остаток 66,66991 5,128455      
Итого 312,7588        
             
Коэффи циенты Стандартная ошибка t-ста тистика P- значение Нижние 95 % Верхние 95 %
Y-пересечение 240,142 17,70861 13,56075 4,76E–09 201,8849 278,3991
X –7,71453 1,113671 –6,92712 1,04E–05 –10,1205 –5,30859

 

В разделе Дисперсионный анализ выдается значение F-теста. Данное значение равно 47,985. Однако не происходит проверки гипотезы с некоторым уровнем значимости, а находится само значение данного уровня. Поскольку, как правило, используются уровни в 5 % и 1 %, то при условии, что данное значение меньше 0,01, регрессия считается значимой, и при значении больше 0,05 — незначимой. В данном случае Значимость F равна 1,04E – 5 = 0,000104, то есть всю регрессионную модель можно признать значимой.

При желании можно самостоятельно найти критическое значение. Так, критическое значение с уровнем значимости 95 % можно найти по формуле FРАСПОБР(0,05;1;13) = 4,6671. Первое число степеней свободы равно числу регрессоров 1, а второе равно числу наблюдений, уменьшенному на 2, то есть 13.

В последнем разделе, где выводится значение коэффициентов, также имеется t-статистика для каждого коэффициента, их значимость и доверительные интервалы значений. В данном случае также не производится проверка с некоторым уровнем значимости, а выдаются значения t-статистики и P-значение для каждого параметра.

Анализ полученных значений происходит подобным образом. Если значение меньше чем 0,01, то нулевая гипотеза отвергается, и регрессор признается значимым, если это значение больше чем 0,05, то нулевая гипотеза принимается, и соответственно регрессор признается незначимым. Как правило, эти рассуждения касаются только гипотезы H0: b = 0. В данном случае значение статистики равно 1,04E-05, а, следовательно, регрессор можно признать значимым. При необходимости можно самостоятельно получить значения критических точек распределения Стьюдента для проверки гипотезы с некоторым уровнем значимости.
В последних двух столбцах раздела “Коэффициенты” выдаются доверительные интервалы с некоторым уровнем значимости.

Если в итоговой таблице регрессии имеются результаты о значимости коэффициентов регрессии и всей модели в целом, то гипотезу о значимости коэффициента корреляции необходимо проводить самостоятельно. (Хотя в случае парной регрессионной модели это может и не понадобиться, поскольку все гипотезы эквивалентны.)