Проверка гипотез

Лабораторная работа № 3

Цель: научиться обосновывать умозаключения о состоятельности регрессионной модели.

Основные формулы и понятия:

— доверительный интервал для b;

— доверительный интервал для a;

— стандартная ошибка для параметра b;

1. t-тест (тест Стьюдента). Тест на значимость коэффициента b.

Нулевая гипотеза H_0: b = 0

Альтернативная гипотеза H_1: b¹0

t-статистика имеет вид:

— область принятия нулевой гипотезы.

Если выполняется данное условие, то принимается нулевая гипотеза, и регрессор признается незначимым. В противном случае принимается альтернативная гипотеза, и регрессор признаётся значимым.

2. F-тест (тест Фишера). Тест на значимость всей регрессии.

Нулевая гипотеза H₀: R² = 0

Альтернативная гипотеза H₁: R²¹ 0

область принятия нулевой гипотезы.

Если выполняется данное условие, то принимается нулевая гипотеза, и вся регрессионная модель признается незначимой. В противном случае принимается альтернативная гипотеза, и модель признаётся значимой.

3. t-тест (тест Стьюдента). Тест на значимость коэффициента корреляции во всей генеральной совокупности

Нулевая гипотеза H_0: r_x,_y = 0

Альтернативная гипотеза H_1: r_x,_y ¹ 0

t-статистика имеет вид:

— область принятия нулевой гипотезы.

В парном регрессионном анализе результаты проверки всех трех гипотез эквивалентны.

Электронная таблица Excel

В лабораторной работе № 2 нами были проведено исследование зависимости спроса от цены на основании таблицы 1, для которой посредством надстройки была получена итоговая таблица 4 и регрессионная модель вида y = –7,7145x + 240,14. Часть полученной таблицы нами уже рассматривалась.

При этом мы не учитывали, что на диалоговом окне надстройки Регрессия(рис. 8) имеется независимый переключатель Уровень надежности, который по умолчанию равен 95 %. Уровень надежности — это то значение, посредством которого строятся доверительные интервалы для коэффициентов. Можно говорить о том, что Уровень надежности + Уровень значимости = 1, то есть уровень надежности в 95 % отвечает уровню значимости в 5 % и т. д. Данное значение может быть изменено. Для этого в диалоговом окне Регрессиянеобходимо отметить опцию Уровень надежности, после чего можно поставить любое числовое значение от 0 до 100. Чаще всего используются уровни надежности в 99 % или 90 %.

В итоговой таблице имеется значения t-тестов для каждого из коэффициентов регрессии и значение F-теста на состоятельность регрессии. Рассмотрим данную таблицу ещё раз.

Таблица 9

ВЫВОД ИТОГОВ

Регрессионная статистика
Множественный R	0,887036
R-квадрат	0,786833
Нормированный R-квадрат	0,770435
Стандартная ошибка	2,264609
Наблюдения

Продолжение табл. 9


Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия		246,0889	246,0889	47,985	1,04E–05
Остаток		66,66991	5,128455
Итого		312,7588

	Коэффи циенты	Стандартная ошибка	t-ста тистика	P- значение	Нижние 95 %	Верхние 95 %
Y-пересечение	240,142	17,70861	13,56075	4,76E–09	201,8849	278,3991
X	–7,71453	1,113671	–6,92712	1,04E–05	–10,1205	–5,30859

В разделе Дисперсионный анализ выдается значение F-теста. Данное значение равно 47,985. Однако не происходит проверки гипотезы с некоторым уровнем значимости, а находится само значение данного уровня. Поскольку, как правило, используются уровни в 5 % и 1 %, то при условии, что данное значение меньше 0,01, регрессия считается значимой, и при значении больше 0,05 — незначимой. В данном случае Значимость F равна 1,04E – 5 = 0,000104, то есть всю регрессионную модель можно признать значимой.

При желании можно самостоятельно найти критическое значение. Так, критическое значение с уровнем значимости 95 % можно найти по формуле FРАСПОБР(0,05;1;13) = 4,6671. Первое число степеней свободы равно числу регрессоров 1, а второе равно числу наблюдений, уменьшенному на 2, то есть 13.

В последнем разделе, где выводится значение коэффициентов, также имеется t-статистика для каждого коэффициента, их значимость и доверительные интервалы значений. В данном случае также не производится проверка с некоторым уровнем значимости, а выдаются значения t-статистики и P-значение для каждого параметра.

Анализ полученных значений происходит подобным образом. Если значение меньше чем 0,01, то нулевая гипотеза отвергается, и регрессор признается значимым, если это значение больше чем 0,05, то нулевая гипотеза принимается, и соответственно регрессор признается незначимым. Как правило, эти рассуждения касаются только гипотезы H_0: b = 0. В данном случае значение статистики равно 1,04E-05, а, следовательно, регрессор можно признать значимым. При необходимости можно самостоятельно получить значения критических точек распределения Стьюдента для проверки гипотезы с некоторым уровнем значимости.
В последних двух столбцах раздела “Коэффициенты” выдаются доверительные интервалы с некоторым уровнем значимости.

Если в итоговой таблице регрессии имеются результаты о значимости коэффициентов регрессии и всей модели в целом, то гипотезу о значимости коэффициента корреляции необходимо проводить самостоятельно. (Хотя в случае парной регрессионной модели это может и не понадобиться, поскольку все гипотезы эквивалентны.)