F-статистика
Снова предположим, что мы находимся в рамках нормальной линейной регрессионной модели. Из (26) и (27) имеем
;
.
Ранее мы показали, что S2 и – независимые случайные величины, поэтому по определению распределений Фишера получаем
. (34)
Полученную F-статистику можно использовать для проверки нулевой гипотезы Ho : b = bo = 0. При этой гипотезе статистика (34) выглядит следующим образом:
(b – bo)2å xt2;
. (35)
Если нулевая гипотеза справедлива, то значение F в (35) мало. Таким образом, мы отвергаем нулевую гипотезу, если F превосходит критическое значение Fкр (1, n-2) распределения Фишера с параметрами (1, n-2) для выбранного уровня значимости a.
Статистика уравнения (35) особенно просто выглядит для гипотезы Ho: b=0 (случай отсутствия линейной функциональной связи между X и Y ). Преобразуя числитель следующим образом:
(36) |
получим (в векторных обозначениях для отклонений)
. (36’)
Сравнивая (32) с (35), мы видим, что F = t2, т.е. проверка гипотезы с использованием t- и F-статистик дает в данном случае (для одномерной регрессионной модели) тождественные результаты.
Нетрудно заметить, что, переписывая определение R2-статистики (18) в отклонениях, имеем
. (37)
Используя уравнения (36) и (37), получаем следующее соотношение, связывающее R2- и F-статистики:
. (38)
Не удивительно, что малым значениям F (отсутствие значимой функциональной связи X и Y ) соответствуют малые значения R2 (плохая аппроксимация данных).