F-статистика

Снова предположим, что мы находимся в рамках нормальной линейной регрессионной модели. Из (26) и (27) имеем

;

.

 

Ранее мы показали, что S2 и – независимые случайные величины, поэтому по определению распределений Фишера получаем

 

. (34)

Полученную F-статистику можно использовать для проверки нулевой гипотезы Ho : b = bo = 0. При этой гипотезе статистика (34) выглядит следующим образом:

(b – bo)2å xt2;

. (35)

Если нулевая гипотеза справедлива, то значение F в (35) мало. Таким образом, мы отвергаем нулевую гипотезу, если F превосходит критическое значение Fкр (1, n-2) распределения Фишера с параметрами (1, n-2) для выбранного уровня значимости a.

Статистика уравнения (35) особенно просто выглядит для гипотезы Ho: b=0 (случай отсутствия линейной функциональной связи между X и Y ). Преобразуя числитель следующим образом:

    (36)

получим (в векторных обозначениях для отклонений)

. (36’)

Сравнивая (32) с (35), мы видим, что F = t2, т.е. проверка гипотезы с использованием t- и F-статистик дает в данном случае (для одномерной регрессионной модели) тождественные результаты.

Нетрудно заметить, что, переписывая определение R2-статистики (18) в отклонениях, имеем

. (37)

 

Используя уравнения (36) и (37), получаем следующее соотношение, связывающее R2- и F-статистики:

. (38)

Не удивительно, что малым значениям F (отсутствие значимой функциональной связи X и Y ) соответствуют малые значения R2 (плохая аппроксимация данных).