Оценка значимости уравнения регрессии

Если нулевая гипотеза H0 справедлива, то факторная и остаточная дисперсии не отличаются друг от друга. Если H0 несправедлива, то факторная дисперсия превышает остаточную в несколько раз. Английским статистиком Снедекором разработаны таблицы критических значений F-отношений при разных уровнях значимости нулевой гипотезы и различном числе степеней свободы. Табличное значение F-критерия – это максимальная величина отношений дисперсий, которая может иметь место при случайном расхождении их для данного уровня вероятности наличия нулевой гипотезы. Вычисленное значение F-отношения признается достоверным (отличным от единицы), если оно больше табличного. В этом случае нулевая гипотеза об отсутствии связи признаков отклоняется и делается вывод о существенности этой связи:

Fфакт > Fтабл, H0 отклоняется.

Если же величина F окажется меньше табличной, то вероятность нулевой гипотезы выше заданного уровня (например, 0,05) и она не может быть отклонена без риска сделать неправильный вывод о наличии связи. В этом случае уравнение регрессии считается статистически незначимым: Fфакт < Fтабл, H0 не отклоняется.

В примере 2.1:

– общая сумма квадратов;

– факторная сумма квадратов, в данном случае равна факторной дисперсии на одну степень свободы s2факт;

– остаточная сумма квадратов;

s2ост = 263,16 / 5 = 52,63 – остаточная дисперсия на одну степень свободы;

s = (52,63)1/2 = 7,255 – стандартная ошибка;

F = 14736,84 / 52,63 = 280;

Fa=0,05 = 6,61; Fa=0,01 = 16,26.

Поскольку Fфакт > Fтабл как при 1%-ном, так и при 5%-ном уровне значимости, можно сделать вывод о значимости уравнения регрессии (связь доказана).

Величина F-критерия связана с коэффициентом детерминации r2. Факторную сумму квадратов отклонений можно представить как

,

а остаточную сумму квадратов – как

.

Тогда значение F-критерия можно выразить следующим образом:

.

В нашем примере r2 = 0,982. В таком случае .

Оценка значимости уравнения регрессии обычно дается в виде таблицы дисперсионного анализа (табл.2.2).

Таблица 2.2. Дисперсионный анализ результатов регрессии

Источники вариации Число степеней свободы Сумма квадратов отклонений Дисперсия на одну степень свободы F-отношение
фактическое табличное при a=0,05
Общая
Объясненная 14376,84 14736,84 6,61
Остаточная 263,16 52,63

 

В линейной регрессии обычно оценивается значимость не только уравнения в целом, но и отдельных его параметров.