Оценка значимости уравнения регрессии
Если нулевая гипотеза H0 справедлива, то факторная и остаточная дисперсии не отличаются друг от друга. Если H0 несправедлива, то факторная дисперсия превышает остаточную в несколько раз. Английским статистиком Снедекором разработаны таблицы критических значений F-отношений при разных уровнях значимости нулевой гипотезы и различном числе степеней свободы. Табличное значение F-критерия – это максимальная величина отношений дисперсий, которая может иметь место при случайном расхождении их для данного уровня вероятности наличия нулевой гипотезы. Вычисленное значение F-отношения признается достоверным (отличным от единицы), если оно больше табличного. В этом случае нулевая гипотеза об отсутствии связи признаков отклоняется и делается вывод о существенности этой связи:
Fфакт > Fтабл, H0 отклоняется.
Если же величина F окажется меньше табличной, то вероятность нулевой гипотезы выше заданного уровня (например, 0,05) и она не может быть отклонена без риска сделать неправильный вывод о наличии связи. В этом случае уравнение регрессии считается статистически незначимым: Fфакт < Fтабл, H0 не отклоняется.
В примере 2.1:
– общая сумма квадратов;
– факторная сумма квадратов, в данном случае равна факторной дисперсии на одну степень свободы s2факт;
– остаточная сумма квадратов;
s2ост = 263,16 / 5 = 52,63 – остаточная дисперсия на одну степень свободы;
s = (52,63)1/2 = 7,255 – стандартная ошибка;
F = 14736,84 / 52,63 = 280;
Fa=0,05 = 6,61; Fa=0,01 = 16,26.
Поскольку Fфакт > Fтабл как при 1%-ном, так и при 5%-ном уровне значимости, можно сделать вывод о значимости уравнения регрессии (связь доказана).
Величина F-критерия связана с коэффициентом детерминации r2. Факторную сумму квадратов отклонений можно представить как
,
а остаточную сумму квадратов – как
.
Тогда значение F-критерия можно выразить следующим образом:
.
В нашем примере r2 = 0,982. В таком случае .
Оценка значимости уравнения регрессии обычно дается в виде таблицы дисперсионного анализа (табл.2.2).
Таблица 2.2. Дисперсионный анализ результатов регрессии
Источники вариации | Число степеней свободы | Сумма квадратов отклонений | Дисперсия на одну степень свободы | F-отношение | |
фактическое | табличное при a=0,05 | ||||
Общая | – | – | – | ||
Объясненная | 14376,84 | 14736,84 | 6,61 | ||
Остаточная | 263,16 | 52,63 | – |
В линейной регрессии обычно оценивается значимость не только уравнения в целом, но и отдельных его параметров.