Проверка качества подгонки регрессионной модели к наблюдаемым данным
Качество построенной модели можно оценить с помощью коэффициента (индекса) детерминации:
R2 = = ,
где - выборочная дисперсия результирующего показателя y; - остаточная дисперсия, объясняемая случайной компонентой, - дисперсия, объясняемая регрессией. Чем больше значение этого показателя ( а оно изменяется от 0 до 1), тем лучше уравнение регрессии объясняет рассеяние наблюдаемых значений результирующего показателя y относительно средней величины, тем меньшее влияние на это рассеяние оказывают случайные факторы.
Для оценки качества уравнения регрессии также используется показатель, связанный с индексом детерминации. Это показатель называется множественный коэффициент корреляции
R = √ R2
Для парной линейной регрессии R = ryx. Степень тесноты связи результирующей и факторных переменных можно оценить, используя шкалу Чеддока
Значение R | 0,1 – 0,3 | 0,3 – 0,5 | 0,5 – 0,7 | 0,7 – 0,9 | 0,9 - 0,99 |
Степень связи | слабая | умеренная | заметная | высокая | очень высокая |
При значении R более 0,7 величина R2 будет болеее 50%. Это означает, что более 50% вариации результирующей переменной объясняется случайными факторми.