Проверка качества подгонки регрессионной модели к наблюдаемым данным

Качество построенной модели можно оценить с помощью коэффициента (индекса) детерминации:

R2 = = ,

где - выборочная дисперсия результирующего показателя y; - остаточная дисперсия, объясняемая случайной компонентой, - дисперсия, объясняемая регрессией. Чем больше значение этого показателя ( а оно изменяется от 0 до 1), тем лучше уравнение регрессии объясняет рассеяние наблюдаемых значений результирующего показателя y относительно средней величины, тем меньшее влияние на это рассеяние оказывают случайные факторы.

Для оценки качества уравнения регрессии также используется показатель, связанный с индексом детерминации. Это показатель называется множественный коэффициент корреляции

R = √ R2

Для парной линейной регрессии R = ryx. Степень тесноты связи результирующей и факторных переменных можно оценить, используя шкалу Чеддока

Значение R 0,1 – 0,3 0,3 – 0,5 0,5 – 0,7 0,7 – 0,9 0,9 - 0,99
Степень связи слабая умеренная заметная высокая очень высокая

При значении R более 0,7 величина R2 будет болеее 50%. Это означает, что более 50% вариации результирующей переменной объясняется случайными факторми.