Индекс корреляции, теоретическое корреляционное отношение. Коэффициент детерминации для нелинейных моделей.

Индекс корреляции:

, где

- общая дисперсия результативного признака

, где

- остаточная дисперсия

Т. к. , а , то

Чем ближе к 1, тем теснее связь рассматриваемых признаков, тем ближе к 1, тем теснее связь рассматриваемых признаков, тем более надёжно найдено уравнение регрессии.

Парабола второй степени, как и полином более высокого порядка, при линеаризации принимает вид уравнения множественной регрессии. Если же нелинейное относительно объясняемой переменной УР при линеаризации принимает форму линейного уравнения парной регрессии, то для оценки тесноты связи может быть использован линейный коэффициент корреляции.

, где или

Например, равносторонняя гипербола

, для которой

; ; ; ,

или

но , .

Но так как

, то

.

Для линейной регрессии , а при криволинейной зависимости .

 

Для R используется сумма квадратов, а не их логарифмов. С этой целью определяется теоретические значения результативного признака, то есть как антилогарифм рассчитываемый по уравнению величины и остальная сумма квадрата как .

Поскольку в расчёте индекса корреляции используется отношение факторной и общей суммы квадратов, то R2 имеет тот же смысл, что и коэффициент детерминации. Поэтому R2 для нелинейных связей называется индексом детерминации. Расчет и оценка аналогично линейной корреляции.

Индекс детерминации используется для проверки существенности уравнения нелинейной регрессии в целом по F-критерию:

n – число наблюдений

m – число параметров при переменной х или ч.с.с. факторной суммы квадратов.

n-m-1 – ч.с.с. остаточной суммы квадратов.

Например для степенной функции

для параболы

.

Расчет F-критерия можно проводить по таблице дисперсионного анализа как рассматривали ранее.

Индекс детерминации можно сравнивать с коэффициентом детерминации для обоснования возможности применения линейной функции. Чем больше кривизна линии регрессии, тем < . Близость этих показателей означает, что нет необходимости усложнять форму уравнения регрессии и можно использовать линейную функцию. Практически если не превышает 0,1, то предположение о линейной форме связи считается оправданным. В противном случае проводится оценка существенности различия по критерию Стьюдента.

- ошибка разности между и

Если > , то различия существенны и замена нелинейной регрессии уравнением линейной функции невозможна.

Если t<2, то различия между и несущественны, и возможно применение линейной регрессии.