Индекс корреляции

Для нелинейной регрессии

Уравнение нелинейной регрессии, так же как и в линейной зависимости, дополняется показателем корреляции, а именно индексом корреляции (R)

где SSост – остаточная сумма квадратов отклонений, определяемая из уравнения регрессии; SSобщ – общая сумма квадратов отклонений результативного признака.

Величина данного показателя находится в границах: 0 £ R £ 1; чем ближе к единице, тем теснее связь рассматриваемых признаков, тем более надежно найденное уравнение регрессии.

Разделив остаточную сумму квадратов на соответствующее ей число степеней свободы, получим средний квадрат отклонений или дисперсию на одну степень свободы S2 и вытекающую из нее стандартную ошибку S.

.

Если нелинейное относительно объясняемой переменной уравнение регрессии при линеаризации принимает форму линейного уравнения парной регрессии, то для оценки тесноты связи может быть использован линейный коэффициент корреляции, величина которого в этом случае совпадает с индексом корреляции ryz (z = 1/x или z = ln x),

где z - преобразованная величина признака-фактора, например.

Дело обстоит иначе, когда преобразования уравнения в линейную форму связаны с зависимой переменной. В этом случае линейный коэффициент корреляции по преобразованным значениям признаков дает лишь приближенную оценку тесноты связи и численно не совпадает с индексом корреляции. Так, для степенной функции yx = a × xb после перехода к логарифмически линейному уравнению ln y = ln a + b × ln x может быть найден линейный коэффициент корреляции не для фактических значений переменных x и y, а для их логарифмов, т.е. rln y ln x. Соответственно квадрат его значения будет характеризовать отношение факторной суммы квадратов отклонений к общей, но не для y, а для его логарифмов

.

Между тем при расчете индекса корреляции используются суммы квадратов отклонений признака y, а не их логарифмов. С этой целью определяются теоретические значения результативного признака, т.е. , как антилогарифм рассчитанной по уравнению величины ln(y) и остаточная сумма квадратов как . Индекс корреляции имеет вид:

Таким образом, они различаются. При незначительных расхождениях результатов по линейной и нелинейной функциям может использоваться линейный коэффициент корреляции.

Несмотря на близость значений Ryx и rln y ln x или Ryx и rln y,x в нелинейных функциях с преобразованием значений признака y, следует помнить, что если при линейной зависимости признаков один и тот же коэффициент корреляции характеризует регрессию как yx = a + b×x, так и xy = A + B×y, поскольку ry,x = rx,y, то при криволинейной зависимости Ryx для функции y = f(x) не равен Rxy для регрессии x = f(y).