Корреляционный анализ

Различают:

  • парную корреляцию – это зависимость между результативным и факторным признаком;
  • частную корреляцию – это зависимость между результативным и одним факторным признаком при фиксированном значении других факторных признаков;
  • множественную – многофакторное влияние в статической модели .

Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции, который рассчитывается по одной из формул:

(5.16)

. (5.17)

Оценка линейного коэффициента корреляции

Значение r Характер связи Интерпретация связи
r = 0 Отсутствует Изменение x не влияет на изменения y
0 < r < 1 Прямая С увеличением x увеличивается y
-1 > r > 0 Обратная С увеличением x уменьшается y и наоборот
r = 1 Функциональная Каждому значению факторного признака строго соответствует одно значение результативного

 

Значимость линейного коэффициента корреляции проверяется на основе t-критерия Стьюдента. Для этого определяется фактическое значение критерия :

, (5.18)

Вычисленное по формуле (6.18) значение сравнивается с критическим , который получают по таблице Стьюдента с учетом принятого уровня значимости и числа степеней свободы ν. Коэффициент корреляции считается статистически значимым, если tрасч превышает : tрасч > .

Универсальным показателем тесноты связи является теоретическое корреляционное отношение:

, (5.19)

где общая дисперсия эмпирических значений y, характеризует вариацию результативного признака за счет всех факторов, включая х;

факторная дисперсия теоретических значений результативного признака, отражает влияние фактора х на вариацию у;

остаточная дисперсия эмпирических значений результативного признака, отражает влияние на вариацию у всех остальных факторов кроме х.

По правилу сложения дисперсий:

, т.е. . (5.19)

Оценка связи на основе теоретического корреляционного отношения (шкала Чеддока)

Значение Характер связи   Значение Характер связи
η = 0 Отсутствует 0,5 ≤ η < 0,7 Заметная
0 < η < 0,2 Очень слабая   0,7 ≤ η < 0,9 Сильная
0,2 ≤ η < 0,3 Слабая   0,9 ≤ η < 1 Весьма сильная
0,3 ≤ η < 0,5 Умеренная η = 1 Функциональная

Для линейной зависимости теоретическое корреляционное отношение тождественно линейному коэффициенту корреляции, т.е. η = |r|.

Множественный коэффициент корреляции в случае зависимости результативного признака от двух факторов вычисляется по формуле:

, (5.20)

где парные коэффициенты корреляции между признаками.

Множественный коэффициент корреляции изменяется в пределах от 0 до 1 и по определению положителен: .

 

Условие включения факторных признаков в регрессионную модель – наличие тесной связи между результативным и факторными признаками и как можно менее существенная связь между факторными признаками.

 

Значимость коэффициента множественной детерминации, а соответственно и адекватность всей модели и правильность выбора формы связи можно проверить с помощью критерия Фишера:

, (5.21)

где R2 – коэффициент множественной детерминации (R2 );

k – число факторных признаков, включенных в уравнение регрессии.

 

Связь считается существенной, если Fрасч > Fтабл – табличного значения F-критерия для заданного уровня значимости α и числе степеней свободы ν1 = k, ν2 = n – k – 1.

Частные коэффициенты корреляции характеризуют степень тесноты связи результативного признака и фактора, при элиминировании его взаимосвязи с остальными факторами, включенными в анализ. Расчет частных коэффициентов корреляции в случае двухфакторной регрессии (в первом случае исключено влияние факторного признака х2, во втором – х1):

; , (5.22)

где r – парные коэффициенты корреляции между указанными в индексе переменными.

Для оценки сравнительной силы влияния факторов, по каждому фактору рассчитывают частные коэффициенты эластичности:

, (5.23)

где – среднее значение соответствующего факторного признака;

– среднее значение результативного признака;

– коэффициент регрессии при i-м факторном признаке.

Данный коэффициент показывает, на сколько процентов следует ожидать изменения результативного показателя при изменении фактора на 1% и неизменном значении других факторов.

Частный коэффициент детерминации показывает, на сколько процентов вариация результативного признака объясняется вариацией i-го признака, входящего в множественное уравнение регрессии, рассчитывается по формуле:

, (5.24)

где – парный коэффициент корреляции между результативным и i-м факторным признаком;

– соответствующий стандартизованный коэффициент уравнения множественной регрессии:

. (5.25)