Корреляционный анализ
Различают:
- парную корреляцию – это зависимость между результативным и факторным признаком;
- частную корреляцию – это зависимость между результативным и одним факторным признаком при фиксированном значении других факторных признаков;
- множественную – многофакторное влияние в статической модели .
Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции, который рассчитывается по одной из формул:
(5.16)
. (5.17)
Оценка линейного коэффициента корреляции
Значение r | Характер связи | Интерпретация связи |
r = 0 | Отсутствует | Изменение x не влияет на изменения y |
0 < r < 1 | Прямая | С увеличением x увеличивается y |
-1 > r > 0 | Обратная | С увеличением x уменьшается y и наоборот |
r = 1 | Функциональная | Каждому значению факторного признака строго соответствует одно значение результативного |
Значимость линейного коэффициента корреляции проверяется на основе t-критерия Стьюдента. Для этого определяется фактическое значение критерия :
, (5.18)
Вычисленное по формуле (6.18) значение сравнивается с критическим , который получают по таблице Стьюдента с учетом принятого уровня значимости и числа степеней свободы ν. Коэффициент корреляции считается статистически значимым, если tрасч превышает : tрасч > .
Универсальным показателем тесноты связи является теоретическое корреляционное отношение:
, (5.19)
где – общая дисперсия эмпирических значений y, характеризует вариацию результативного признака за счет всех факторов, включая х;
– факторная дисперсия теоретических значений результативного признака, отражает влияние фактора х на вариацию у;
– остаточная дисперсия эмпирических значений результативного признака, отражает влияние на вариацию у всех остальных факторов кроме х.
По правилу сложения дисперсий:
, т.е. . (5.19)
Оценка связи на основе теоретического корреляционного отношения (шкала Чеддока)
Значение | Характер связи | Значение | Характер связи | |
η = 0 | Отсутствует | 0,5 ≤ η < 0,7 | Заметная | |
0 < η < 0,2 | Очень слабая | 0,7 ≤ η < 0,9 | Сильная | |
0,2 ≤ η < 0,3 | Слабая | 0,9 ≤ η < 1 | Весьма сильная | |
0,3 ≤ η < 0,5 | Умеренная | η = 1 | Функциональная |
Для линейной зависимости теоретическое корреляционное отношение тождественно линейному коэффициенту корреляции, т.е. η = |r|.
Множественный коэффициент корреляции в случае зависимости результативного признака от двух факторов вычисляется по формуле:
, (5.20)
где – парные коэффициенты корреляции между признаками.
Множественный коэффициент корреляции изменяется в пределах от 0 до 1 и по определению положителен: .
Условие включения факторных признаков в регрессионную модель – наличие тесной связи между результативным и факторными признаками и как можно менее существенная связь между факторными признаками. |
Значимость коэффициента множественной детерминации, а соответственно и адекватность всей модели и правильность выбора формы связи можно проверить с помощью критерия Фишера:
, (5.21)
где R2 – коэффициент множественной детерминации (R2 );
k – число факторных признаков, включенных в уравнение регрессии.
Связь считается существенной, если Fрасч > Fтабл – табличного значения F-критерия для заданного уровня значимости α и числе степеней свободы ν1 = k, ν2 = n – k – 1.
Частные коэффициенты корреляции характеризуют степень тесноты связи результативного признака и фактора, при элиминировании его взаимосвязи с остальными факторами, включенными в анализ. Расчет частных коэффициентов корреляции в случае двухфакторной регрессии (в первом случае исключено влияние факторного признака х2, во втором – х1):
; , (5.22)
где r – парные коэффициенты корреляции между указанными в индексе переменными.
Для оценки сравнительной силы влияния факторов, по каждому фактору рассчитывают частные коэффициенты эластичности:
, (5.23)
где – среднее значение соответствующего факторного признака;
– среднее значение результативного признака;
– коэффициент регрессии при i-м факторном признаке.
Данный коэффициент показывает, на сколько процентов следует ожидать изменения результативного показателя при изменении фактора на 1% и неизменном значении других факторов.
Частный коэффициент детерминации показывает, на сколько процентов вариация результативного признака объясняется вариацией i-го признака, входящего в множественное уравнение регрессии, рассчитывается по формуле:
, (5.24)
где – парный коэффициент корреляции между результативным и i-м факторным признаком;
– соответствующий стандартизованный коэффициент уравнения множественной регрессии:
. (5.25)