II. Корреляционный анализ количественных переменных

x y
27,068 172,17
29,889 200,90
33,158 232,10
34,444 231,83
37,299 246,53
37,554 236,99
37,755 233,40
37,909 256,43
38,348 261,89
39,137 259,36
40,370 253,62
46,298 278,87

1. Простые методы выявления корреляционной связи
между количественными переменными.

 

Для выявления наличия и характера корреляционной связи между двумяколичественными признаками в статистике используется рядметодов.

1. Рассмотрение параллельных данных(значений x и y в каждой из n единиц). Единицы наблюдения необходимо расположить по возрастанию значений факторного признака х (как в таблице справа) и затем сравнить с ним (визуально) поведение результативного признака у.

В нашей задаче в 6 случаях по мере увеличения значений x увеличиваются и значения y, а в 5 случаях этого не происходит, поэтому затруднительно говорить о прямой связи между х и у.

2. Графический метод – это графическое изображение корреляционной зависимости. Для этого, имея n взаимосвязанных пар значений x и y и пользуясь прямоугольной системой координат, каждую такую пару изображают в виде точки на плоскости с координатами x и y. Совокупность полученных точек представляет собой корреляционное поле (рис. 1), а соединяя последовательно нанесенные точки отрезками, получают ломаную линию, именуемую эмпирической линией регрессии (рис. 2).

Рис. 1. Корреляционное поле Рис. 2. Эмпирическая линия регрессии

По характеру расположения точек на поле корреляции делаютвывод о наличии или отсутствии связи, о характере связи (линейнаяили нелинейная), а если связь линейная- то прямая или обратная).В нашей задаче эмпирическая линия регрессии (рис.2) похожа на восходящую прямую, что позволяет выдвинуть гипотезу о наличии прямой линейной зависимости между величиной стоимостного внешнеторгового товарооборота и величиной таможенных платежей в федеральный бюджет.

 

3. Метод аналитических группировокиспользуется при большом числе наблюдений для выявления корреляционной связи между двумя количественными признаками. Метод аналитических группировок может также применяться, если значения фактора X–ранговые признаки.

Чтобы выявить наличие корреляционной связи между двумя количественными признаками, проводится группировка единиц совокупности по факторному признаку х и для каждой выделенной группы рассчитывается среднее значение результативного признака (можно рассчитать и среднее значение факторного признака ). Если результативный признак у зависит от факторного х, то в изменении среднего значения будет прослеживаться определенная закономерность.

В последнем столбце таблицы приведены средние величины, рассчитанные на основе индивидуальных данных о размерах таможенных отдельных предприятий каждой группы. Данные таблицы свидетельствуют, что чем крупнее товарооборот, тем меньше доля издержек обращения.

 

группа
27-31 28,4785 186,535
31-35 33,801 231,965
35-39 37,773 247,048
39-43 39,7535 256,49
43-47 46,298 278,87

 

 

Аналитическая таблица и эмпирическая линия регрессии показывают, что при увеличении Xсредние значения Y также увеличиваются, что свидетельствует о наличии прямой связи между X и Y.

 

4. Коэффициент корреляции знаков (Фехнера) – простейший показатель тесноты связи, основанный на сравнении поведения отклонений индивидуальных значений каждого признака (x и y) от своей средней величины. При этом во внимание принимаются не величины, а их знаки («+» или «–»). Определив знаки отклонений от средней величины в каждом ряду, рассматривают все пары знаков и подсчитывают число их совпадений (С) и несовпадений (Н). Коэффициент Фехнерарассчитывается как отношение разности чисел пар совпадений и несовпадений знаков к их сумме, т.е. к общему числу наблюдаемых единиц:

. (1)

Коэффициент Фехнера может принимать значения от 0 до 1. Однако, если КФ1, то это ни в коей мере нельзя воспринимать как свидетельство функциональной зависимости между х и у.

Если то корреляционная связь между Xи Y прямая;

при корреляционная связь между Xи Yобратная;

при корреляционная связь между Xи отсутствует.

Теснота связи (сила связи) определяется по шкале Чеддока.

 

Рассчитаем коэффициент Фехнера для наших данных.

; .

В двух последних столбцах следующей таблицы приведены знаки отклонений каждого х и у от своей средней величины. Число совпадений знаков – 10, а несовпадений – 2.

Вспомогательная таблица для расчета коэффициента Фехнера

№ п/п x y x – y –
27,068 172,17
29,889 200,90
33,158 232,10
34,444 231,83
37,299 246,53 + +
37,554 236,99 +
37,755 233,40 +
37,909 256,43 + +
38,348 261,89 + +
39,137 259,36 + +
40,370 253,62 + +
46,298 278,87 + +
Итого 439,229 2864,09    

Тогда определяем коэффициент корреляции знаков (Фехнера):

КФ=

 

Обычно такое значение показателя тесноты связи характеризует заметную прямую зависимость между x и y, однако, следует иметь в виду, что поскольку КФ зависит только от знаков и не учитывает величину самих отклонений х и у от их средних величин, то он практически характеризует не столько тесноту связи, сколько ее наличие и направление.

 

2. Корреляционный анализ количественных переменными.