Занятие 22. Корреляционный метод анализа

3. Понятие теории корреляции

Важнейшим этапом в изучении связей является выяснение их социально–экономической сущности. Качественный анализ представляет собой совокупность понятий, категорий и методов, с помощью которых раскрываются качественная определенность явлений, их связи, сходство и различия. Познание качества должно сопровождаться отбором из совокупности свойств самых существенных, обусловливающих его устойчивость.

Для проведения более углубленного анализа связей различных явлений и процессов, т.е. при наличии связи между признаками, необходимо установить характер и тесноту этой связи.

Использование возможностей современной вычислительной техники, оснащенной пакетами программ машинной обработки статистической информации на ЭВМ, делает практически осуществимым оперативное решение задач изучения корреляционной связи показателей коммерческой деятельности методами корреляционно-регрессионного анализа.

При машинной обработке исходной информации на ЭВМ, оснащенных пакетами стандартных программ ведения корреляционно-регрессионного анализа, вычисление параметров применяемых математических функций является быстро выполняемой счетной операцией. Результаты выдаются в виде соответствующих машинограмм (распечаток) ЭВМ.

При изучении корреляционной связи показателей коммерческой деятельности в условиях преобладания так называемого малого и среднего бизнеса анализу подвергаются сравнительно небольшие по составу единиц совокупности. При численности объектов анализа до 30 единиц возникает необходимость испытания параметров уравнения регрессии на их типичность. При этом осуществляется проверка, насколько вычисленные параметры характерны для отображаемого комплекса условий, не являются ли полученные значения параметров результатами действия случайных причин.

Главной особенностью экономических исследований с применением математических методов является моделирование процессов и явлений. При помощи экономико-математической модели на фактическом материале производится проверка экономических теорий на основании методов математической статистики. Одним из методов моделирования экономических процессов является корреляционно–регрессионный метод исследования, призванный решать следующие задачи:

· выявление зависимости признаков;

· выбор формы связи и нахождение ее аналитического выражения;

· измерение степени тесноты связи;

· расчет теоретических уровней;

· анализ полученных результатов.

Выявление зависимости признаков предполагает логическую обработку первичного материала, отбор факторов, влияющих на результативный признак, выявление зависимостей с помощью метода группировок.

Выбор формы связи осуществляется с помощью графического метода с последующим построением уравнения связи – регрессионной модели.

Степень тесноты связи измеряется помощью коэффициента корреляции с целью суждения об адекватности (соответствии) полученной экономико-математической модели данному экономическому процессу или явлению.

Расчет теоретических уровней состоит в том, чтобы по полученному уравнению регрессии или модели находить теоретические уровни, т.е. планируемые прогнозируемые показатели на предстоящий период.

Следовательно, можно сказать, что данный метод анализа применяется в целях научно обоснованного нормирования, краткосрочного планирования и прогнозирования.

Итогом применения этого метода исследования являются корректировка, интерпретация и экономический анализ полученных результатов: показателей тесноты связи, расчетных значений результативного признака, коэффициентов регрессии.

Предваряя процесс моделирования экономических процессов и явлений на основе построения корреляционно–регрессионной модели, отвечающей определенным критериям значимости, следует обратиться к истории возникновения этих терминов.

Термин "корреляция" произошел от латинского слова "correlatio", т.е. соотношение, был заимствован из естествознания. Впервые его употребил Ж. Кювье(1769–1832), французский зоолог. Суть отношений заключается в том, что значениям факторного признака соответствуют не строго определенные значения результативного признака, как при функциональных связях, а распределение этих значений. Причем отношение зависимости может проявляться лишь в изменении их средних величин.

Термин "регрессия" был заимствован из биологии и происходит от латинского "regressio", т.е. движение назад.

Английский психолог и антрополог Б. Гальтон (1832–1911), исследуя статистические проблемы наследственности, ввел этот термин в оборот математической статистики.

 

Корреляционно–регрессионный метод исследования состоит из двух этапов. К первому этапу относится корреляционный анализ, а ко второму –регрессионный анализ.

Корреляционный метод исследования:

· выявляет зависимость между признаками;

· устанавливает форму связи и находит ее аналитическое выражение;

· измеряет степень тесноты связи.

К задачам регрессионного анализа относится:

  • выражение аналитической формы связи в виде построения уравнения связи (регрессии);
  • расчет на основе этого уравнения теоретических уровней, т.е. ожидаемые, планируемые или прогнозируемые показатели на предстоящий период.

4. Корреляционный метод анализа

Задачи, поставленные перед корреляционным методом исследования, разрешаются с помощью следующих методов анализа:

  • качественного анализа с отбором взаимосвязанных признаков (факторов);
  • графического метода;
  • метода определения тесноты связи.

Эти методы исследования имеют большое значение, так как их результаты представляют информацию о сущности и характере исследуемой связи и служат основой для регрессионного анализа, дающего выражение аналитической формы связи в виде теоретического уравнения регрессии (связи).

Одной из особенностей корреляционной связи является то, что она не бывает функциональной, т.е. не обнаруживается в единичных случаях, а обнаруживается только в массовых наблюдениях и проявляется в среднем для совокупности изучаемых явлений. Для того, чтобы выявить закономерность массового явления, выражающуюся в зависимости между данными признаками, необходимо устранить влияние случайностей. Принимая во внимание, что корреляционные зависимости присутствуют в массовых явлениях с достаточным числом статистических данных, можно рассчитывать на правильное отражение общей тенденции взаимосвязей.

 

При исследовании должно выполняться основное условие – соблюдение качественной и количественной однородности единиц наблюдения, которое обеспечивает получение регрессионной модели, адекватной эмпирическим данным.

Исходной информацией для корреляционного метода исследования являются эмпирические данные, полученные в результате применения элементарных приемов изучения взаимосвязей, т.е. сравнения и сопоставления параллельных рядов и применения метода группировок.

Логическим продолжением метода группировок является корреляционный анализ. Поэтому первая задача – выявление зависимости между признаками – предполагает качественный анализ в обработке первичного материала, отбор факторов, а выявление зависимостей определяется в основном с помощью метода группировок. Можно сказать, что метод корреляции базируется на методе приведения параллельных рядов и методе группировок, а следовательно, они и включаются в него, так как эти методы предполагают качественный анализ с отбором взаимосвязанных результативного и факторных признаков.

 

Вторая и наиболее сложная задача – выбор формы связи осуществляется с помощью графического метода с последующим нанесением на этот же график результатов, полученных на основании построенной корреляционно–регрессионной модели.

Исходные эмпирические (фактические) данные наносим на график корреляционного поля и на основе графика делаем вывод о форме связи. На оси абсцисс откладываем факторные значения признака, а на оси ординат – результативные. Если связь между признаками достаточно тесная и прямая, то наибольшее число точек (данных) расположится достаточно узкой полосой по диагонали слева направо и снизу вверх, так как прямая связь предполагает, что при возрастании значений одного признака возрастают значения другого признака. При обратной и достаточно тесной связи наибольшее число точек размещается также полосой по диагонали слева направо и сверху вниз, так как при такой связи возрастание значений одного признака сопровождается убыванием значений другого.

 

Отсутствие связи или слабая связь будут характеризоваться разбросанностью точек (данных) по всему графику и всей таблице. Эти три случая представлены на графиках корреляционного поля:

 

 
 

а) прямая линейная зависимость;

б) обратная линейная зависимость;

в) зависимость отсутствует

Построив график по эмпирическим значениям обоих признаков, можно сделать вывод о форме связи, ее направлении, а по разбросу точек – о тесноте связи.

Прежде чем перейти к построению уравнения регрессии (модели), необходимо определить коэффициент корреляции парной или множественной с тем, чтобы убедиться в необходимости дальнейших расчетов.

Следующим этапом исследования является количественное определение степени влияния факторных признаков на результативный. Мерой существенности влияния являются показатели тесноты связи: линейный коэффициент корреляции при прямолинейной форме связи и корреляционное отношение при криволинейной форме связи, которые дают возможность судить в будущем о соответствии полученной экономико-статистической модели экономическому процессу или явлению.

Линейный коэффициент корреляции обозначается "r" и изменяется при прямой связи от 0 до +1, а при обратной связи от 0 до –1.

О тесноте связи свидетельствует абсолютная величина коэффициента корреляции. Чем теснее связь между признаками, тем ближе к единице будет значение линейного коэффициента корреляции и наоборот. Для качественной оценки тесноты связи используется таблица Чэддока:

Значение коэффициента корреляции 0,1–0,3 0,3–0,5 0,5–0,7 0,7–0,9 0,9–0,99
Характеристика тесноты связи слабая умеренная заметная высокая очень высокая

 

При наличии криволинейной связи "r" недооценивает тесноту связи и в некоторых случаях дает неверное представление о степени тесноты связи.

В основе исчисления корреляционного отношения лежит правило сложения дисперсий, согласно которому общая дисперсия результативного признака может быть представлена как сумма двух дисперсий – внутригрупповой и межгрупповой . Общая дисперсия характеризует вариацию признака всей совокупности единиц; внутригрупповая – часть общей дисперсии величин признака "у", которая не зависит от изменений величин фактора "х" и всецело складывается под влиянием других случайных причин; межгрупповая – часть общей дисперсии признака "у", которая целиком складывается под влиянием изменения величин, лежащего в основе группировки фактора "х":

.

Отношение показывает, какую долю общей дисперсии составляет дисперсия под влиянием изучаемого фактора. Извлекая квадратный корень из величины этого отношения, получаем корреляционное отношение:

.

На этом заканчивается первый этап исследования – корреляционный анализ, который позволяет определить направление, форму и силу тесноты связи. Результаты корреляционного анализа служат основой для проведения регрессионного анализа, дающего выражение аналитической форме связи в виде построения теоретического уравнения регрессии.

. . .