Корреляционный и регрессионный анализ

Для социально-экономических явлений характерно, что наряду с существенными факторами, формирующими уровень результативного признака, на него оказывают воздействие многие другие неучтенные и случайные факторы. Это свидетельствует о том, что взаимосвязи явлений, которые изучает статистика, носят корреляционный характер.

Корреляция – это статистическая зависимость между случайными величинами, не изменяющими строго функционального характера, при котором изменение одной из них приводит к изменению математического ожидания другой.

В статистике принято различать следующие варианты зависимостей.

1. Парная корреляция – связь между двумя признаками (результативным и факторным).

2. Частная корреляция – зависимость между результативным и одним из факторных признаков при фиксированном значении других факторных признаков.

3.Множественная корреляция – зависимость результативного и двух или более факторных признаков, включенных в исследование.

В общем виде задача статистики в области изучения взаимосвязей состоит не только в количественной оценке их наличия направления и силы связи, но и в определении формы (аналитического выражения) влияния факторных признаков на результативный. Для ее решения применяют методы корреляционного и регрессионного анализа.

Корреляционный анализ имеет своей задачей количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи). А также определение неизвестных причинных связей (причинный характер которых, должен быть выявлен с помощью теоретического анализа) и оценке факторов, оказывающих наибольшее влияние на результативный признак. Теснота связи количественно выражается величиной коэффициентов корреляции.

Одновременно с корреляцией начала использоваться и регрессия. Корреляция и регрессия тесно связаны между собой: первая оценивает силу (тесноту) статистической связи, вторая исследует ее форму. Обе служат для определения наличия или отсутствия связи между явлениями.

Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины (называемой зависимой, или результативным признаком) обусловлено влиянием одной или нескольких независимых величин (факторов), а множество всех прочих факторов, также оказывающих влияние на зависимую величину, принимается за постоянные и средние значения. Регрессия может быть однофакторной (парной – характеризующей связь между двумя признаками: результативным и факторным) и многофакторной (множественной – характеризующей связи между тремя и более связанными между собой признаками).

Решение названных задач опирается на соответствующие приемы, алгоритмы, показатели, применение которых дает основание говорить о статистическом изучении взаимосвязи.

Следует заметить, что традиционные методы корреляции и регрессии широко представлены в разного рода статистических пакетах программ для ЭВМ. Исследователя остается только правильно подготовить информацию, выбрать удовлетворяющий требованиям анализа пакет программ и быть готовым к интерпретации полученных результатов. Алгоритмов вычисления параметров связи существует множество, и в настоящее время вряд ли целесообразно проводить такой сложный анализ вручную. Вычисленные процедуры представляют самостоятельный интерес, но знание принципов изучения взаимосвязей, возможностей и ограничений тех или иных методов интерпретации результатов является обязательным условием исследования.