И регрессионного анализа

Проблема изучения взаимосвязей экономических показателей является одной из важнейших в экономическом анализе. Любая экономическая политика заключается в регулировании экономических переменных, и она должна основываться прежде всего на знании того, как эти переменные влияют на другие переменные, являющиеся ключевыми для принимающего решение политика. Так, в рыночной экономике не представляется возможным непосредственно регулировать темп инфляции, но на него можно воздействовать средствами бюджетно-налоговой и кредитно-денежной политики.

В наиболее общем виде при изучении взаимосвязей исследователя интересует количественная оценка их наличия и направления, а также характеристика силы и формы влияния одних факторов на другие. Для решения этого вопроса применяется две группы методов, одна из которых включает в себя методы корреляционного анализа, а другого – регрессионный анализ. В то же время ряд исследователей объединяет эти методы в корреляционно – регрессионный анализ, что объясняется наличием целого ряда схожих вычислительных процедур, взаимодополнения при интерпретации результатов и др.

Задачи собственно корреляционного анализа сводятся к измерению тесноты связи между изменяющимися признаками, определению неизвестных причинных связей и оценке факторов, оказывающих наибольшее влияние на результативный признак. Задачи регрессионного анализа лежат в сфере установления формы зависимости, определения функции регрессии, оценки неизвестных значений зависимой переменной.

Решение указанных выше задач опирается на соответствующие приемы, алгоритмы, показатели, применение которых дает основание говорить о статистическом изучении взаимосвязей. Вычислительные процедуры представляют самостоятельный интерес, но знание принципов изучения взаимосвязей, возможностей и ограничений тех или иных методов интерпретации результатов являются обязательным условием исследования.

Невозможно строить, проверять или улучшать экономические модели без статистического анализа их переменных с использованием реальных статистических данных. Вся сфера экономических исследований может быть в определенном смысле охарактеризована как изучение взаимосвязей экономических переменных. При этом инструментарием их базового анализа являются методы статистики и эконометрики.

Методы оценки тесноты связи подразделяются на корреляционные (параметрические) и непараметрические. Параметрические методы основаны на использовании, как правило, оценок нормального распределения и применяются в случаях, когда изучаемая совокупность состоит из величин, которые подчиняются закону нормального распределения. Непараметрические методы не накладывают ограничений на закон распределения изучаемых величин.

Простейшим приемом выявления связи между изучаемыми признаками х и у является построение корреляционной таблицы. Ее наглядным изображением служит корреляционное поле, представляющее собой график, где на оси абсцисс откладываются значения х_i, по оси ординат у_i. По расположению точек, их концентрации в определенном направлении можно судить о наличии связи между изучаемыми признаками х и у.

Последовательность точек х_i (i = 1, …, n) и среднего значения у_i , т.е. `у, позволяет построить график, который иллюстрирует зависимость среднего значения результативного признака у от факторного х – эмпирическую линию регрессии.

По существу, корреляционная таблица, корреляционное поле, эмпирическая линия регрессии предварительно уже характеризуют взаимосвязь, когда выбраны факторный и результативный признаки и требуется сформулировать предположение о форме и направленности связи.

На практике для количественной оценки тесноты связи для линейной регрессии используется линейный коэффициент парной корреляции r_xy, (-1£ r_xy £ 1), который может определяться следующим образом:

(1)

(2)

; (3)

b - коэффициент линейной регрессии ;

s_х, s_у – среднее квадратическое отклонение соответствующей случайной величины;

s_х ² – дисперсия признака х.

Ковариацией (или корреляционным моментом) случайных величин х и у называется математическое ожидание произведения отклонений этих величин от своих математических ожиданий, т. е.:

(4)

cov (x, y) – ковариация признаков х и у;

М(х), М(у) – математическое ожидание случайных величин х и у соответственно.

Для оценки тесноты связи нелинейной регрессии строится индекс корреляции r_ху (0 £ r_ху £ 1):

(5)

где (6)

Коэффициент (индекс) корреляции является безразмерной величиной, так как его значение не зависит от выбора единиц измерения обеих переменных.

Близкая к нулю величина коэффициента корреляции свидетельствует об отсутствии линейной связи переменных, но не об отсутствии связи между ними вообще. Например, если показатель корреляции величин уровней инфляции и безработицы для периода 1970-х-1980-х годов для экономики некоторой страны практически равен нулю, не следует говорить сразу о независимости этих показателей в данный период. Следует попытаться построить более сложную модель их связи, учитывающую, возможно, как нелинейность самой зависимости, так и наличие в ней запаздываний во времени (лагов), а также инерционность динамики соответствующих величин.

Равенство нулю коэффициента корреляции для генеральной совокупности еще не означает, что он будет в точности нулевым для выборки. Наоборот, он обязательно будет отклоняться от истинного значения, но чем больше такое отклонение, тем менее оно вероятно при данном объеме выборки. При каждом конкретном значении коэффициента корреляции величин х и у для генеральной совокупности выборочный коэффициент корреляции является случайной величиной. Следовательно, случайной величиной является также любая его функция, и требуется указать такую функцию, которая имела бы одно из известных распределений, удобное для табличного анализа. Для выборочного коэффициента корреляции r_xy такой функцией является t-статистика, рассчитываемая по формуле

(7)

и имеющая распределение Стьюдента с (n-2) степенями свободы. Число степеней свободы меньше числа наблюдений на 2, поскольку в формулу коэффициента корреляции входят средние значения х и у, для расчета которых используются две линейные формулы их зависимости от наблюдений случайных величин. Для коэффициента корреляции будет проверяться нулевая гипотеза Н₀ , то есть гипотеза о равенстве его нулю в генеральной совокупности (более подробно см. следующую тему).