Изучение взаимосвязи экономических явлений.

Тема 9

В экономике многие процессы взаимосвязаны. Важно не только установить факт взаимосвязи, но и в целях прогнозирования и эффективного управления необходимо выявленным связям придавать математическую количественную определенность. Это и есть основная задача статистики в области изучения взаимосвязи. При этом одни показатели выступают как факторы (причины), то есть они обуславливают изменения других показателей, которые называются результативными. Разделение показателей на факторные и результативные условно и зависит от цели статистического изучения взаимосвязи. Взаимосвязи разделяются по характеру, зависимости, по методу изучения связи.

Одной из важных задач статистики является исследование существующих связей между явлениями. Связи могут быть:

– функциональными – когда определенному значению факторного признака соответствует одно значение результативного признака, то есть это жесткая связь, определяемая какими-то соотношениями, зависимостями или формулами, однозначная связь;

– стохастическими – причинная зависимость проявляется не в каждом отдельном случае, а, в общем, при большом числе наблюдений.

Стохастическая связь может быть:

- регрессионной, то есть связь, в которой изменение одной величины обусловлено влиянием одного или нескольких независимых факторов, а прочие факторы принимаются за постоянные или средние значения;

- корреляционной, то есть когда одной и той же величине факторного признака соответствуют несколько различных значений результативного признака или наоборот. Она проявляется не в каждом отдельном случае, а в массе случаев в средних величинах в форме тенденции. Например: связь между издержками обращения и выручкой магазина, зависимость между производительностью труда и уровнем квалификации персонала, между урожайностью зерновых и количеством выпавших осадков и т.п.

Виды связей можно разделить на три группы:

1. По направлению действия:

– прямые (с увеличением или уменьшением факторного признака соответственно увеличивается или уменьшается результативный показатель);

– обратные (с увеличением или уменьшением факторного признака соответственно уменьшается или увеличивается результативный показатель).

2. По аналитическому выражению:

– прямолинейные (связь может быть приближенно выражена уравнением прямой);

– криволинейные (связь может быть приближенно выражена уравнением кривой).

3. По количеству факторов:

– однофакторные (парные);

– многофакторные (множественные).

Таким образом, оценка степени взаимосвязей между экономическими явлениями или процессами одна из важнейших задач экономико-статистического метода. Виды связи: функциональная и стохастическая (регрессионная и корреляционная), прямые и обратные, прямолинейные и криволинейные, однофакторные и многофакторные.

1.Дисперсионный анализ.

Дисперсионный анализ является одним из методов изучения влияния одного или нескольких факторных признаков на результативный признак. В зависимости от количества факторов дисперсионный анализ подразделяется на однофакторный и многофакторный. Ниже рассмотрено применение дисперсионного анализа для случая однофакторного комплекса.

В основе дисперсионного анализа лежит расчленение общей вариации изучаемого признака по источникам ее происхождения на два вида вариации:

- систематическую вариацию, обусловленную изменением признака-фактора;

- остаточную (случайную) вариацию, обусловленную действием прочих, случайных, не связанных с данным фактором обстоятельств.

Для разграничения этих вариаций всю совокупность наблюдавшихся единиц разбивают на группы (классы) по факторному признаку и исчисляют средние результативного признака по группам.

Групповые средние: , общая средняя: .

где – индивидуальные значения признака в группе;

– число единиц, входящих в группу;

– общее число наблюдений.

Если сравнение групповых средних показывает определенное различие в их уровне, то необходимо установить, является ли это различие существенным и вызвано ли оно влиянием признака-фактора.

Для ответа на поставленный вопрос определяют два показателя дисперсии:

1) показатель , характеризующий колеблемость групповых средних вокруг общей средней (межгрупповая дисперсия);

2) показатель , отражающий остаточную, внутригрупповую дисперсию.

Внутригрупповая - измеряет вариацию признака внутри группы

,

где - групповая средняя.

Она измеряет вариацию, обусловленную признаком, положенным в основу группировки.

Полученные показатели межгрупповой и внутригрупповой дисперсии сравнивают, получая фактическое дисперсионное отношение:

,

При дисперсионном анализе межгрупповую и внутригрупповую дисперсии определяют путем деления суммы квадратов отклонений на соответствующее число степеней свободы.

Число степеней свободы – это число внутренних и внешних факторов, которые можно изменять без изменения элементов системы.

Для межгрупповой дисперсии число степеней свободы равно числу групповых средних минус единица.

Для внутригрупповой дисперсии число степеней свободы – это разность общего числа наблюдений и числа групповых средних.

По таблице F-распределения Фишерапри определенном уровне значимости (или доверительной вероятности) и числе степеней свободы (и ) определяется табличное дисперсионное отношение ().

Если , то следует считать, что гипотеза о влиянии признака-фактора не опровергается.

Дисперсионный анализ позволяет оценить влияние одного или нескольких факторов на результативный признак. Если сравнение групповых средних в течение длительного времени показывает значительное и существенное различие в их уровне, то оно вызвано влиянием постоянного неучтенного фактора или факторов (это системная вариация). В противном случае это случайная вариация. Если при учете этого фактора сравнение групповых средних в течение продолжительного времени показывает не значительное различие в их уровне, то можно считать подтвержденным, что выявленная величина влияния фактора на результативный признак принадлежит именно ему.

2.Сущность корреляционно-регрессионной модели, условия и этапы ее составления

Корреляционно-регрессионный анализ предполагает измерение тесноты, направления связи и установление аналитического выражения (формы) связи.

Теоретическая обоснованность моделей взаимосвязи, построенных на основе корреляционно-регрессионного анализа, обеспечивается соблюдением следующих основных условий:

1. Все признаки и их совместные распределения должны подчиняться нормальному закону распределения.

2. Дисперсия моделируемого признака должна все время оставаться постоянной при изменении величины и значений факторных признаков.

3. Отдельные наблюдения должны быть независимыми, т.е. результаты, полученные в i-м наблюдении, не должны быть связаны с предыдущими и содержать информацию о последующих наблюдениях, а также влиять на них.

Этапы составления корреляционно-регрессионной модели:

1. Проводится логический анализ сущности изучаемого явления и причинно-следственных связей в результате которого устанавливается результативный показатель и факторы, влияющие на его изменение.

Число факторных признаков должно быть оптимальным. При исключении несущественных факторов модель упрощается, а ее качество не ухудшается. Но построение модели малой размерности приводит к построению модели недостаточно описывающей изучаемое явление. При построении модели число факторных признаков должно быть в 5-6 раз меньше объема изучаемой совокупности.

Парная регрессия характеризует связь между двумя признаками. Аналитическая связь между ними может быть описана в виде моделей, представленных в таблице 23

Таблица 23

Виды моделей парной регрессии

№ п/п Наименование функции Вид функции Система нормальных уравнений для нахождения параметров уравнения
Линейная
Парабола второго порядка  

 

 

Продолжение таблицы 23

Парабола третьего порядка
Показательная
  Гиперболическая

 

Изучение связи между тремя и более признаками называют множественной регрессией. Уравнение линейной множественной регрессии имеет вид:

.

Для нахождения параметров данного уравнения составляют систему:

 

 

2. Сбор первичной информации и проверка ее на однородность и нормальность распределения.

Однородная совокупность – совокупность, у которой коэффициент вариации не превышает 33 %.

Проверка нормальности распределения проводится с помощью правила «трех сигм» (табл. 24).

Таблица 24

Правило «трех сигм»

Интервалы значений признака-фактора Число единиц в интервале Удельный вес, входящих в интервал единиц в общем их числе, % Удельный вес, входящих в интервал единиц при нормальном распределении, %
    68,3
    95,4
    99,7

Сопоставление последних двух колонок позволяет судить о нормальности распределения. Но, даже не смотря на отклонения в этих столбцах, не следует отказываться от применения корреляционного анализа.

3. Исключение из массива первичной информации всех резко выделяющихся (аномальных) единиц по уровню признаков-факторов. На этом шаге исключаются единицы у которых уровень признака-фактора не попадает в интервал .

4. Установление факта наличия корреляционной зависимости между результативным и факторным признаками и определяется ее характер и направление. Для установления наличия корреляционной связи существуют специальные методы, такие как:

– анализ параллельных рядов – сопоставляют две или несколько статистические величины.

– аналитические группировки – все единицы совокупности разбиваются на группы по величине факторного признака и для каждой группы определяется средняя величина результативного показателя, затем строится график эмпирической линии регрессии, по которой можно судить о наличии связи и ее форме;

– графический метод – на графике изображается поле корреляции. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи.