Измерение связи неколичественных признаков. Фиктивные переменные.

Корреляционно-регрессивные модели и их применение в анализе и прогнозе социально-жизненных явлений.

Корреляционно-регрессивной моделью системы взаимосвязанных признаков является такое уравнение регрессии, которое включает основные факторы влияющие на вариацию результативного признака, обладает высоким коэффициентом детерминации (не ниже, чем 50%) и коэффициентом регрессии, интерпретированным в соответствии с теоретическим знанием о природе связей в изучаемой системе.

 

Рекомендации для построения корреляционно-регрессивной модели:

1. признаки – факторы находятся в причинной связи с результативными признаками.

Поэтому недопустимо, к примеру, себестоимости (у) вводить в качестве одного из факторов коэффициента рентабельности.

2. признаки–факторы не должны быть составными частями результативного признака или его функциями.

3. признаки-факторы не должны дублировать друг друга, т.е. быть коллинеарны

4. не следует включать в модель факторы разного уровня иерархии, т.е. факторы ближнего порядка и его субфакторы. Например в модель себестоимости зерна не стоит включать его урожайность, дозу внесения удобрений, показатели качества семян, плодородие почвы, т.е. субфакторы самой урожайности

5. желательно, чтобы между результативными признаками и факторами наблюдалось единство совокупности, к которой они отнесены.

6. математическая формула регрессии должна соответствовать ломке связей между факторами в реальной ситуации.

Корреляционно-регрессивный анализ применим только к количественным признакам. Однако на практике достаточно часто возникает необходимость исследования влияния качественных признаков, имеющих 2 или более уровней градации.

К числу таких признаков можно отнести:

- пол (м., ж.)

- образование

- фактор сезонности

- форма собственности предприятия

- отрасль и т.д.

Качественные признаки могут оказать существенное влияние на структуру линейных связей между переменными и приводить к скачкообразному изменению параметров регрессивной модели. В этом случае говорят об исследовании регрессивной модели с переменной структурой или построении регрессивной модели по неоднородным данным.

Например, необходимо изучить зависимость размеров заработной платы (у), не только от количественных факторов: х1 – производительности труда; х2 – количества рабочих дней, но и от качественного признака Z – пол работника.

Можно получить оценки для каждого уровня качественных признаков, т.е. построить уравнение регрессии.

Отдельно для работников - мужчин и отдельно для работников – женщин, а затем изучить различия между ними.

Но есть и другой подход, позволяющий изучить влияние значений количественных переменных и качественных признаков с помощью одного уровня регрессии. Этот подход основан на введении так называемых фиктивных переменных (структурных, манекенных). В качестве фиктивных переменных используются дихотолические переменные, которые принимают всего 2 значения: 0 или 1. В этом случае первоначальная модель заработной платы изменится и примет следующий вид.

Где Z1 = 0, если работник женского пола,

Z1 = 1, если работник мужского пола.

Таким образом по данной модели мы можем сделать вывод, что средняя заработная плата у мужчин больше на величину C1 Z1 = C1 q 1, т.е. С1.

Следует отметить, что в принципе качественные различия можно формализировать с помощью любой переменной, принимающей 2 разных значения (т.е. необязательно 0 или 1).

Однако в эконометрике почти всегда используются переменные типа 0 или 1, т.к. при этом интерпретация полученных результатов выглядит предельно просто.