Фиктивные переменные во множественной регрессии

До сих пор в качестве факторов рассматривались экономические переменные, принимающие количественные значения в некотором интервале. Вместе с тем может оказаться необходимым включить в модель факторы, которые представляют собой различные атрибутивные признаки. Такими признаками, например, являются профессия, пол, образование, климатические условия и т.п. Чтобы ввести такие переменные в регрессионную модель, им должны быть присвоены те или иные цифровые метки, т.е. качественные переменные преобразовать в количественные. Такого вида сконструированные переменные в эконометрике принято называть фиктивными переменными.

Рассмотрим применение фиктивных переменных для функции спроса. Предположим, что по группе лиц мужского и женского пола изучается линейная зависимость потребления кофе от цены. В общем виде для совокупности обследуемых уравнение регрессии имеет вид:

,

где y – количество потребляемого кофе;

x – цена кофе.

Аналогичные уравнения могут быть найдены отдельно для лиц мужского пола: и женского пола: . Если сила влияния цены на количество потребления кофе одинакова как для мужчин, так и для женщин (), то становится возможным построение общего уравнения регрессии с включением в него фактора «пол» в виде фиктивной переменной. Это уравнение может быть записано в виде:

,

где - фиктивные переменные, принимающие значения:

.

Следует отметить, что применение МНК для оценивания параметров и приводит к вырожденной матрице исходных данных, а следовательно, и к невозможности получения их оценок.

Выходом из создавшегося положения может явиться переход к уравнению

,

т.е. уравнению, включающему только одну фиктивную переменную. Предположим, что МНК были получены оценки параметров этого уравнения, тогда теоретические значения размера потребления кофе для мужчин будут получены из уравнения

.

Для женщин соответствующие значения получим из уравнения

.