Фиктивные переменные во множественной регрессии
До сих пор в качестве факторов рассматривались экономические переменные, принимающие количественные значения в некотором интервале. Вместе с тем может оказаться необходимым включить в модель факторы, которые представляют собой различные атрибутивные признаки. Такими признаками, например, являются профессия, пол, образование, климатические условия и т.п. Чтобы ввести такие переменные в регрессионную модель, им должны быть присвоены те или иные цифровые метки, т.е. качественные переменные преобразовать в количественные. Такого вида сконструированные переменные в эконометрике принято называть фиктивными переменными.
Рассмотрим применение фиктивных переменных для функции спроса. Предположим, что по группе лиц мужского и женского пола изучается линейная зависимость потребления кофе от цены. В общем виде для совокупности обследуемых уравнение регрессии имеет вид:
,
где y – количество потребляемого кофе;
x – цена кофе.
Аналогичные уравнения могут быть найдены отдельно для лиц мужского пола: и женского пола: . Если сила влияния цены на количество потребления кофе одинакова как для мужчин, так и для женщин (), то становится возможным построение общего уравнения регрессии с включением в него фактора «пол» в виде фиктивной переменной. Это уравнение может быть записано в виде:
,
где - фиктивные переменные, принимающие значения:
.
Следует отметить, что применение МНК для оценивания параметров и приводит к вырожденной матрице исходных данных, а следовательно, и к невозможности получения их оценок.
Выходом из создавшегося положения может явиться переход к уравнению
,
т.е. уравнению, включающему только одну фиктивную переменную. Предположим, что МНК были получены оценки параметров этого уравнения, тогда теоретические значения размера потребления кофе для мужчин будут получены из уравнения
.
Для женщин соответствующие значения получим из уравнения
.