Фиктивные переменные и особенности их использования в моделях

Термин “фиктивные переменные” используется как противоположность “значащим” переменным, показывающим уровень количественного показателя, принимающего значения из непрерывного интервала. Как правило, фиктивная переменная — это индикаторная переменная, отражающая качественную характеристику.

В регрессионных моделях с временными рядами используется три основных вида фиктивных переменных:

 

1) Переменные-индикаторы принадлежности наблюдения к определенному периоду — для моделирования скачкообразных структурных сдвигов.

2) Сезонные переменные — для моделирования сезонности.

3) Линейный временной тренд — для моделирования постепенных плавных структурных сдвигов.

Использование фиктивных переменных имеет следующие преимущества:

 

  1. Интервалы между наблюдениями не обязательно должны быть одинаковыми. В выборке могут быть пропущенные наблюдения.
  2. Коэффициенты при фиктивных переменных легко интерпретировать, они наглядно представляют структуру динамического процесса.
  3. Для оценивания модели не приходится выходить за рамки классического метода наименьших квадратов.

В “фиктивной” форме может быть выражена и зависимая переменная. Такая ситуация имеет место, например, при проведении социологических опросов, когда их результат может быть представлен двумя ответами “да”, “нет” (1 или 0) (предполагаемая покупка автомобиля, дачи; желание иметь ребенка в семье и т. п.), а влияющие на этот результат факторы выражаются в произвольной форме (количественные характеристики – уровень дохода, жилая площадь и т. п., качественные характеристики – уровень образования и т. д.).
С формальной точки зрения фиктивные переменные ничем не отличаются от других факторов. Наиболее сложный вопрос, возникающий при их использовании, – это правильная интерпретация получаемых оценок.
Как правило, независимые переменные в регрессионных моделях имеют «непрерывные» области изменения (национальный доход, уровень безработицы, размер зарплаты и т.п.). Однако теория не накладывает никаких ограничений на характер факторов, в частности, некоторые переменные могут принимать всего два значения или, в более общей ситуации, дискретное множество значений. Необходимость рассматривать такие переменные возникает довольно часто в тех случаях, когда требуется принимать во внимание какой-либо качественный признак.
Таким образом,

· Для исследования влияния качественных признаков в модель можно вводить бинарные (фиктивные) переменные, которые, как правило, принимают значение 1, если данный качественный признак присутствует в наблюдении, и значение 0 при его отсутствии;

· Способ включения фиктивных переменных зависит от априорной информации относительно влияния соответствующих качественных признаков на зависимую переменную и от гипотез, которые проверяются с помощью модели;

· От способа включения фиктивной переменной зависит и интерпретация оценки коэффициента при ней.

32. Применение фиктивных переменных при моделировании сезонных

колебаний.

Термин “фиктивные переменные” используется как противоположность “значащим” переменным, показывающим уровень количественного показателя, принимающего значения из непрерывного интервала. Как правило, фиктивная переменная — это индикаторная переменная, отражающая качественную характеристику. Чаще всего применяются бинарные фиктивные переменные, принимающие два значения, 0 и 1, в зависимости от определенного условия. Например, в результате опроса группы людей 0 может означать, что опрашиваемый - мужчина, а 1 - женщина. Могут быть разного рода атрибутивные признаки, такие, например, как профессия, пол, образование, климатические условия, принадлежность к определенному региону.

Регрессионная модель, включающая в качестве фактора (факторов) фиктивную переменную, называется регрессионной моделью с переменной структурой.

Рассмотрим временной ряд Xi j,

где i — это номер сезона (периода времени внутри года, напри мер, месяца или квартала);

(L — число сезонов в году);

j — номер года, j = (m — общее количество лет).

Количество уровней исходного ряда равно L × m = n. Число сезонных фиктивных переменных в регрессионной модели всегда должно быть на единицу меньше сезонов внутри года, т. е. должно быть равно величине L − 1. При моделировании годовых данных регрессионная модель, помимо фактора времени, должна содержать одиннадцать фиктивных компонент (12 − 1).

Каждому из сезонов соответствует определенное сочетание фиктивных переменных. Сезон, для которого значения всех фиктивных переменных равны нулю, принимается за базу сравнения. Для остальных сезонов одна из фиктивных переменных принимает значение, равное единице. Если имеются поквартальные данные, то значения фиктивных переменных D1, D2, D3 будут принимать следующие значения для каждого из кварталов

 

Квартал

D2

D3

D4

1 0 0 0

2 1 0 0

3 0 1 0

4 0 0 1

 

Общий вид регрессионной модели с переменной структурой в данном случае будет иметь вид:

yt =β0 +β1 ×t+δ2 ×D2 +δ3 ×D3 +δ4 ×D4 +εt

Построенная модель регрессии является разновидностью аддитивной модели временного ряда. Базисным уравнением исследуемой регрессионной зависимости будет являться уравнение тренда для первого квартала:

y =β +β ×t+ε

Тогда общий вид модели регрессии с переменной структурой будет иметь вид:

yt=β0+ β1*t+δ2*D2+δ3*D3+δ4*D4+εt.

Данная модель регрессии представляет собой одну из разновидностей аддитивной модели временного ряда.

На основе общей модели регрессии с переменной структурой можно составить базисную модель или модель тренда для первого квартала:

yt=β0+ β1*t+εt.

Также на основе общей модели регрессии с переменной структурой можно составить частные модели регрессии:

1) частная модель регрессии для второго квартала:

yt=β0+ β1*t+δ2+εt;

2) частная модель регрессии для третьего квартала:

yt=β0+ β1*t+δ3+εt;

3) частная модель регрессии для четвёртого квартала:

yt=β0+ β1*t+δ4+εt.

Данные частные модели регрессии отличаются друг от друга только на величину свободного члена δi.

Коэффициент β1 характеризует среднее абсолютное изменение уровней временного ряда под влиянием основной тенденции.

Сезонная компонента для каждого сезона рассчитывается как разность между средним значением свободных членов всех частных моделей регрессий и значением постоянного члена одной из моделей.

Среднее значение свободных членов всех частных моделей регрессий рассчитывается по формуле:

 

Для поквартальных данных оценка сезонных отклонений осуществляется по формулам:

1) оценка сезонного отклонения для первого квартала:

 

2) оценка сезонного отклонения для второго квартала:

 

3) оценка сезонного отклонения для третьего квартала:

 

4) оценка сезонного отклонения для четвёртого квартала:

 

Сумма сезонных отклонений должна равняться нулю.

33. Фиктивные переменные сдвига и наклона. Особенности их

использования в моделях.

За качественными переменными скрывается целый комплекс факторов: изменение длины светового дня, среднемесячной температуры воздуха, изменение климатических условий и т.п. При анализе расходов на продукты питания необходимо иметь в виду различия в образе жизни

городского и сельского населения.

На практике приходится учитывать в моделях факторы, носящие качественный характер, значения которых в наблюдениях не возможно измерить с помощью числовой шкалы.

Примеры.

Моделирование влияния пола специалистов на уровень зарплаты.

Моделирование доходов граждан от типа учебного заведения, в котором он получил образование (государственное, частное, специализированное,…)

Модель инфляции с учетом различных видов регулирования со стороны государства

Возможны два подхода к решению задачи:

- построить несколько моделей отдельно для каждого значения (градации) качественной переменной

- учесть влияние качественного фактора в одной модели

Второй способ представляется более прогрессивным, т.к в этом случае появляется возможность оценить статистическую значимость влияния данного фактора на поведение эндогенной переменной на фоне других факторов, внесенных в спецификацию модели

Для учета влияния качественных факторов привлекают переменные, которые получили название фиктивных.

Фиктивные переменные бывают двух типов - сдвига и наклона.

Переход фиктивной переменной с одной градации на другую вызывает скачкообразное изменение эндогенной переменной. Фиктивные переменные, которые приводят лишь к скачкообразному изменению эндогенной переменной, называются фиктивными переменными сдвига.

Фиктивная переменная сдвига - это переменная, которая меняет точку пересечения линии регрессии с осью ординат в случае применения качественной переменной.

Однако на практике переход фиктивной переменной с одной градации на другую часто приводит к изменению зависимости эндогенной переменной от количественных переменных. Использование фиктивных переменных в регрессионных моделях позволяет учесть возможность такого поведения эндогенной переменной. Пусть эндогенная переменная y зависит от количественной переменной x и фиктивной переменной r. При этом есть основания предполагать, что зависимость эндогенной переменной от количественного регрессора зависит от уровня фиктивной переменной.

Введение дополнительного слагаемого в спецификацию модели позволяет учесть возможность одновременного сдвига (изменение свободного коэффициента) и наклона (коэффициента при количественном регрессоре) прямой зависимости переменной y от x.

Фиктивная переменная наклона - это та переменная, которая изменяет наклон линии регрессии в случае использования качественной переменной. Оба типа фиктивных переменных будут иметь значение или , когда наблюдения данных совпадают с уместной количественной переменной, но будут иметь нулевое значение при совпадении с наблюдениями, где эта качественная переменная отсутствует.

34. Типичные проблемы, возникающие при оценке параметров моделей

в виде системы одновременных уравнений.

Модели могут быть представлены как в виде одного изолированного уравнения, так и в виде системы одновременных уравнений. С помощью таких моделей удается обеспечить системный подход к описанию поведения сложных экономических объектов.

Метод наименьших квадратов при выполнении условий (предпосылок) теоремы Гаусса-Маркова позволяет вычислить несмещенные и эффективные оценки параметров модели в виде изолированного уравнения множественной линейной регрессии. Мы убедились в эффективности МНК при построении как линейных, так и целого ряда нелинейных моделей.

При идентификации (расчете оценок параметров) моделей в виде систем одновременных уравнений неизбежно сталкиваются с двумя проблемами: проблемой идентификации и проблемой авторегрессии в структурной форме моделей.

Проблема идентификации заключается в том, что (здесь возникает проблема с нормальным определением, а в лекции дан огромный пример вместо него)

Чтобы сделать идентифицированным уравнение модели, необходимо ввести дополнительную предопределенную переменную в уравнение смежное с неидентифицируемым. В качестве таких переменных часто используются лаговые эндогенные переменные.

Вторая характерная проблема - это проблема авторегрессионности поведенческих уравнений модели.

Эта проблема тесно связана с четвертой предпосылкой теоремы Гаусса-Маркова: отсутствие связи между регрессорами уравнения и случайными возмущениями.

Получение состоятельных оценок параметров уравнения с помощью МНК удается за счет значительного увеличения объема выборки только в случае:

Cov(ui, uj) ≠0 при i≠j, но Cov(ui, uj) =0 при i=j

В случае, когда

Cov(ui, uj) =0 при i=j

получение состоятельных оценок с помощью МНК не возможно.

Именно эта ситуация оказывается типичной для структурных поведенческих уравнений модели.