Пример обнаружения гетероскедастичности в Gretl
Шаг 1. Выберем команду меню File\Open Data\Sample File…и на закладке Verbeek двойным щелчком мыши откроем встроенный разработчиками набор данных bwages.gdt (рисунок 3).
Рисунок 3 – Открытие встроенного набора данных bwages.gdt
Шаг 2.Просмотрим текстовую информацию о наборе данных, выбрав команду Data\Print Description.В открывшемся окне (рисунок 4) появится информация о наборе данных bwages.gdt в целом и о каждой переменной.
Файл содержит 1472 наблюдения, относящихся к 1994, группе бельгийских семей Европейского Сообщества. Тип данных undated (срез данных для фиксированного момента времени – cross-sectional ). Переменные:
wage – заработная плата в час, до выплаты налогов (Евро),
educ – уровень образования от 1 (низкий) до 5 (высокий),
exper – опыт работы (лет)
male – фиктивная переменная, принимает значение «1», если мужчина и «0», если женщина. Также представлены логарифмы переменных wage, educ, exper.
Требуется оценить влияние уровня образования (educ) в бельгийских семьях на величину заработной платы (wage), используя фактические данные 1994 года по 1472 семьям.
Рисунок 4 – Текстовое описание набора данных bwages.gdt
Шаг 3.Проведём предварительный графический анализ данных, построив диаграммы рассеяния пар переменных educ -wage, exper-wage, male –wage.
Выберем команду меню View\Multiple graphs Vars\ X-Y scatters…(рисунок 5). В открывшемся окне выберем переменную wage (по оси ОУ), а переменные educ, exper, male (по оси ОХ) нажатием кнопок «Choose» и «Add» соответственно.
Как показывает рисунок 6, дисперсия wage (которую будем рассматривать как зависимую переменную Y) увеличивается при росте каждого из факторов educ, exper, male(которые будем рассматривать как независимые переменные, Хi), что свидетельствует о гетероскедастичности.
Рисунок 5 – Построение диаграмм рассеяния educ-wage, exper-wage, male-wage
Рисунок 6 – Диаграммы рассеяния пар переменных educ -wage, exper-wage, male –wage
Шаг 4.Проведём оценивание модели обычным методом наименьших квадратов 1МНК (OLS).Для этого выберем команду менюModel\Ordinary Least Squares…и в открывшемся окне спецификации модели выберем зависимую переменную wage при помощи кнопки «Choose» и независимую переменную educ при помощи кнопки «Add». После нажатия кнопки ОК появится окно с результатами моделирования (рисунок 7).
Рисунок 7 – Построение модели методом 1МНК (OLS)
По результатам 1МНК в полученной модели параметры являются значимыми при уровнях значимости 5% и 1%, поскольку P-VALUE=0,001%<1%< 5% (принимаем альтернативную гипотезу Н1: ).
Хотя по данным 1МНК можно установить существенность влияния переменной educ (образование) на переменную wage (з.пл.), необходимо сделать поправку на гетероскедастичность в связи с ошибочностью расчёта величин COEFFICIENT, STDERROR и T-STAT и ненадёжностью результатов данного оценивания -возможностью принятия неправильной гипотезы.
Сохраним величины квадратов остатковв отдельную переменную usq1набора данных, обратившись к командеSave\Squared Residualsменю окна результатов моделирования (рисунок 7) и нажав кнопку ОК.
Шаг 5.Подтвердим наличие гетероскедастичности, используя формальный тест Уайта. Обратимся к командеTests\Heteroskedasticityменю окна результатов моделирования (рисунок 8).
Рисунок 8 – Проведение теста Уайта на гетероскедастичность
В результате теста получим вспомогательную модель регрессии остатков относительно переменной educ и её квадрата (рисунок 9).
Рисунок 9 – Окно результатов теста Уайта на гетероскедастичность
Проверим общую значимость (адекватность в целом) данной модели, используя критерий .
В окне результатов теста (рисунок 9) значение p-value для статистики теста n*R2 (TR^2) составило 0,000%, что меньше уровней значимости 1% и 5% и свидетельствует о наличии гетероскедастичности (адекватности вспомогательной модели, неравенстве нулю всех её параметров).
Т.о. отвергаем гипотезу Ho о гомоскедастичности (равенстве нулю всех её параметров), поскольку расчётное значение статистики n*R2 =TR^2=56,429 больше критического ( ).
Найдём критическое для уровня значимости 1% , обратившись к команде основного меню Tools\Statistical Tablesи введя в открывшемся окне на закладке Chi-Square число степеней свободы (2, равное числу регрессоров вспомогательной модели) и уровень значимости 0.001 (рисунок 10). Получим =13,8155 (Critical value).
Рисунок 10 – Нахождение критического значения для df=2, p=1%
Построим график данного распределения, выбрав команду основного меню Tools\Distribution Graphs, закладку Chi-square и df=2 в открывшемся окне (рисунок 11).
Рисунок 11 - График распределения, df=2