Оценка параметров линейной модели множественной регрессии

После импорта исходных данных список переменных будет выглядеть следующим образом.

Для проведения регрессионного анализа выбираем Модель – Метод наименьших квадратов и в открывшемся диалоговом окне устанавливаем опции как указано на Рисунке 1.

Рисунок 1- Диалоговое окно Спецификация модели

После нажатия кнопки ОК получаем следующие результаты (Рисунок 2).

Рисунок 2- Результаты оценки параметров уравнения регрессии по методу наименьших квадратов

Построенная модель оказалась значимой, о чем говорит низкое p-значение для статистики F, равное 0,006. Коэффициент детерминации составил 0,31. Как следует из проверки значимости коэффициентов, значимыми оказался только одна переменная Х5 на уровне значимости 0,05.

Оценим корреляционную матрицу факторных признаков, для чего в основном меню выберем пункт Вид – Корреляционная матрица. В открывшемся диалоговом окне перенесем в список переменных для анализа факторные признаки(Рисунок3).

 

Рисунок 3- Выбор переменных для оценки корреляционной матрицы.

В результате расчетов корреляционная матрица имеет вид (Рисунок 4).

Рисунок 4- Корреляционная матрица факторных признаков

Судя по значению коэффициентов корреляции, многие признаки взаимосвязаны друг с другом (значения коэффициентов корреляции больше 0,6). Далее, для проверки на мультиколлинеарность после построения модели регрессии выбираем в меню окна вывода результатов Тесты – Мультиколлинеарность.

В итоге получим следующие результаты (Рисунок 5).

Рисунок 5 - Результаты проверки на мультиколлинеарность

 

Для проверки модели на мультиколлинеарность в программе Gretl используется метод инфляционных факторов, основанный на расчете множественного коэффициента корреляции. Как видим, значение VIF фактора Х8 близко к 10, что подтверждает данные корреляционного анализа, ведь обе эти переменные сильно взаимосвязаны почти со всеми остальными.

Одним из признаков мультиколлинеарности является высокое значение числа обусловленности. В программе Gretl вычисляется величина, обратная числу обусловленности, в данном случае оно велико.

Для устранения мультиколлинеарности воспользуемся методом пошаговой регресии, основанном на последовательном исключении незначимых факторов из модели.

Выберем в меню окна результатов анализа Тесты – Избыточные переменные и в открывшемся диалоговом окне переносим все переменные в список для анализа, ставим переключатель в положение «Последовательное исключение…» и нажимаем ОК (Рисунок 6).


Рисунок 6 - Результаты метода пошаговой регрессии

 

В итоге в модели остались только 3 фактора: Х2 (количество затраченных ресурсов), Х4 (жилая площадь), на уровне значимости 0,01, Х9 (количество используемого оборудования) на уровне значимости 0,05, коэффициент детерминации составил 0,48. Судя по знакам коэффициентов, наблюдается прямая зависимость между количеством затраченных ресурсов и количество используемого оборудования. Знак коэффициента при факторе «жилая площадь» отрицательный, то есть при прочих равных условиях потребитель выбирает квартиру с меньшей жилой площадью.