Отбор факторов при построении множественной регрессии

Включение в уравнение множественной регрессии того или иного набора факторов связано прежде всего с представлением исследователя о природе взаимосвязи моделируемого показателя с другими экономическими явлениями. Факторы, включаемые во множественную регрессию, должны отвечать следующим требова­ниям.

1. Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий ко­личественного измерения, то ему нужно придать количествен­ную определенность

2. Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи.

Включение в модель факторов с высокой интеркорреляцией, когда Ryx1 < Rx1x2 для зависимости может привести к нежелательным последствиям — система нормальных уравнений может оказаться плохо обусловленной и повлечь за собой неустойчивость и ненадежность оценок коэффициентов регрессии.

Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются неинтерпретируемыми.

Включаемые во множественную регрессию факторы должны объяснить вариацию независимой переменной. Если строится модель с набором р факторов, то для нее рассчитывается показа­тель детерминации R, который фиксирует долю объясненной ва­риации результативного признака за счет рассматриваемых в регрессии р факторов. Влияние других не учтенных в модели факторов оценивается как 1 — R2 с соответствующей остаточной дисперсией S2.

При дополнительном включении в регрессию р + 1 фактора коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться:

и

Если же этого не происходит и данные показатели практически мало отличаются друг от друга, то включаемый в анализ фактор хр+1 не улучшает модель и практически является лишним фактором.

Насыщение модели лишними факторами не только не снижает величину остаточной дисперсии и не увеличивает показатель детерминации, но и приводит к статистической незначимости параметров регрессии по t-критерию Стьюдента.

Если рассматривается регрессия , то для расчета параметров, применяя МНК, предполагается ра­венство

где - общая сумма квадратов отклонений ;

- факторная (объясненная) сумма квадратов отклонений