Факторы, включаемые множественную регрессию, должны отвечать следующим требованиям.

1. Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность (например, в модели урожайности качество почвы задается в виде баллов).

2. Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи. Включение в модель факторов с высокой интеркорреляцией может привести к нежелательным последствиям — система нормальных уравнений может оказаться плохо обусловленной.

Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель.

Количество наблюдений д.б. 5-7 раз больше чем количество факторов.

Мультиколлинеарность

В случаи множественной регрессии , коэффициент корреляции показывает на сколько в среднем изменится результат при изменении соответствующего фактора и неизменных закрепленных на среднем уровне значениях основных факторов.

Для того чтобы можно было определить влияние каждого конкретного фактора на результат исключив всех прочих факторов необходимо чтобы эти факторы были между собой независимы. В том случаи если между факторами существует линейная связь в этом случаи построение уравнения невозможно без исключения какого либо фактора. такая ситуация имеет название полной коллинеарности. Если между факторами существует корреляциооная связь, то имеет место мультиколлинеарность.

Мультиколлинеарность может возникать в силу разных причин. Например, несколько независимых переменных могут иметь общий временной тренд, относительно которого они совершают малые колебания.

Включение в модель мультиколлинеарных факторов нежелательно в силу следующих последствий:

· Затрудняется интерпретация параметров множественной регрессии как характеристик действия факторов в «чистом» виде, ибо факторы коррелированны; параметры линейной регрессии теряют смысл:

· Оценки параметров ненадежны, обнаруживают большие стандартные ошибки и меняются с изменением объема наблюдений (не только по величине, но и по знаку), что делает модель непригодной для анализа и прогнозирования.