Анализ вариации зависимой переменной

в регрессии. Коэффициенты R² и скорректированный R²_adj

Как и в случае регрессионной модели с одной независимой переменной, вариацию можно разбить на две части: объясненную регрессионным уравнением и не объясненную (связанную с ошибками e):

(65)

или в векторной форме –

(66)

Третье слагаемое в выражении (66) равно нулю в случае, если константа, т.е. вектор S=(1, … ,1), принадлежит линейной оболочке векторов X₁, … ,X_k (т.е. ), что следует из уравнения (47) e`x = 0. Поэтому верно равенство

67)

Записывая формулу (67) в отклонениях , снова получим теорему Пифагора

. (68)

Определим коэффициент детерминации R² как

. (69)

Отметим, что коэффициент R²корректно определен только в том случае, если константа, т.е. вектор S = (1,…..,1)′, принадлежит линейной оболочке векторов X₁, …, X_k . В этом случае R² принимает значения из интервала [0,1].

Коэффициент R² показывает качество подгонки регрессионной модели к наблюдаемым значениям Y_t. Если R²=0 , то регрессия Y на X₁, … X_k не улучшает качества предсказания Y_t по сравнению с тривиальным предсказанием.

Другой крайний случай R² = 1 означает точную подгонку: все e_t=0, т.е. все точки наблюдений лежат на регрессионной плоскости.

В какой степени допустимо использовать критерий R² для выбора между несколькими регрессионными уравнениями? Следующие два замечания побуждают не полагаться только на значение R² .

1. Оптимизация при определении коэффициентов регрессии осуществляется по критерию минимизации суммы квадратов остатков, т.е. по критерию, отличающемуся от критерия R².

2. Величина R² возрастает при добавлении еще одного регрессора. Если принять число регрессоров равным числу наблюдений, всегда можно добиться того, что R²=1, но это вовсе не говорит о наличии содержательной зависимости Y от регрессора.

Попыткой устранить эффект, связанный с ростом R² при возрастании числа регрессоров, является коррекция R² на число регрессоров. Скорректированным коэффициентомR²_adj называется

. (70)

Наличие именно такой коррекции определения (69) оправданно, ибо числитель дроби в формуле (70) есть несмещенная оценка дисперсии ошибок уравнения (61), а знаменатель – несмещенная оценка дисперсии Y.

Свойства скорректированного коэффициента R² :

1. R²_adj = 1 – R² (n-1)/ (n-k);

2. R² ³ R²_adj , k > 1;

3. R²_adj £ 1, но может принимать значения < 0.

В определенной степени использование скорректированного коэффициента детерминации R²_adj более корректно для сравнения регрессий при изменении количества регрессоров.

П р и м е р. Рассмотрим две модели:

1. Y = Xb + e,

2. Z = Y – X₁ = Xγ + e.

Строятся МНК-оценки параметров b и g обеих моделей. Для первой модели коэффициент детерминации

. (71)

Подсчитаем коэффициент детерминации R² для второй модели. Обозначим d = (1,0,…..,0)` – вектор-столбец; тогда Xd = X₁.

Матрица M одна и та же для обеих моделей, так как в них один и тот же набор регрессоров. Остатки во второй модели равны

(мы использовали формулу (56)). Таким образом, остатки в обеих моделях совпадают:

. (72)

Выражения (71) и (72) отличаются только знаменателями y`y и z`z:

. (73)

Из уравнения (73) видно, что коэффициенты детерминации, вообще говоря, не совпадают. Оценки коэффициентов двух регрессий связаны естественным соотношением

т.е. фактически обоим уравнениям соответствуют одна и та же геометрическая картинка и экономически содержательная ситуация. Однако коэффициенты R² не совпадают только потому, что зависимость сформулирована в разных координатах.

26. Что «лучше»: Y или ?

В качестве значений зависимой переменной в момент t мы можем использовать Y_t или, например, прогноз . Матрица ковариаций вектора Y по условию модели равна V(Y) = s²I_n.

Матрица ковариаций вектора прогноза

Таким образом,

Матрица M идемпотентна, поэтому, имея собственные значения только 0 или 1 , неотрицательно определена, т.е.

(74)

Из формулы (74) следует аналогичное неравенство для дисперсии наблюдаемых и предсказанных значений

(75)

Таким образом, как это ни парадоксально, в качестве значения зависимой переменной зачастую лучше брать предсказанное по модели значение, а не фактически наблюдаемое. (Разумеется, это относится только к моделям, достаточно хорошо описывающим действительность, в то время как неравенство (75) справедливо для всех моделей.)