Нормирование переменных.
Чтобы устранить влияние разных единиц измерения и облегчить интерпретацию моделей, нормируем значения переменных, разделив их на стандартные отклонения.
Хi_norm=Xi/δx
Наблюдения, признанные аномальными при расчете стандартного отклонения не учитываем.
Пронормируем переменные по следующим формулам:
Y_norm=SELECT(Y;SELECTED)/SD(SELECT(Y;SELECTED))
X1_norm= SELECT(X1;SELECTED)/SD(SELECT(X1;SELECTED))
X2_norm= SELECT(X2;SELECTED)/SD(SELECT(X2;SELECTED))
X3_norm= SELECT(X3;SELECTED)/SD(SELECT(X3;SELECTED))
X4_norm= SELECT(X4;SELECTED)/SD(SELECT(X4;SELECTED))
Результат сохраним в новых столбцах.
Обновим процедуру корреляционного анализа: посчитаем без учета аномальных наблюдений.
Рис. 2.Графики разброса показателей с линиями локально взвешенной регрессии после исключения аномальных наблюдений
Таблица 2. Корреляционная матрица переменных после исключения аномальных наблюдений
Y | X1 | X2 | X3 | X4 | |
Y | 0,3866 | 0,0075 | 0,3966 | -0,2800 | |
(31) | (31) | (31) | (31) | ||
0,0317 | 0,9682 | 0,0272 | 0,1271 | ||
X1 | 0,3866 | 0,5004 | 0,3563 | 0,4495 | |
(31) | (31) | (31) | (31) | ||
0,0317 | 0,0041 | 0,0492 | 0,0112 | ||
X2 | 0,0075 | 0,5004 | 0,2838 | 0,0377 | |
(31) | (31) | (31) | (31) | ||
0,9682 | 0,0041 | 0,1219 | 0,8405 | ||
X3 | 0,3966 | 0,3563 | 0,2838 | 0,0117 | |
(31) | (31) | (31) | (31) | ||
0,0272 | 0,0492 | 0,1219 | 0,9502 | ||
X4 | -0,2800 | 0,4495 | 0,0377 | 0,0117 | |
(31) | (31) | (31) | (31) | ||
0,1271 | 0,0112 | 0,8405 | 0,9502 |