Поиск и исключение аномальных наблюдений.
Практическое задание
по дисциплине Эконометрика
вариант (тема) 15
Выполнил студент очной формы обучения
1 курса магистратуры группы «Экономика»
Проверили:
Аксюк Светлана Андреевна – ассистент кафедры
Писарева Ольга Михайловна – к.э.н. доцент
Москва – 2014г.
Предварительный анализ данных.
Для анализа разброса переменных воспользуемся процедурой «Multiple Variable Analysis».
Рис. 1. Графики разброса показателей с линиями локально взвешенной регрессии до исключения аномальных наблюдений.
Таблица 1. Корреляционная матрица переменных.
Y | X1 | X2 | X3 | X4 | |
Y | 0,9640 | 0,9323 | 0,2757 | 0,6647 | |
(53) | (53) | (53) | (53) | ||
0,0000 | 0,0000 | 0,0457 | 0,0000 | ||
X1 | 0,9640 | 0,9873 | 0,2419 | 0,7638 | |
(53) | (53) | (53) | (53) | ||
0,0000 | 0,0000 | 0,0809 | 0,0000 | ||
X2 | 0,9323 | 0,9873 | 0,2105 | 0,7750 | |
(53) | (53) | (53) | (53) | ||
0,0000 | 0,0000 | 0,1303 | 0,0000 | ||
X3 | 0,2757 | 0,2419 | 0,2105 | -0,2968 | |
(53) | (53) | (53) | (53) | ||
0,0457 | 0,0809 | 0,1303 | 0,0309 | ||
X4 | 0,6647 | 0,7638 | 0,7750 | -0,2968 | |
(53) | (53) | (53) | (53) | ||
0,0000 | 0,0000 | 0,0000 | 0,0309 |
Поиск и исключение аномальных наблюдений.
График «Outlier Plot» показывает, как далеко отстоят наблюдения от среднего значения показателя. Последовательно удаляем точки за границами плюс-минус 4 стандартных отклонения до тех пор, пока параметр P-Value для теста Граббса превысит 0,05 оставшиеся наблюдения с вероятностью 0,95 будут не аномальны.
Рис. 1.Разброс наблюдений для Y (исключённые аномальные
наблюдения отмечены красными крестиками)
После исключения 16 наблюдений по Y статистика теста Граббса 2,8789, а соответствующее значение P-Value=0,0608 > 0,05. Результат сохраним в виде переменной-флага SELECTED_Y.