Поиск и исключение аномальных наблюдений.

Практическое задание

 

по дисциплине Эконометрика

 

вариант (тема) 15

 

Выполнил студент очной формы обучения

1 курса магистратуры группы «Экономика»

 

 

Проверили:

Аксюк Светлана Андреевна – ассистент кафедры

Писарева Ольга Михайловна – к.э.н. доцент

 

Москва – 2014г.


Предварительный анализ данных.

 

Для анализа разброса переменных воспользуемся процедурой «Multiple Variable Analysis».

 

Рис. 1. Графики разброса показателей с линиями локально взвешенной регрессии до исключения аномальных наблюдений.

 

Таблица 1. Корреляционная матрица переменных.

  Y X1 X2 X3 X4
Y   0,9640 0,9323 0,2757 0,6647
    (53) (53) (53) (53)
    0,0000 0,0000 0,0457 0,0000
X1 0,9640   0,9873 0,2419 0,7638
  (53)   (53) (53) (53)
  0,0000   0,0000 0,0809 0,0000
X2 0,9323 0,9873   0,2105 0,7750
  (53) (53)   (53) (53)
  0,0000 0,0000   0,1303 0,0000
X3 0,2757 0,2419 0,2105   -0,2968
  (53) (53) (53)   (53)
  0,0457 0,0809 0,1303   0,0309
X4 0,6647 0,7638 0,7750 -0,2968  
  (53) (53) (53) (53)  
  0,0000 0,0000 0,0000 0,0309  

Поиск и исключение аномальных наблюдений.

 

График «Outlier Plot» показывает, как далеко отстоят наблюдения от среднего значения показателя. Последовательно удаляем точки за границами плюс-минус 4 стандартных отклонения до тех пор, пока параметр P-Value для теста Граббса превысит 0,05 оставшиеся наблюдения с вероятностью 0,95 будут не аномальны.

Рис. 1.Разброс наблюдений для Y (исключённые аномальные
наблюдения отмечены красными крестиками)

 

После исключения 16 наблюдений по Y статистика теста Граббса 2,8789, а соответствующее значение P-Value=0,0608 > 0,05. Результат сохраним в виде переменной-флага SELECTED_Y.