Пример выявления аномальных значений
Таблица 2.6
Номер пробы n | Значения х | Квантиль t | Номер пробы n | Значения х | Квантиль t |
0,06 | -2,07 | 0,49 | 0,05 | ||
0,15 | -1,57 | 0,50 | 0,15 | ||
0,21 | -1,30 | 0,52 | 0,24 | ||
0,25 | -1,10 | 0,53 | 0,34 | ||
0,28 | -0,94 | 0,57 | 0,45 | ||
0,29 | -0,80 | 0,60 | 0,56 | ||
0,32 | -0,67 | 0,64 | 0,67 | ||
0,35 | -0,56 | 0,67 | 0,80 | ||
0,38 | -0,45 | 0,73 | 0,94 | ||
0,39 | -0,34 | 0,75 | 1,10 | ||
0,42 | -0,24 | 0,80 | |||
0,45 | -0,15 | 1,14 | 1,57 | ||
0,47 | -0,05 | 1,19 | 2,07 |
Вначале найдем среднее и дисперсию из всех 26 значений: = 0,502; s2 = 0,06478; s = 0,2545. Далее вычислим среднее и дисперсию из 24 значений, исключив максимальные значения.
Получим смещенные оценки = 0,451; = 0,03577; s = 0,1891. Вычислим нормированные значения исключенных значений: t25 = (1,14 – 0,451)/0,1891 = 3,64; t26 = (1,19 – 0,451)/0,1891 = 3,91. Поскольку нормированные значения t25 > 3 и t26 > 3, по правилу «трех сигм» оба исключенных значения являются аномальными.
Однако полученный вывод является некорректным, так как он построен на смещенных оценках.
Оценим размер смещения, обусловленный исключением двух максимальных значений. Имеем p = 1 – n/N = 0,923. Вероятности p соответствует квантиль
t = F–1(p) = 1,426. По формуле найдем f(t) = 0,1443, по формуле (2.25) определим нормированное смещение у = 26/24×0,1443 = 0,1563.
Из формулы (2.24) следует (1 – ty –y2) = 0,03577/(1 – 1,426×0,1563 – 0,15632) = 0,04752; s = 0,218.
Из формулы (2.23) получаем = хсмещ + sу = 0,451 + 0,218×0,1563 = 0,485. Полученные оценки приведены в табл.2.7.
Таблица 2.7