Интервальная оценка
Если получена точечная оценка неизвестного параметра по выборке, то говорить о полученной оценке как об истинном параметре довольно рискованно. В некоторых случаях, целесообразнее, получив разброс оценки параметра, говорить об интервальной оценке истинного значения параметра. В качестве иллюстрации сказанного рассмотрим построение доверительного интервала для математического ожидания нормального распределения.
Мы показали, что – наилучшая оценка (абсолютно корректная) для математического ожидания МХ = Q, поэтому является абсолютно корректной оценкой также и для параметра a = нормального распределения
по выборке объема n. Предположим, что задана выборка Хi, i=. Дисперсия генеральной совокупности известна и равна s2. Как далеко может находиться случайная величина от неизвестного математического ожидания Q, оценкой которого она является? Чтобы ответить на этот вопрос, рассмотрим случайную величину , представляющую отклонение от Q. Отклонение D может изменяться от 0 до +¥, но нас интересует, прежде всего, вероятность того, что отклонение D не превысит предельной ошибки e допустимого уровня
. (8)
В формуле (8) только величина является случайной, поэтому вероятность Р зависит только от распределения.
Очевидно, что события A = {–e<Q–<e} и B = {–e+<Q<e+} эквивалентны, так как если произойдет событие А, то произойдет и событие В и наоборот. Поэтому
Р{–e+Q<<e+Q} = Р{–e+<Q<e+}. (9)
Таким образом, если – функция распределения непрерывной, случайной величины , то
Р{–e+Q<<e+Q}=– (10)
Определим функцию распределения случайной величины, где хi Î N(q,s2). Известно, что линейная функция от нормальных случайных величин является нормальной. Поэтому – нормальная, а нормальная случайная величина задается двумя параметрами – математическим ожиданием и дисперсией, но
.
Таким образом, плотность распределения имеет вид
.
Поэтому Р{-e+Q<<e+Q}=.
В полученном интеграле произведем замену переменных u=, получим
Р{-e+Q<<e+Q}=
где Ф(z) – функция распределения нормированной нормальной случайной величины.
Таким образом,
Р{-e+<Q<e+}=. (11)
Если обозначить -e+= Q1, e+= Q2, то получим интервал (Q1, Q2), который накрывает с вероятностью, равной , неизвестную величину Q и эта вероятность не зависит от Q, т.е., она одна и та же для любых значений Q. Чтобы найти сам интервал, надо по выборке вычислить и задать e.
Можно по заданной вероятности Р найти концы интервала. Для этого надо воспользоваться формулой , где t – значение аргумента функции Лапласа, при котором Ф(t ) = , e = .