Интервальная оценка

Если получена точечная оценка неизвестного параметра по выборке, то говорить о полученной оценке как об истинном параметре довольно рискованно. В некоторых случаях, целесообразнее, получив разброс оценки параметра, говорить об интервальной оценке истинного значения параметра. В качестве иллюстрации сказанного рассмотрим построение доверительного интервала для математического ожидания нормального распределения.

Мы показали, что – наилучшая оценка (абсолютно корректная) для математического ожидания МХ = Q, поэтому является абсолютно корректной оценкой также и для параметра a = нормального распределения

по выборке объема n. Предположим, что задана выборка Х_i, i=. Дисперсия генеральной совокупности известна и равна s². Как далеко может находиться случайная величина от неизвестного математического ожидания Q, оценкой которого она является? Чтобы ответить на этот вопрос, рассмотрим случайную величину , представляющую отклонение от Q. Отклонение D может изменяться от 0 до +¥, но нас интересует, прежде всего, вероятность того, что отклонение D не превысит предельной ошибки e допустимого уровня

. (8)

В формуле (8) только величина является случайной, поэтому вероятность Р зависит только от распределения.

Очевидно, что события A = {–e<Q–<e} и B = {–e+<Q<e+} эквивалентны, так как если произойдет событие А, то произойдет и событие В и наоборот. Поэтому

Р{–e+Q<<e+Q} = Р{–e+<Q<e+}. (9)

Таким образом, если – функция распределения непрерывной, случайной величины , то

Р{–e+Q<<e+Q}=– (10)

Определим функцию распределения случайной величины, где х_i Î N(q,s²). Известно, что линейная функция от нормальных случайных величин является нормальной. Поэтому – нормальная, а нормальная случайная величина задается двумя параметрами – математическим ожиданием и дисперсией, но

Таким образом, плотность распределения имеет вид

Поэтому Р{-e+Q<<e+Q}=.

В полученном интеграле произведем замену переменных u=, получим

Р{-e+Q<<e+Q}=

где Ф(z) – функция распределения нормированной нормальной случайной величины.

Таким образом,

Р{-e+<Q<e+}=. (11)

Если обозначить -e+= Q₁, e+= Q₂, то получим интервал (Q_1,Q₂), который накрывает с вероятностью, равной , неизвестную величину Q и эта вероятность не зависит от Q, т.е., она одна и та же для любых значений Q. Чтобы найти сам интервал, надо по выборке вычислить и задать e.

Можно по заданной вероятности Р найти концы интервала. Для этого надо воспользоваться формулой , где t – значение аргумента функции Лапласа, при котором Ф(t ) = , e = .