XXI. п.5. Интервальные оценки
Точечные оценки параметров генеральной совокупности могут быть приняты в качестве ориентировочных, первоначальных результатов обработки выборочных данных. Их недостаток заключается в том, что неизвестно, с какой точностью оценивается параметр. Если для выборок большого объема точность обычно бывает достаточной, то для выборок небольшого объема вопрос точности оценок становится очень важным.
Чтобы получить представление о точности и надежности оценки параметра , используют интервальную оценку параметра.
Интервальной оценкой параметра называется числовой интервал , который с заданной вероятностью накрывает неизвестное значение параметра , т.е. . Такой интервал называется доверительным, а вероятность – доверительной вероятностью или надежностью оценки.
Обычно надежность оценки задается заранее величиной, близкой к единице, например: 0,9, 0,95, 0,99 или 0,999.
Границы доверительного интервала и его длина находятся по выборочным данным и поэтому являются случайными величинами. Длина доверительного интервала уменьшается с ростом объема выборки и увеличивается с ростом доверительной вероятности .
Очень часто (но не всегда) доверительный интервал выбирается симметричным относительно несмещенной точечной оценки , т.е. выбирается интервал вида . Число при этом называется точностью оценки.
Так, например, интервальная оценка (доверительный интервал) для генеральной средней исследуемого признака , имеющего нормальное распределение, может быть найдена по формуле:
. (19)
В случае, когда генеральная дисперсия известна (например, это заранее заданная ошибка измерительного прибора), то точность оценки находится по формуле:
, (20)
где – объем выборки, а число определяется из равенства , т.е. по таблице значений функции Лапласа находится значение аргумента , которому соответствует значение функции , равное .
В случае, когда генеральная дисперсия неизвестна, а известна лишь ее оценка – исправленная выборочная дисперсия , то точность оценки находится по формуле:
, (21)
где значение числа определяется по таблице критических точек распределения Стьюдента при доверительной вероятности и числе степеней свободы .
Замечание. Если выборка объема представляет собой набор независимых одинаково распределенных случайных величин, то, согласно центральной предельной теореме, распределение при больших близко к стандартному нормальному. Это позволяет строить доверительный интервал для генеральной средней по формулам (19) и (20) при любом распределении признака, если объем выборки является достаточно большим ( ), при этом в качестве используется ее любая оценка.
Задача 6. По выборке из генеральной совокупности нормально распределенного количественного признака X найти: 1) числовые характеристики выборки – выборочную среднюю, выборочную дисперсию, среднее квадратическое отклонение; 2) несмещенные оценки для генеральной средней и генеральной дисперсии; 3) доверительный интервал для оценки генеральной средней с надежностью .
33,2 | 38,2 | 43,2 | 48,2 | 53,2 | |
Решение.
1. Сначала вычислим числовые характеристики выборки.
Выборочную среднюю найдем по формуле (14).
Учитывая, что объем выборки , получаем:
.
Выборочную дисперсию удобнее вычислять по формуле (16):
.
Выборочное СКО:
.
2. Несмещенной оценкой для генеральной средней является выборочная средняя .
Несмещенной оценкой дисперсии генеральной совокупности является исправленная выборочная дисперсия , которая вычисляется по формуле (17):
.
3. Так как генеральная дисперсия неизвестна, а известна лишь ее оценка – исправленная выборочная дисперсия и данная выборка имеет небольшой объем ( ), то доверительный интервал для генеральной средней можно найти, используя формулы (19) и (21).
Значение находим по таблице распределения Стьюдента, где – доверительная вероятность, – объем выборки, - число степеней свободы.
Учитывая, что , , , находим сначала точность оценки по формуле (21):
.
Теперь искомый доверительный интервал определяем по формуле (19):
или .
Ответы: 1. , , ; 2. , ; 3. .