Точечные оценки параматров распределения
Мы подошли к решению вопроса о том, как на основании полученной в эксперименте группы результатов наблюдений оценить истинное значение, т.е. найти результат измерений, как оценить его точность, т.е. меру его приближения к истинному значению.
Рассмотренные в рамках предыдущей лекции функции распределения описывают поведение непрерывных случайных величин, т.е. величин, возможные значения которых неотделимы друг от друга и непрерывно заполняют некоторый конечный или бесконечный интервал. На практике все результаты измерений и случайные погрешности являются величинами дискретными, т.е. величинами xi возможные значения которых отделимы друг от друга и поддаются счету. При использовании дискретных случайных величин возникает задача нахождения точечных оценок параметров их функций распределения на основании выборок – ряда значений хi принимаемых случайной величиной х в n независимых опытах. Используемая выборка должна быть репрезентативной(представительной), т.е. должна достаточно хорошо представлять пропорции генеральной совокупности.
Оценка параметра называется точечной, если она выражается одним числом. Задача нахождения точечных оценок – частный случай статистической задачи нахождения оценок параметров функции распределения случайной величины на основании выборки. Любая точечная оценка, вычисленная на основании опытных данных, является их функцией и поэтому сама должна представлять собой случайную величину с распределением, зависящим от распределения исходной случайной величины, в том числе от самого оцениваемого параметра и от числа опытов n.
Точечные оценки могут быть состоятельными, несмещенными и эффективными.
Состоятельной называется оценка, которая при увеличении объема выборки стремится по вероятности к истинному значению числовой характеристики.
Несмещеннойназывается оценка, математическое ожидание которой равно оцениваемой числовой характеристике (параметру).
Оценка называется эффективной, если ее дисперсия меньше дисперсии любой другой оценки данного параметра, т.е. наиболее эффективной считают ту из нескольких возможных несмещенных оценок, которая имеет наименьшую дисперсию.
Требование несмещенности на практике не всегда целесообразно, так как оценка с небольшим смещением и малой дисперсией может оказаться предпочтительнее несмещенной оценки с большой дисперсией. На практике не всегда удается удовлетворить одновременно все три этих требования, однако выбору оценки должен предшествовать ее критический анализ со всех перечисленных точек зрения.
Наиболее распространенным методом получения оценок является, метод наибольшего (максимального) правдоподобия, теоретически обоснованный математиком Р. Фишером, который приводит к асимптотически несмещенным и эффективным оценкам с приближенно нормальным распределением. Среди других методов можно назвать методы моментов и наименьших квадратов.
Точечной оценкой математического ожидания результата измерений является среднее арифметическое значение измеряемой величины
(6.1)
При любом законе распределения оно является состоятельной и несмещенной оценкой, а также наиболее эффективной по критерию наименьших квадратов.
Точечная оценка дисперсии, определяемая по формуле
(6.2)
является несмещенной и состоятельной.
Среднеквадратическое отклонение случайной величины х определяется как корень квадратный из дисперсии. Соответственно его оценка может быть найдена путем извлечения корня из оценки дисперсии. Однако эта операция является нелинейной процедурой, приводящей к смещенности получаемой таким образом оценки. Для исправления оценки СКО вводят поправочный множитель k(n), зависящий от числа наблюдений n. Он изменяется от k(3)=1,13 до k(∞) = 1,03. Оценка среднего квадратического отклонения
Полученные оценки математического ожидания и СКО являются случайными величинами. Это проявляется в том, что при повторениях серий из n наблюдений каждый раз будут получаться различные оценки и . Рассеяние этих оценок целесообразно оценивать с помощью СКО и Sσ. Оценка СКО среднего арифметического значения
(6.3)
Оценка СКО среднего квадратического отклонения
Отсюда следует, что относительная погрешность определения СКО может быть оценена как
Она зависит только от эксцесса и числа наблюдений в выборке и не зависит от СКО, т.е. той точности, с которой производятся измерения. Ввиду того, что большое число измерений проводится относительно редко, погрешность определения, а может быть весьма существенной. В любом случае она больше погрешности из-за смещенности оценки, обусловленной извлечением квадратного корня и устраняемой поправочным множителем k(n). В связи с этим на практике пренебрегают учетом смещенности оценки СКО отдельных наблюдений и определяют его по формуле
(6.4)
т.е. считают k(n)=1.
Иногда оказывается удобнее использовать следующие формулы для расчета оценок СКО отдельных наблюдений и результата измерения:
; (6.5)
Точечные оценки других параметров распределений используются значительно реже. Оценки коэффициента асимметрии и эксцесса находятся по формулам
; (6.6)
(6.7)
Определение рассеяния оценок коэффициента асимметрии и эксцесса описывается различными формулами в зависимости от вида распределения.