Влияние увеличения размера выборки на точность оценок

Рис. A.8.

Оценка хороша своей несмещенностью, но преимуществом оценки является то, что ее значения практически всегда близки к истинному значению. Какую из них вы бы выбрали?

Данный выбор зависит от обстоятельств. Если возможные ошибки вас не очень тревожат при условии, что за длительный период они «погасят» друг друга, то, по-видимому, вы выберете . С другой стороны, если для вас приемлемы малые ошибки, но неприемлемы большие, то вам следует выбрать .

Формально говоря, выбор определяется функцией потерь, стоимостью сделанной ошибки как функцией ее размера. Обычно выбирают оценку, дающую наименьшее ожидание потерь, и делается это путем взвешивания функции потерь по функции плотности вероятности. (Если вы не любите риск, то можете также пожелать учесть дисперсию потерь.)

Будем по-прежнему предполагать, что мы исследуем случайную переменную с неизвестным математическим ожиданием и теоретической дисперсией и что для оценивания используется . Каким образом точность оценки зависит от числа наблюдений ?

Ответ неудивителен: при увеличении оценка , вообще говоря, становится более точной. В единичном эксперименте большая по размеру выборка необязательно даст более точную оценку, чем меньшая выборка, – всегда может присутствовать элемент везения, – но общая тенденция должна быть именно такой. Поскольку дисперсия выражается формулой (доказательство этого факта мы опускаем), она тем меньше, чем больше размер выборки, и, значит, тем сильнее «сжата» функция плотности вероятности для .

Это показано на рис. A.9. Мы предполагаем, что нормально распределена со средним 25 и стандартным отклонением 50. Если размер выборки равен 25, то стандартное отклонение величины , равное , составит: . Если размер выборки равен 100, то это стандартное отклонение равно 5. На рис. А.9 показаны соответствующие функции плотности вероятности. Вторая () выше первой в окрестности , что говорит о более высокой вероятности получения с ее помощью аккуратной оценки. За пределами этой окрестности вторая функция всюду ниже первой.