Лекция 2. Теория оценивания параметров и выборочные распределения.
Как было отмечено ранее, в реальных выборках оценка параметров распределения проводится на основе имеющейся совокупности. Необходимым условием является условие массовости, т.е. выборка не менее 100 значений (в реальных выборках бывает достаточно обычно 60 значений, а если меньше то и меньше достоверность). Для нормального закона основными точечными характеристиками функции распределения являются:
1. Центр распределения называемыйматематическим ожиданием,которыйсоответствует среднему арифметическому выборки
limx®¥åxi/n = Xcp ®Mx (2.1) - условие закона больших чисел)
2. Дисперсия s2,которойсоответствует ее оценка - выборочная дисперсия
S2=(xi - Xcp)2 /n(2.2).
Для реальных выборок малого объема параметры распределения неустойчивы и большое значение приобретает такой параметр, как объем выборки.
Известно, что средние значения для выборок одинаковой длины (из n. - значений) взятые из одной совокупности распределены нормально (при n® ¥ F(t) ® N (Mx, s).Это условие сходимости называется центральной предельной теоремой. Это распределение выборочного среднего (t - распределение)илиСтьюдента имеет параметры: первый - степень свободы n=n-1, второй параметр - t
t =(xcp i - Xcp)/s/Ön, (2.3)
где Хср - среднее значение совокупности /объединенная выборка по значениям n - где n =(n1 +n2 + ...+ ni +), s- дисперсия совокупности/. Значения t –распределенияразличной вероятности табулированы для разного объема выборок и приведены в справочниках.
Отсюда доверительный интервал изменения среднего значения выборки объема n - ( l) может быть определен как
l=Хср ± ta S/Ön(2.4)-где a -уровень значимости соответствует вероятности ошибки попадания среднего значения в заданный интервал.
Например, для 95% вероятности соответственноa= 0.025 и 0.975, что составляет - 5% вероятность ошибки попадания среднегоХср в интервал для выборки объема n,с оцененным выборочным параметром дисперсии- S2 . При n = 30 - ta=0.025, 0.975= 2.04;n® ¥ - ta=0.025, 0.975= 1.96 (см. таблицу распределения Стьюдента). Распределение Стьюдента может быть использовано для определения интервала группировки при построении гистограмм для выборки заданного объема. В то же время, можно определить объем выборки при заданном интервале группировки относительно среднего значения, при этом за величинуtaберется теоретическое значение распределения Стьюдента при n® ¥ (условие, когда распределение Стьюдента стремится к нормальному распределению) с 95% вероятностью (с ошибкой 5% - ta=0.025, 0.975= 1.96): D= ta S/Ön; ,где D - интервал разбиения
Аналогично рассматривается распределение выборочной дисперсии.Для нормально распределенной совокупности с известным средним значением оцениваются выборочные дисперсии для выборок разного объема. Распределение выборочной оценки Si2 для дисперсии совокупности S2соответствует распределению c2 (распределение Пирсона)сn-1 степенями свободы:(n-1)Si2 /S2 = c2.
Отсюда доверительный интервал для дисперсии совокупностиS2 исходя из распределения c2 при уровне значимости a:- (n-1)Si2 /c21-a (n-1) < S2 <= (n-1)Si2 /c2 a (n-1).(2.4);
Табличные значения распределения Пирсона - c2 a для заданной вероятности ошибки a,и объема выборки n-1) приведены в справочниках. по статистике. Распределение Пирсона очень чувствительно к условию нормальности и применяется при проверке выборочного распределения на нормальность.
Таким образом, для любой выборки с нормальным распределением (это условие проверяется, прежде всего, при предварительном анализе данных), можно оценить основные выборочные параметры по формулам (2.1 – 2.4): среднее, дисперсия и доверительные интервалы среднего и дисперсии.
Другие выборочные параметры нормального распределения мода и медиана находятся на основе построения и анализа гистограммы. Если выборочная медиана (серединное значение ранжированной по значениям выборки ) и выборочная мода (наиболее распространенное значение) совпадают со средним значением, или достаточно мало отличаются, то это условие может служить предварительной оценкой гипотезы нормального распределения исследуемой выборки.
Выборные оценки асимметрии и эксцесса также могут рассматриваться в качестве предварительных оценок нормальности распределения выборки. Выборочный коэффициент асимметрии определяется как: Cs=å(xi - Хср)3 /s 3»0 ипри нормальном распределении выборки должен примерно соответствовать 0. Выборочная характеристика эксцесса: Е = å(xi - Хср)4 /s 4 » 3и не должна превышать значения 3 при нормальном распределении выборки.