ВЫБОРОЧНОЕ РАСПРЕДЕЛЕНИЕ
Выборочное распределение (sampling distribution) -распределение значений выборочных статистик, рассчитанных для каждой возможной выборки, которую можно получить из изучаемой совокупности при определенном плане выборочного наблюдения.
Предположим, что простую случайную выборку, включающую 5 больниц, нужно сформировать из генеральной совокупности 20 больниц. Можно получить (20 х 19 х 18 х 17 х 16)/(1 х 2 х 3 х 4 х 5), или 15504 различных выборок каждая размером в 5 элементов. Распределение относительных частот средних значений этих 15504 различных выборок определяет выборочное распределение среднего.
Важная задача маркетингового исследования — вычисление таких статистик, как выборочное среднее и выборочная доля, и применение их для оценки соответствующих истинных значений генеральной совокупности.
Процесс распространения результатов оценки выборки на оценку генеральной совокупности называется статистическим заключением(statistical inference).
На практике создается одна выборка заданного объема и по ней вычисляются выборочные статистики (а именно, среднее и доля). Теоретически, для того чтобы оценить параметр изучаемой совокупности исходя из статистики выборки, нужно изучить каждую возможную выборку. Если бы все возможные выборки создавались в действительности, распределение статистики являлось бы выборочным распределением. Несмотря на то, что на практике создается только одна выборка, понятие выборочного распределения очень важно. Это дает нам возможность использовать теорию вероятности для того, чтобы делать выводы относительно значений совокупности.
Статистическое заключение (statistical inference) -распространение результатов оценки выборки на оценку совокупности.
Важные характеристики выборочного распределения среднего и соответствующие характеристики доли для больших выборок (30 и больше) следующие.
1. Выборочное распределение среднего— это нормальное распределение. Строго говоря, выборочное распределение доли биномиально. Однако для больших выборок (п = 30 и больше) его можно свести к нормальному распределению.
2. Среднее значение выборочного распределения среднего
или доли (р) равняется соответствующему значению параметра совокупности mили p.
3. Стандартная ошибка(standard error) среднего или доли относится к выборочному распределению среднего или доли, а не к выборке или всей совокупности. Формулы для определения стандартной ошибки:
Стандартная ошибка (standard error) - среднеквадратичное (стандартное) отклонение выборочного распределения среднего или доли.
4. Часто среднеквадратичное отклонение изучаемой совокупности sнеизвестно. В таких случаях его расчетное значение получают из выборки с помощью следующей формулы:
Если s оценивается через s, то стандартная ошибка среднего равна
где "расчет." обозначает, что s употребляется для расчета значения s.
Если не учитывать погрешность измерения, можно определить достоверность оценки параметра совокупности с помощью стандартной ошибки.
5. Аналогично, значение стандартной ошибки доли можно рассчитать, применив выборочную долю р для расчета генеральной доли p таким образом:
6. Площадь области под кривой выборочного распределения между любыми двумя точками можно рассчитать с помощью значений z (z value). Значение z точки — это число стандартных ошибок, на которое точка удалена от среднего. Значения z можно рассчитать следующим образом:
Например, площади областей, находящихся под одной стороной кривой, между средним и точками, которые имеют значения Z, равные 1,0, 2,0 и 3,0, составляют соответственно 0,3413, 0,4772 и 0,4986 (табл. 2 в Приложении "Статистические таблицы"). В случае с долей значения z вычисляются аналогично.
Значение z (z value) - количество стандартных ошибок, на которое точка удалена от среднего значения.
7. Если объем выборки составляет 10% или больше от объема исследуемой совокупности, применение формул стандартной ошибки приведет к переоценке среднеквадратичного отклонения среднего или доли совокупности. Значит, его следует откорректировать, применив коэффициент окончательной коррекции совокупности, определяемый как