Статистическое распределение выборки.

Статистическим распределением выборки или вариационным рядом называется перечень вариант (в возрастающем порядке) и соответствующих им частот (относительных частот). При этом вариантаминазываютсявсевозможные значения генеральной совокупности.

Например, пусть рассматривается выборка, причем: признак Х1 встречается n1 раз; признак Х2 встречается n2 раз; …; признак Хk встречается nk раз.

 

 

 

Если количество вариантов слишком велико или близко к объему выборки, то целесообразно составить вариационный ряд по группированным данным.

Таблица. Группированный статистический ряд

Номер интервала Границы интервала Середина интервала Частота Относительная частота Ордината гистограммы  
n  
12,4438 12,98409091 12,71394545 0,041667 0,077118948
12,98409091 13,52438182 13,25423636 0,05 0,092542738
13,52438182 14,06467273 13,79452727 0,058333 0,107966528
14,06467273 14,60496364 14,33481818 0,133333 0,246780634
14,60496364 15,14525455 14,87510909 0,208333 0,385594741
15,14525455 15,68554545 15,4154 0,125 0,231356845
15,68554545 16,22583636 15,95569091 0,116667 0,215933055
16,22583636 16,76612727 16,49598182 0,1 0,185085476
16,76612727 17,30641818 17,03627273 0,108333 0,200509265
17,30641818 17,84670909 17,57656364 0,016667 0,030847579
17,84670909 18,387 18,11685455 0,041667 0,077118948
                 

Если значение случайной величины находится в точности на границе двух интервалов, то можно (чисто условно) считать данное значение принадлежащим в равной мере к обоим интервалам и прибавлять к числам ni того и другого разряда по 0,5.

Число интервалов, на которые следует группировать статистический материал, не должно быть слишком большим (тогда ряд распределения становится невыразительным, и частоты в нем обнаруживают незакономерные колебания); с другой стороны, оно не должно быть слишком малым (при малом числе интервалов свойства распределения описываются статистическим рядом слишком грубо).

Практика показывает, что в большинстве случаев рационально выбирать число интервалов порядка 10 – 20. Длины интервалов могут быть как одинаковыми, так и различными. При выборе равных интервалов разбиения диапазона изменения случайной величины, количество интервалов определяется в соответствии с таблицей:

 

n
k