Статистическое распределение выборки.
Статистическим распределением выборки или вариационным рядом называется перечень вариант (в возрастающем порядке) и соответствующих им частот (относительных частот). При этом вариантаминазываютсявсевозможные значения генеральной совокупности.
Например, пусть рассматривается выборка, причем: признак Х1 встречается n1 раз; признак Х2 встречается n2 раз; …; признак Хk встречается nk раз.
Если количество вариантов слишком велико или близко к объему выборки, то целесообразно составить вариационный ряд по группированным данным.
Таблица. Группированный статистический ряд
Номер интервала | Границы интервала | Середина интервала | Частота | Относительная частота | Ордината гистограммы | |||
n | ||||||||
12,4438 | 12,98409091 | 12,71394545 | 0,041667 | 0,077118948 | ||||
12,98409091 | 13,52438182 | 13,25423636 | 0,05 | 0,092542738 | ||||
13,52438182 | 14,06467273 | 13,79452727 | 0,058333 | 0,107966528 | ||||
14,06467273 | 14,60496364 | 14,33481818 | 0,133333 | 0,246780634 | ||||
14,60496364 | 15,14525455 | 14,87510909 | 0,208333 | 0,385594741 | ||||
15,14525455 | 15,68554545 | 15,4154 | 0,125 | 0,231356845 | ||||
15,68554545 | 16,22583636 | 15,95569091 | 0,116667 | 0,215933055 | ||||
16,22583636 | 16,76612727 | 16,49598182 | 0,1 | 0,185085476 | ||||
16,76612727 | 17,30641818 | 17,03627273 | 0,108333 | 0,200509265 | ||||
17,30641818 | 17,84670909 | 17,57656364 | 0,016667 | 0,030847579 | ||||
17,84670909 | 18,387 | 18,11685455 | 0,041667 | 0,077118948 | ||||
Если значение случайной величины находится в точности на границе двух интервалов, то можно (чисто условно) считать данное значение принадлежащим в равной мере к обоим интервалам и прибавлять к числам ni того и другого разряда по 0,5.
Число интервалов, на которые следует группировать статистический материал, не должно быть слишком большим (тогда ряд распределения становится невыразительным, и частоты в нем обнаруживают незакономерные колебания); с другой стороны, оно не должно быть слишком малым (при малом числе интервалов свойства распределения описываются статистическим рядом слишком грубо).
Практика показывает, что в большинстве случаев рационально выбирать число интервалов порядка 10 – 20. Длины интервалов могут быть как одинаковыми, так и различными. При выборе равных интервалов разбиения диапазона изменения случайной величины, количество интервалов определяется в соответствии с таблицей:
n | ||||||||
k |