Основы группировки статистических данных

Для придания данным выборки большей наглядности при их графическом представлении принято строить группированный статистический ряд. Пусть дана выборка, построен вариационный ряд.为了研究样本总体分布的性质,可以得到很多观察值,可直接通过建立频率直方图对其进行研究。

. . . . .

Построим группированный ряд, состоящий из k интервалов. Найдем шаг h – длину одного интервала, предполагая равномерную группировку, т.е. разбиение на интервалы равной длины. По формулам (10.1) найдем экстремальные элементы:整理数据,有k个小区间,区间长度为h,每个区间等距,根据公式可得出小区间的端点,称为组限:

, .

Тогда

. (11.1)

Границы интервалов 组距公式 вычисляются по формулам:

. (11.2)

Соответственно, оказывается .

Находятся интервальные частоты - это количество элементов выборки, попавших на интервал . Для углубленных статистических исследований вычисляются относительные частоты и относительные плотности частот . На основании этих данных строят группированный ряд:数出落在每个小区间的数据的频数f,算出频率

 
. . . . .

 

Графическое изображение группированного ряда – гистограмма. В углубленных статистических исследованиях по оси У гистограммы откладывают относительные плотности частот. Это обязательно, во-первых, при неравномерной группировке (при изменяющемся шаге h), во-вторых, при необходимости расчета интервальных выборочных характеристик.

 

11.2. Пример решения типового задания по теме
«Группированный статистический ряд»

Задание № 11.Дан вариационный ряд.

0,3,5,11,11,15,15,16,19,19,20,20,21,22,23,23,25,25,27,27,27,29,31,32,32,36,36,38,39,39,43,43,44,47,50.

Составить группированный ряд (пять интервалов), построить гистограмму, выдвинуть гипотезу о возможном законе распределения случайной величины.Приблизительно нанести на гистограмму теоретическую кривую предполагаемого распределения.

Решение.Объем выборки n=25.Число интервалов для группировки k = 5. Экстремальные элементы , . Найдем шаг разбиения по формуле (11.1):

.

Тогда границы интервалов можно найти по формуле (11.2) с учетом того, что :

;

;

;

;

.

Устно подсчитывая интервальные частоты, можем построить группированный ряд

 

[0, 10) [10, 20) [20, 30) [30, 40) [40, 50)

 

Строим гистограмму, откладывая по оси Х интервалы изменения значений случайной величины, по оси У – интервальные частоты. Поскольку углубленный статистический анализ не предполагается, то относительные частоты и плотности частот не вычисляются. В нашем случае вид гистограммы при таком упрощении не изменяется, изменяется только масштаб по оси У, который не влияет на выдвигаемое предположение о законе распределения случайной величины. Гистограмма приведена на рис. 11.1.

Рис. 11.1.Гистограмма

 

На основании вида гистограммы можно выдвинуть гипотезу о нормальном распределении случайной величины. Кривая, имитирующая кривую Гаусса, эскизно нанесена на гистограмму. Разумеется, это предположение является лишь предварительной гипотезой, которая может быть принята или отвергнута только на основании углубленного статистического анализа с вычислением выборочных характеристик и проведением процедуры проверки статистической гипотезы на основе выбранного критерия.