Выбор интервала группировки

В тех случаях, когда при группировке признак должен быть выражен не конкретным числом, а интервалом значений, необходимо определиться с длинной интервалов.

Длинна интервала – это разность между максимальным и минимальным значениями интервала.

Интервалы группировки могут быть равными и неравными.

Если вариация признака проявляется в сравнительно узких границах, то строят группировку с равными интервалами. Величина равного интервала определяется по следующей формуле:

Пример: в результате исследования статистического наблюдения получены следующие данные о возрасте лиц, совершивших покупки в торговой точке за неделю:

25
27
38
45
33
36
36

Проведем группировку данных, выделив 5 групп с равными интервалами:

Возраст покупателей, лет Число покупателей
25 - 29
29 - 33
33 - 37
37 - 41
41 - 45

Неравные интервалы применяются в статистике, когда значения признака варьируют неравномерно и в значительных размерах, что характерно для большинства социально-экономических явлений, особенно при анализе макроэкономических показателей.

Неравные интервалы могут быть прогрессивно возрастающие и прогрессивно убывающие в арифметической или геометрической прогрессии. Величина интервалов, изменяющихся в арифметической прогрессии, определяется следующим образом:

в геометрической прогрессии:

,

где а – константа, число, которое будет постоянным и положительным при прогрессивно возрастающих интервалах или отрицательным при прогрессивно убывающих интервалах;

q – константа, положительное число, которое при прогрессивно возрастающих интервалах будет больше 1, а при прогрессивно убывающих – меньше 1.

Пример:

Необходимо построить группировку предприятий отрасли по показателю выручки от реализации продукции, которая меняется от Xmin =500 млн. руб. до Xmax =4000 млн. руб.

Построим прогрессивно возрастающую группировку, возьмем a = 200 млн. руб.

ГРУППА ИНТЕРВАЛ
I 500-700
II 700-900
III 900-1100
IV 1100-1300
V 1300-1500

При определении границ интервала на практике часто исходят из того, что количественные изменения должны приводить к качественным изменениям, поэтому величина интервала часто выбирается произвольно, руководствуясь экономическим смыслом задачи.

Причем интервалы могут быть закрытые и открытые. Закрытые интервалы характеризуются тем, что известны и верхняя (минимальное значение) и нижняя (максимальное значение признака) границы интервала. У открытых интервалов известна лишь одна граница.

 

На практике иногда приходится пользоваться уже имеющимися группировками, которые могут быть несопоставимы из-за неодинаковых границ интервалов или различного количества выделяемых групп. Для приведения таких группировок к сопоставимому виду используется метод вторичной группировки.

Вторичная группировка заключается в образовании новых групп на основе ранее произведенной группировки.

Во вторичной группировке применяются два способа образования новых групп:

· Первый способ состоит в укреплении первоначальных интервалов. Это наиболее простой и распространенный способ вторичной группировки.

· Второй способ называется методом долевой перегруппировки и состоит в том, что за каждой группой закрепляется определенная доля единиц совокупности.