Выбор интервала группировки
В тех случаях, когда при группировке признак должен быть выражен не конкретным числом, а интервалом значений, необходимо определиться с длинной интервалов.
Длинна интервала – это разность между максимальным и минимальным значениями интервала.
Интервалы группировки могут быть равными и неравными.
Если вариация признака проявляется в сравнительно узких границах, то строят группировку с равными интервалами. Величина равного интервала определяется по следующей формуле:
Пример: в результате исследования статистического наблюдения получены следующие данные о возрасте лиц, совершивших покупки в торговой точке за неделю:
25 | |||||||||
27 | |||||||||
38 | |||||||||
45 | |||||||||
33 | |||||||||
36 | |||||||||
36 |
Проведем группировку данных, выделив 5 групп с равными интервалами:
Возраст покупателей, лет | Число покупателей |
25 - 29 | |
29 - 33 | |
33 - 37 | |
37 - 41 | |
41 - 45 |
Неравные интервалы применяются в статистике, когда значения признака варьируют неравномерно и в значительных размерах, что характерно для большинства социально-экономических явлений, особенно при анализе макроэкономических показателей.
Неравные интервалы могут быть прогрессивно возрастающие и прогрессивно убывающие в арифметической или геометрической прогрессии. Величина интервалов, изменяющихся в арифметической прогрессии, определяется следующим образом:
в геометрической прогрессии:
,
где а – константа, число, которое будет постоянным и положительным при прогрессивно возрастающих интервалах или отрицательным при прогрессивно убывающих интервалах;
q – константа, положительное число, которое при прогрессивно возрастающих интервалах будет больше 1, а при прогрессивно убывающих – меньше 1.
Пример:
Необходимо построить группировку предприятий отрасли по показателю выручки от реализации продукции, которая меняется от Xmin =500 млн. руб. до Xmax =4000 млн. руб.
Построим прогрессивно возрастающую группировку, возьмем a = 200 млн. руб.
ГРУППА | ИНТЕРВАЛ |
I | 500-700 |
II | 700-900 |
III | 900-1100 |
IV | 1100-1300 |
V | 1300-1500 |
При определении границ интервала на практике часто исходят из того, что количественные изменения должны приводить к качественным изменениям, поэтому величина интервала часто выбирается произвольно, руководствуясь экономическим смыслом задачи.
Причем интервалы могут быть закрытые и открытые. Закрытые интервалы характеризуются тем, что известны и верхняя (минимальное значение) и нижняя (максимальное значение признака) границы интервала. У открытых интервалов известна лишь одна граница.
На практике иногда приходится пользоваться уже имеющимися группировками, которые могут быть несопоставимы из-за неодинаковых границ интервалов или различного количества выделяемых групп. Для приведения таких группировок к сопоставимому виду используется метод вторичной группировки.
Вторичная группировка заключается в образовании новых групп на основе ранее произведенной группировки.
Во вторичной группировке применяются два способа образования новых групп:
· Первый способ состоит в укреплении первоначальных интервалов. Это наиболее простой и распространенный способ вторичной группировки.
· Второй способ называется методом долевой перегруппировки и состоит в том, что за каждой группой закрепляется определенная доля единиц совокупности.