Лекция 5 Построение группировок
При построении группировок решаются следующие основные задачи:
- выбрать группировочной признак;
- определить число групп;
- зафиксироать границы интервала группировки
- определить систему или отдельные показатели, характеризующие выделенные группы.
Интервал – количественное значение, отделяющее одну единицу (группу) от другой, т.е. интервал очерчивает количественные границы групп.
Как правило, величина интервала представляет собой: чем больше образовано групп, тем меньше интервал, и наоборот.
При определении количества групп необходимо стремиться к тому, чтобы были учтены особенности изучаемого явления. Поэтому число групп должно быть оптимальным, в каждую группу должно входить достаточно большое число единиц совокупности, что отвечает требованию закона больших чисел.
Ориентировочно определить оптимальное количество групп с равными интервалами можно по формуле американского учёного Стерджесса:
n=1+3,32 lg N (1)
Где N – численность единиц совокупности.
Получаем следующее соотношение:
N | 15-24 | 25-44 | 45-89 | 90-179 | 180-359 | 360-719 |
n |
Формула Стерджесса пригодна при условии, что распределение единиц совокупности по данному признаку приближается к нормальному и при этом применяются равные интервалы в группах.
Интервалы могут быть равные и неравные. При исследовании экономических явлений могут применяться неравные (прогрессивно возрастающие, прогрессивно убывающие) интервалы. Так, например, по численности работающих промышленные предприятия могут быть разбиты на следующие группы: до 100 человек, 100-200, 200-300, 300-500, 500-1000, 1000 и более человек. Или ещё пример неравного интервала.
Стаж работы Количество рабочих
до 1 года -
1-2 3
3-4 1
5-9 5
10-11 6
20 и более того 6
итого 21
Группировка с равными интервалами целесообразна в тех случаях, когда вариация проявляется в сравнительно узких границах и распределение является практически равномерным (например, при группировке рабочих одной профессии по размеру заработной платы, посевов какой-либо культуры по урожайности).
Для группировок с равными интервалами величина интервала:
I= (Хmах - Хmin)/N (2)
Где:
Х mах – наибольшее значение признака;
Х min – наименьшее значение признака;
n – число групп.
Если, например, требуется произвести группировку с равными интервалами по данным об уровне месячной заработанной платы бюджетных работников, которая колеблется в пределах от 600 до 750 руб., и необходимо при этом выделить 5 групп, то величина интервала, руб.:
I=(750-600)/5 =30
N | Размер зарплаты (руб.) |
600+30, т.е. 600-630 630-660 660-690 690-720 720-750 |
Если в результате деления получится не целое число и возникает необходимость в округлении, то округлять нужно, как правило, в большую сторону, а не в меньшую.
Серединное значение интервалов определяется несколькими приёмами. Этот показатель можно рассчитать суммированием верхних и нижних границ интервала и делением суммы пополам. В нашем примере в первом интервале середина равна 615 руб. (600+630):2; во втором 645 руб. (630+660):2 и т.д. Эти значения также получают прибавлением к серединному значению первого интервала величины равного интервала (615+30)=645.
Если было бы размер зарплаты до 600 руб., то, вычитая величину равного интервала из серединного значения первого (второго для этого примера), будем иметь середину (первого для этого примера) т.е. 615-30=585, а если было бы 750 и выше, то середина последнего, открытого интервала определяется прибавлением длины интервала к середине интервала из предпоследней группы (735+30=765).
Размер зарплаты, руб. середина интервала
До 600 585
600-630 615
630-660 645
660-690 675
690-720 705
720-750 735
свыше 750 765