Лекция 5 Построение группировок

 

При построении группировок решаются следующие основные задачи:

- выбрать группировочной признак;

- определить число групп;

- зафиксироать границы интервала группировки

- определить систему или отдельные показатели, характеризующие выделенные группы.

Интервал – количественное значение, отделяющее одну единицу (группу) от другой, т.е. интервал очерчивает количественные границы групп.

Как правило, величина интервала представляет собой: чем больше образовано групп, тем меньше интервал, и наоборот.

При определении количества групп необходимо стремиться к тому, чтобы были учтены особенности изучаемого явления. Поэтому число групп должно быть оптимальным, в каждую группу должно входить достаточно большое число единиц совокупности, что отвечает требованию закона больших чисел.

Ориентировочно определить оптимальное количество групп с равными интервалами можно по формуле американского учёного Стерджесса:

n=1+3,32 lg N (1)

 

Где N – численность единиц совокупности.

Получаем следующее соотношение:

 

N 15-24 25-44 45-89 90-179 180-359 360-719
n

 

Формула Стерджесса пригодна при условии, что распределение единиц совокупности по данному признаку приближается к нормальному и при этом применяются равные интервалы в группах.

Интервалы могут быть равные и неравные. При исследовании экономических явлений могут применяться неравные (прогрессивно возрастающие, прогрессивно убывающие) интервалы. Так, например, по численности работающих промышленные предприятия могут быть разбиты на следующие группы: до 100 человек, 100-200, 200-300, 300-500, 500-1000, 1000 и более человек. Или ещё пример неравного интервала.

Стаж работы Количество рабочих

до 1 года -

1-2 3

3-4 1

5-9 5

10-11 6

20 и более того 6

итого 21

 

Группировка с равными интервалами целесообразна в тех случаях, когда вариация проявляется в сравнительно узких границах и распределение является практически равномерным (например, при группировке рабочих одной профессии по размеру заработной платы, посевов какой-либо культуры по урожайности).

Для группировок с равными интервалами величина интервала:

I= (Хmах - Хmin)/N (2)

Где:

Х mах – наибольшее значение признака;

Х min – наименьшее значение признака;

n – число групп.

Если, например, требуется произвести группировку с равными интервалами по данным об уровне месячной заработанной платы бюджетных работников, которая колеблется в пределах от 600 до 750 руб., и необходимо при этом выделить 5 групп, то величина интервала, руб.:

I=(750-600)/5 =30

 

N Размер зарплаты (руб.)
600+30, т.е. 600-630 630-660 660-690 690-720 720-750

Если в результате деления получится не целое число и возникает необходимость в округлении, то округлять нужно, как правило, в большую сторону, а не в меньшую.

Серединное значение интервалов определяется несколькими приёмами. Этот показатель можно рассчитать суммированием верхних и нижних границ интервала и делением суммы пополам. В нашем примере в первом интервале середина равна 615 руб. (600+630):2; во втором 645 руб. (630+660):2 и т.д. Эти значения также получают прибавлением к серединному значению первого интервала величины равного интервала (615+30)=645.

Если было бы размер зарплаты до 600 руб., то, вычитая величину равного интервала из серединного значения первого (второго для этого примера), будем иметь середину (первого для этого примера) т.е. 615-30=585, а если было бы 750 и выше, то середина последнего, открытого интервала определяется прибавлением длины интервала к середине интервала из предпоследней группы (735+30=765).

Размер зарплаты, руб. середина интервала

До 600 585

600-630 615

630-660 645

660-690 675

690-720 705

720-750 735

свыше 750 765