Проведение первичной группировки
Если в основу группировки положен количественный признак, необходимо определить
1) количество групп,
2) интервалы группировки.
1)При определении количества групп необходимо учитывать особенности изучаемого явления. Поэтому количество групп должно быть оптимальным, в каждую группу должно входить достаточно большое число единиц совокупности, что отвечает требованию закона больших чисел.
На количество выделяемых групп существенное влияние оказывает степень колеблемости группировочного признака: чем она больше, тем больше следует образовать групп.
Существует зависимость между числом групп и единиц совокупности (формула Стэрджесса):
n = 1+3,322·lgN,
где n – число групп, N – число единиц совокупности.
2)Интервал – значение варьирующего признака лежащего в определённых границах.
Величина интервала – разность между верхней и нижней границей.
Интервалы группировки могут быть равными и неравными.
Если мы применяем равные интервалы, то можно рассчитать его величину:
,
где d –величина интервала, n – число выделяемых групп, Xmax и Xmin – соответственно максимальное и минимальное значение единиц совокупности.
Первый и последний интервал могут быть открытыми. Открытый интервал не имеет одну из границ.
Когда одна и та же величина встречается дважды (как верхняя граница одного интервала и нижняя граница другого интервала), единица обладающая этим значением, обычно относится к той группе, где эта величина выступает в роли верхней границы.
Пример 3.3. Известны следующие данные по основным показателям деятельности банков одной из областей России.
№ п/п | Сумма активов, млн. руб. | Собственный капитал, млн. руб. |
645,6 | 12 - min | |
636,9 | 70,4 | |
629,0 | ||
619,6 | 120,8 - max | |
616,4 | 49,4 | |
614,4 | 50,3 | |
608,6 | ||
601,1 | 52,4 | |
600,2 | ||
600,0 | 27,3 | |
592,9 | ||
591,7 | 22,4 | |
585,5 | 39,3 | |
578,6 | ||
577,5 | 22,9 | |
553,7 | 119,3 | |
543,6 | 49,6 | |
542,0 | 88,6 | |
517,0 | 43,7 | |
516,7 | 90,5 | |
Итого | 1153,9 |
В качестве группировочного признака возьмем собственный капитал. Количество групп определяется по формуле Стэрджесса: n = 1+3,322·lg20=5,32. Таким образом, выделяется пять групп банков с равными интервалами
млн. руб.
Результаты группировки заносятся в таблицу, и определяются общие итоги по совокупности единиц наблюдения по каждому показателю.
№ группы | Группы банков по собственному капиталу, млн. руб. | Число банков | Стоимость собст. капит., млн. руб. | Сумма активов, млн. руб. | |||
Всего | В среднем на 1 банк | Всего | В среднем на 1 банк | ||||
12-33,76 | 84,6 | 21,2 | 2414,8 | 603,7 | |||
33,76-55,52 | 367,7 | 46,0 | 4707,2 | 588,4 | |||
55,52-77,28 | 282,4 | 70,6 | 604,3 | ||||
77,28-99,04 | 179,1 | 89,6 | 1058,7 | 529,4 | |||
99,04-120,8 | 240,1 | 120,1 | 1173,3 | 586,7 | |||
Итого | 1153,9 | - | - |
Из полученной группировки видно, что между стоимостью собственного капитала банков и суммой их активов (столбцы 5 и 7) нет четкой взаимосвязи.