N - число единиц совокупности.
Степени вариации признака.
Численности совокупности;
Задач исследования и вида показателя, положенного в основание группировки;
II) необходимо определить количество групп, на которые надо разбить исследуемую совокупность.
Число групп зависит от:
Если группировка строится по атрибутивному признаку, то групп, как правило, будет столько, сколько имеется градаций, видов состоянии у этого признака. Например, группировка предприятий по формам собственности учитывает муниципальную, федеральную и собственность субъектов Федерации.
Если группировка проводится по количественному признаку, то особое внимание обращается на число единиц исследуемого объекта и степень вариации группировочного признака. При небольшом объеме совокупности не следует образовывать большое число групп, так как показатели, рассчитанные для таких групп, не будут представительными.
Определение числа групп можно осуществить и математическим путем с использованием формулы Стерджесса: n=1+3,322*lgN, (1)
где n - число групп;
Согласно формуле (1) выбор числа групп зависит от объема совокупности.
Недостаток формулы (1) состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и распределение единиц по признаку, положенному в основание группировки, близко к нормальному (Гаусса-Лапласа)
Другой способ определения числа групп основан на применении среднего квадратического отклонения (сигма). Если величина интервала равна 1/2, то совокупность разбивается на 12 групп, а когда величина интервала равна 2/3или , то совокупность делится соответственно на 9 и 6 групп. Однако при определении групп данным методом существует большая вероятность получения «пустых», или малочисленных, групп.
III) Когда определено число групп, то следует определить интервалы группировки.
Интервал - это значение варьирующего признака, лежащее в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них, Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей - наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.
Интервалы группировки в зависимости от их величины бывают равные и неравные. Последние делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.
Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами.
Величина равного интервала определяется по следующей формуле: h=R/n=Xmax-Xmin/n
где хmax и хmin- максимальное и минимальное значения признака в совокупности;
n - число групп.
Существуют следующие правила записи числа шага интервала. Если величина интервала рассчитанная по формуле (2), представляет собой величину, которая имеет один знак до запятой (например, 0,88; 1,585; 4,71), то в этом случае полученные значения целесообразно округлить до десятых и их использовать в качестве шага интервала. В приведенном выше примере это будут соответственно значения: 0,9; 1,6; 4,7. Если рассчитанная величина интервала имеет две значащие цифры до запятой и несколько знаков после запятой (например, 15,985), то это значение необходимо округлить до целого числа (до 16). В случае, когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и так далее число, эту величину следует округлить до ближайшего числа, кратного 100 или 50. Например, 587 следует округлить до 600.
Если значение признака варьируется в широких пределах (от 10 до 1000то необходимо использовать группировку с неравными интервалами.
Например, по численности работающих предприятия могут быть разбиты на следующие группы с арифметически возрастающими величинами интервалов: до 100 человек, 100-200, 200-300, 300-500, 500-1000, 1000 и более человек, Это объясняется тем, что изменение количества работающих на 50—100 человек имеет существенное значение для мелких предприятий, а для крупных — не имеет;
Интервалы группировок могут быть закрытыми и открытыми.
Закрытыми называются интервалы, у которых имеются верхняя и нижняя границы. У открытых интервалов указана только одна граница: верхняя - у первого, нижняя - у последнего.Например, группы коммерческих банков по уровню дохода работающих в них сотрудников (чел.): до 2200, 2200 -2300, 2300 - 2400, 2400 и более.
В зависимости от того, какой признак положен в основании группировки прерывный или непрерывный границы интервалов могут быть обозначены по-разному.
Если основанием группировки служит непрерывный признак (например, группы строительных фирм по объему работ (тыс. руб.): до 1200, 1200 - 1400, 1400 - 1600, 1600 - 1800, 1800 и более), то одно и то же значение признака выступает и верхней, и нижней границами двух смежных интервалов.
При таком обозначении границ возникает вопрос, в какую группу включать объект, значения признака у которых совпадают с границами интервалов. Например, во вторую или третью группу должна войти строительная фирма с объемом работ 1600 тыс. руб. Если нижняя граница формируется по принципу «включительно»), а верхняя - по принципу «исключительно», то фирма должна быть отнесена к третьей группе, в противном случае — ко второй. Для того чтобы правильно отнести к группе единицу объекта можно использовать открытые интервалы (например, группы строительных фирм по объему работ преобразуются в следующие: до 1400, 1400 - 1600, 1600 - 1800, 1800 и более). Возможны два случая обозначения открытого последнего интервала: 1) 1800 тыс. руб. и более; 2) более 1800 тыс. руб. В первом случае строительные фирмы с объемом работ 1800 тыс. руб. попадут в третью группу; во втором случае - во вторую группу.
Если в основании группировки лежит прерывный признак, то нижняя граница i-го интервала равна верхней границе (i-1) интервала, увеличенной на 1. Например, до 1400, 1401 - 1600, 1601 - 1800, 1801 и более.
От группировок следует отличать классификацию. Классификацией это систематизированное распределение явлений и объектов на определенные группы, классы, разряды на основании их сходства и различия. В основу классификации кладется атрибутивный признак. Они остаются неизменными в течение длительного периода времени, и разрабатываются органами государственной и международной статистики.
Пример. Произведем анализ 30 самых малых и средних коммерческих банков одного из регионов на 01.01.2008 г.), применяя метод группировок (табл. 1)
В качестве группировочного признака возьмем уставный капитал. Образуем четыре группы банков с равными интервалами. Величину интервала определим по формуле:
H=Xmax-Xmin/n = (23100-2100)/4= 5 250 тыс. руб.
Обозначим границы групп:
2 100 – 7 350 7 350–12 600
12 600–17 850 17 850–23 100
Определен группировочный признак - уставный капитал, задано число групп - 4 и образованы сами группы, необходимо отобрать показатели, которые характеризуют группы, и определить их величины по каждой группе. Показатели, характеризующие банки, разносятся по указанным группам, и подсчитываются итоги по группам. Результаты группировки наносятся в таблицу, и определяются общие итоги по каждому показателю (табл. 2).