N - число единиц совокупности.

Степени вариации признака.

Численности совокупности;

Задач исследования и вида показателя, положенного в основание группировки;

II) необходимо определить количество групп, на которые надо разбить исследуемую совокупность.

Число групп зависит от:

Если группировка строится по атрибутивному признаку, то групп, как правило, будет столько, сколько имеется градаций, видов состоянии у этого признака. Например, группировка предприятий по формам собственности учитывает муниципальную, федеральную и собственность субъектов Федерации.

Если группировка проводится по количественному признаку, то особое внимание обращается на число единиц исследуемого объекта и степень вариации группировочного признака. При небольшом объеме совокупности не следует образовывать большое число групп, так как показатели, рассчитанные для таких групп, не будут представительными.

Определение числа групп можно осуществить и математическим путем с использованием формулы Стерджесса: n=1+3,322*lgN, (1)

где n - число групп;

Согласно формуле (1) выбор числа групп зависит от объема совокупности.

Недостаток формулы (1) состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и распределение единиц по признаку, положенному в основание группировки, близко к нормальному (Гаусса-Лапласа)

Другой способ определения числа групп основан на применении среднего квадратического отклонения (сигма). Если величина интервала равна 1/2, то совокупность разбивается на 12 групп, а когда величина интервала равна 2/3или , то совокупность делится соответственно на 9 и 6 групп. Однако при определении групп данным методом существует большая вероятность получения «пустых», или малочисленных, групп.

III) Когда определено число групп, то следует определить интервалы группировки.

Интервал - это значение варьирующего признака, лежащее в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них, Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей - наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки в зависимости от их величины бывают равные и неравные. Последние делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.

Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами.

Величина равного интервала определяется по следующей формуле: h=R/n=Xmax-Xmin/n

где хmax и хmin- максимальное и минимальное значения признака в совокупности;
n - число групп.

Существуют следующие правила записи числа шага интервала. Если величина интервала рассчитанная по формуле (2), представляет собой величину, которая имеет один знак до запятой (например, 0,88; 1,585; 4,71), то в этом случае полученные значения целесообразно округлить до десятых и их использовать в качестве шага интервала. В приведенном выше примере это будут соответственно значения: 0,9; 1,6; 4,7. Если рассчитанная величина интервала имеет две значащие цифры до запятой и несколько знаков после запятой (например, 15,985), то это значение необходимо округлить до целого числа (до 16). В случае, когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и так далее число, эту величину следует округлить до ближайшего числа, кратного 100 или 50. Например, 587 следует округлить до 600.

Если значение признака варьируется в широких пределах (от 10 до 1000то необходимо использовать группировку с неравными интервалами.

Например, по численности работающих предприятия могут быть разбиты на следующие группы с арифметически возрастающими величинами интервалов: до 100 человек, 100-200, 200-300, 300-500, 500-1000, 1000 и более человек, Это объясняется тем, что изменение количества работающих на 50—100 человек имеет существенное значение для мелких предприятий, а для крупных — не имеет;

Интервалы группировок могут быть закрытыми и открытыми.

Закрытыми называются интервалы, у которых имеются верхняя и нижняя границы. У открытых интервалов указана только одна граница: верхняя - у первого, нижняя - у последнего.Например, группы коммерческих банков по уровню дохода работающих в них сотрудников (чел.): до 2200, 2200 -2300, 2300 - 2400, 2400 и более.

В зависимости от того, какой признак положен в основании группировки прерывный или непрерывный границы интервалов могут быть обозначены по-разному.

Если основанием группировки служит непрерывный признак (например, группы строительных фирм по объему работ (тыс. руб.): до 1200, 1200 - 1400, 1400 - 1600, 1600 - 1800, 1800 и более), то одно и то же значение признака выступает и верхней, и нижней границами двух смежных интервалов.

При таком обозначении границ возникает вопрос, в какую группу включать объект, значения признака у которых совпадают с границами интервалов. Например, во вторую или третью группу должна войти строительная фирма с объемом работ 1600 тыс. руб. Если нижняя граница формируется по принципу «включительно»), а верхняя - по принципу «исключительно», то фирма должна быть отнесена к третьей группе, в противном случае — ко второй. Для того чтобы правильно отнести к группе единицу объекта можно использовать открытые интервалы (например, группы строительных фирм по объему работ преобразуются в следующие: до 1400, 1400 - 1600, 1600 - 1800, 1800 и более). Возможны два случая обозначения открытого последнего интервала: 1) 1800 тыс. руб. и более; 2) более 1800 тыс. руб. В первом случае строительные фирмы с объемом работ 1800 тыс. руб. попадут в третью группу; во втором случае - во вторую группу.

Если в основании группировки лежит прерывный признак, то нижняя граница i-го интервала равна верхней границе (i-1) интервала, увеличенной на 1. Например, до 1400, 1401 - 1600, 1601 - 1800, 1801 и более.

От группировок следует отличать классификацию. Классификацией это систематизированное распределение явлений и объектов на определенные группы, классы, разряды на основании их сходства и различия. В основу классификации кладется атрибутивный признак. Они остаются неизменными в течение длительного периода времени, и разрабатываются органами государственной и международной статистики.

 

Пример. Произведем анализ 30 самых малых и средних коммерческих банков одного из регионов на 01.01.2008 г.), применяя метод группировок (табл. 1)

В качестве группировочного признака возьмем уставный капитал. Образуем четыре группы банков с равными интервалами. Величину интервала определим по формуле:

H=Xmax-Xmin/n = (23100-2100)/4= 5 250 тыс. руб.

Обозначим границы групп:

2 100 – 7 350 7 350–12 600

12 600–17 850 17 850–23 100

Определен группировочный признак - уставный капитал, задано число групп - 4 и образованы сами группы, необходимо отобрать показатели, которые характеризуют группы, и определить их величины по каждой группе. Показатели, характеризующие банки, разносятся по указанным группам, и подсчитываются итоги по группам. Результаты группировки наносятся в таблицу, и определяются общие итоги по каждому показателю (табл. 2).