Понятие и виды группировки данных

Группировка – разделение единиц совокупнос­ти на группы по выбранным варьирующим признакам.

На основе группировки рассчитывают показатели по группам. Появляется возможность их сравнения, анализа причин различия между группами, изучение взаимосвязи между группами. Группировка обеспечивает обобщение данных, представление их в компактном виде и создаёт основу для последовательного анализа.

Для проведения группировки необходимо определить группировочный признак. Выделяют атрибутивный или количественный признак.

Атрибутивный (качественный) признак определяется его наименованием. Например, группировка по полу, цвету, региону.

Количественный признак имеет цифровое выражение.

Группировки различают:

1. По задачам систематизации данных.

2. По числу группировочных признаков.

3. По используемой информации.

1. По задачам систематизации данных выделяют следующие группировки.

Типологические группировки предназначаются для выявления ка­чественно однородных групп совокупностей, т.е. объектов, близких друг к другу одновременно по всем группировочным признакам (выделение социально-экономических типов явлений). Например, группировка предприятий города по формам собственности.

Структурные группировки – разделение однородной совокуп­ности на группы, характеризующие ее структуру по определенному группировочному признаку (изучение структуры явления и структурных сдвигов, происходящих в нем). Например, группировка рабочих цеха по квали­фикации.

Аналитические группировки предназначены для выявления зависи­мости между признаками. Выде­ляют результирующий признак, который изменяется, и факторные, зависимость от которых исследуется. Если с увеличением факторного признака происходит увеличение результативного признака, то между ними существует прямая связь. Если с увеличением факторного признака происходит уменьшение результативного признака, то – обратная связь.

2.По числу группировочных признаков различают простые (по одно­му признаку) и сложные (по нескольким признакам — комбинирован­ные и многомерные).

Комбинированные группировки строятся путем разбивки каждой группы на подгруппы в соответствии с дополнительными признаками.

Многомерные – строятся с помощью специальных алгоритмов, когда осуществляется поиск скопления в n-мерном пространстве, где каждый объект – точка, т.е. построить многомерную группировку – найти скопление точек.

3.По используемой информации различают первичные и вторичные группировки.

Первичные группировки производятся на основе исходных данных, полученных в результате статистических наблюдений.

Вторичные – результат объединения или расщепления первичной группировки.