СВОДКА И ГРУППИРОВКА ДАННЫХ СТАТИСТИЧЕСКОГО НАБЛЮДЕНИЯ

Тренировочные задания

Контрольный тест

1. Основными принципами статистического наблюдения являются:

а) планомерность, массовость, научная организация;

б) повторяемость, закономерность, организация;

в) планомерность, закономерность, массовость;

г) повторяемость, организованность, научное обоснование;

2. Одной из форм статистического наблюдения является:

а) отчетность;

б) социологический опрос;

в) регистрация транспортных средств в ГИБДД;

г) выборы президента РФ.

3. По охвату единиц совокупности статистическое наблюдение бывает:

а) сплошное;

б) непосредственное;

в) непрерывное;

г) единичное.

4. Критическим моментом статистического наблюдения называется:

а) период времени, в течение которого проводится наблюдение;

б) момент времени, по состоянию на который проводится наблюдение;

в) момент времени, с которого начинается наблюдение;

г) момент времени, когда должно окончится наблюдение.

5. План статистического наблюдения включает:

а) программно-методологический раздел;

б) учебный раздел;

в) разработочный;

г) подготовительный раздел.

6. Единовременным называется наблюдение:

а) проводимое только один раз;

б) проводимое время от времени по мере необходимости;

в) проводимое только один раз в год;

г) проводимое только в течение одного дня.

7. Перечень признаков (или вопросов), подлежащих регистрации в процессе наблюдения,
называется:

а) статистическим формуляром;

б) планом наблюдения;

в) инструментарием наблюдения;

г) программой наблюдения.

8. Объектом статистического наблюдения называется:

а) совокупность единиц наблюдения, подлежащих статистическому исследованию;

б) первичная ячейка совокупности, от которой должны быть получены сведения в про­цессе наблюдения;

в) совокупность явлений и процессов, реально существующих во времени и простран­стве;

г) население РФ

9. Ошибки репрезентативности возможны только при:

а) сплошном наблюдении;

б) выборочном наблюдении;

в) единовременном наблюдении;

г) периодическом наблюдении.

10. При большом объеме совокупности в определенной степени взаимопогашаются:

а) арифметические ошибки наблюдения;

б) логические ошибки наблюдения;

в) систематические ошибки наблюдения;

г) случайные ошибки наблюдения.

 

№ п\п Задание
Определите форму и вид статистического наблюдения:
Годовая отчетность промышленных предприятий о проиводственно-хозяйственной деятельности
Ежедневная регистрация пациентов, поступивших в стационар лечебного учреждения
Перепись крупного рогатого скота
Определите объект и единицу статистического наблюдения
Перепись населения страны
Обследование сельхозпроиводителей Омской области
Обследование уровня жизни жителей Саратовской области
С помощью логического и арифметического контроля выявите ошибки в следующем формуляре (дата заполнения формуляра – 1 марта 2004 года)
1. Пол
Женский
2. Возраст
8 лет
3. Национальность
русская
4. Дата рождения
5 марта 1955 года
Сформулируйте цель проведения статистического наблюдения
Перепись населения
Обследование сельхозпроиводителей Омской области

 

 

1.2. Требования, предъявляемые

к статистическим данным. Формы и виды

статистического наблюдения

Основной задачей государственной статистики является фор­мирование государственных информационных ресурсов. Это до­стигается посредством статистического наблюдения. Адекватность отражения важнейших социально-экономических процессов, про­исходящих в стране, во многом зависит от используемых методов сбора и обработки первичных данных. В настоящее время нет стан­дартного определения качества данных, принято отмечать два ос­новных требования к материалам статистического наблюдения: до­стоверность и сопоставимость.

Достоверность — это соответствие первичных данных фактиче­скому положению. Исходя из практической потребности, достовер­ность обычно описывают в терминах ошибок. Для предупреждения ошибок наблюдения выявляют их виды и причины возникновения. Ошибки наблюдения подразделяют на два вида: ошибки регистра­ции и ошибки репрезентативности.

Ошибки регистрации — это погрешности, которые возможны независимо от вида наблюдения. Они бывают случайными и си­стематическими (тенденциозными). Существуют преднамеренные ошибки, причиной которых становится сознательное искажение данных. Непреднамеренные ошибки, как правило, носят случай­ный характер, они могут возникнуть в результате низкой квалифи­кации работников.

Ошибки репрезентативности присущи только выборочному на­блюдению. Причина их возникновения заключается в том, что вы­борочная совокупность недостаточно точно отображает состав всей изучаемой совокупности. Подробнее о таких ошибках говорится в гл. 5.

Сопоставимость статистических данных рассматривается в раз­ных аспектах:

1) сопоставимость в рамках одного наблюдения;

2) сопоставимость данных разных наблюдений;

3) сравнимость с данными прошлых исследований.

Причины различий могут быть вызваны организационно-ме­тодологическими факторами, влияющими на изменение методики сбора данных, времени регистрации и т.п.

В настоящее время устанавливается более широкое понятие ка­чества статистических данных с точки зрения их адаптации к по­требностям пользователей. К компонентам такого определения ка­чества, наряду с сопоставимостью и достоверностью, относятся востребованность, доступность, интерпретируемость.

Достижение необходимого уровня качества результатов стати­стической деятельности требует соблюдения научно разработан­ных методик сбора, обработки и распространения статистических данных (включая соответствие принятым международным стан­дартам).

Статистическое наблюдение — первая стадия статистическо­го исследования, представляющая собой организованный по еди­ной программе сбор данных о социально-экономических явлениях и процессах путем регистрации их существенных признаков с це­лью получения первичной статистической информации.

Различают формы организации и виды статистического наблю­дения, источники получения первичных данных и способы сбора данных.

К формам организации относятся:

— отчетность;

—специально организованное наблюдение.
Виды наблюдения делят:

— по времени регистрации фактов на непрерывное (текущее),
периодическое и единовременное;

—охвату единиц на сплошное и несплошное.
Источниками получения первичных данных являются:

—непосредственное наблюдение;

—документальный способ;

—опрос.

К способам сбора данных относятся:

—экспедиционный;

—саморегистрация;

—корреспондентский.

Организация статистического наблюдения предполагает реше­ние определенных программно-методологических вопросов:

• конкретизация цели и формулировка задач статистического
исследования;

• составление программ наблюдения и разработки полученной статистической информации;

• ограничение обследуемой совокупности (установление ее ра­мок);

• создание статистической основы (для выборочного наблюде­ния — основы выборки), определение ее единицы и единицы на­блюдения;

• выбор метода наблюдения (для выборочного наблюдения — установление оптимального процента отбора);

• формирование выборочной совокупности;

• сбор и редактирование первичной информации, включающее логический и арифметический способы контроля, основанные на
соотношениях между связанными пунктами вопросника и допу­стимыми значениями статистических признаков, представленных респондентами.

 

Количественные признаки могут выражаться дискретными или непрерывными величинами, соответственно, и вариационный ряд будет либо дискретным, либо интервальным (непрерывным в пределах интервала). Так, количество детей в семье может выражаться только целыми числами, а вес человека может отличаться от веса другого на сколь угодно малую величину, определяемую точностью измерения.

При построении вариационного ряда непрерывного признака невозможно указать абсолютно точное значение варианта, поэтому совокупность распределяется по интервалам его значений. Интервалы можно брать как равные, так и неравные. Для каждого из них указывается частота или частость, т.е. абсолютное или относительное число единиц, у которых значение признака находится внутри данного интервала.

Первый и последний интервалы рядов чаше всего берутся открытыми. Использование открытых интервалов удобно, когда в совокупностях встречается незначительное число единиц с очень малыми или очень большими значениями вариантов, резко отличающимися от всех остальных значений.

Если построен ряд с равными интервалами, то частоты дают представление о том, как заполнен единицами совокупности тот или иной интервал. При сравнении частот ряда с неравными интервалами для характеристики их заполненности рассчитывают плотность распределения. Средняя плотность в интервале — это частное от деления частоты или частости на величину интервала: в первом случае получается абсолютная, во втором — относительная плотность распределения. Средняя плотность показывает, сколько единиц (или сколько процентов единиц) совокупности приходится на единицу изменения варианта.

Для характеристики распределения используют также накопленные частоты. Если вместо абсолютных частот взять частости, то аналогично получим накопленные частости.

Накопленная частота (частость) для данного варианта или для верхней границы данного интервала получается суммированием (накапливанием) частот (частостей) всех предшествующих интервалов, включая данный. Накопленная частота показывает, какое число единиц имеет значение признака, не большее данной варианта или верхней границы интервала. Частота, частость, плотность и накопленная частота вариационного ряда — это различные функции от величины варианта.

Зависимость частот, иди, точнее, плотностей распределения от величины вариантов в идеальном случае может быть представлена в виде некоторой функции, изображаемой графически кривой определенною вида. Любое реальное распределение можно также изобразить схематически в виде некоторой кривой, воспроизводящей основные особенности данного распределения. В зависимости от вида кривых, изображающих распределение, выделяют несколько основных типов распределений. Прежде всего распределения по виду их графического изображения можно разделить на одновершинные и многовершинные. К одновершинным относятся те, в которых один, обычно центральный, вариант имеет наибольшую частоту (точнее, наибольшую плотность распре­деления), частоты же остальных вариантов убывают по мере удаления от центрального. Если частоты убывают одинаково и справа и слева от центрального значения, то такие распределения называются симметричными. Если частоты убывают слева и справа от центра распределения с разной скоростью, то такие распределения называют асимметричными, выделяя при этом распределения, растянутые вправо и влево. Степень асимметрии может быть различной: от совершенно незначительной до крайней, при которой наибольшая частота относится к одному из крайних значений вариантов — самому большому или, наоборот, наименьшему. Различные виды распределений представлены на рис. 3.1.

 

РИСУНОК НЕ ОТСКАНИРОВАЛСЯ

 

 

Идеальное симметричное распределение крайне редко встречается на практике. Достаточно близки к нему распределения мужчин и женщин по несу или росту (при достаточно большом количестве людей, включенных в совокупность). Основная масса распределений, с которыми приходится иметь дело экономисту. — это асимметричные распределения с разной степенью асимметрии.

Многовершинные распределения - это распределения, в которых несколько центров, т.е. такие, у которых несколько максимумов частот. Многовершинность распределения часто является свидетельством того, что совокупность состоит из неоднородных, с точки зрения изучаемою признака, единиц. Поэтому, убедившись в том. что распределение имеем более чем один максимум частоты, исследователь должен тщательно проверить, можно ли считать однородными единицы совокупности.

В практической деятельности очень важно фактическое распределение (структуру совокупности) привести к известному теоретическому. Обычно в экономических расчетах апроксимируют к таким теоретическим распределениям, как:

нормальное

равномерное

показательное

распределение Пуассона (для дискретных распределений)

Возникает задача проверки соответствия выбранной кривой для представления фактической структуры. т.е. проверки тою, действительно ли различия между теоретической и эмпирической кривой распределения настолько малы, что их можно считать случайными, а не закономерными.

Наиболее известный метод проверки соответствия факти­ческого ряда распределения теоретическому — применение критерия согласия Пирсона. Определяем …. Сравниваем Х²расч с Х²табл при заданном уровне значимости и числе степеней свободы. Если Х²расч < Х²табл , можно считать, что фактическое распределение адекватно теоретическому. Например, имеется следующий интервальный ряд распределения рабочих цеха по уровню заработной платы:

 

Уровень заработной платы, руб. Численность рабочих

До 200 10

200-250 20

250-300 40

300-350 20

350 и более 10

Итого 100

 

Предполагая, что распределение рабочих но уровню заработной платы является нормальным, рассчитаем теоретические частоты распределения (табл. 3.1)

 

Расчет теоретических частот распределения

 

X — f факт   х´ f факт (х´)² f факт   f (t)* Г твор = Округлен-
середины интервалов         = f (t) К= ные теоре-
            = f (t)• 91,29 тические
                частоты
                 
-2 -20 -1,823 0,0761 6,947
-1 -20 20 -0,913 0,2637 24,073
0,0 0,3989 36,416
0,913 0,2637 24,073
1,823 0,0761 6,947
Итого        

· Здесь f (t) — плотность нормального распределения. Для определения используются либо таблицы f (t),. либо непосредственно формула плотности f (t)

Рассчитаем х и а метолом моментов, где центральный момент А = 275, а величина интервала i = 50; x¯ = 275 + 50-0 = 275;

Ð = 50 √(120/100)-0 =54,77

где а — уровень значимости; v — число степеней свободы; L — число групп; r — число параметров распределения;

X²расч < X²табл = распределение является нормальным.

Аналитическая (факторная) группировкапредназначена для установления тесноты связи между взаимодействующими признаками — факторным и результативным. Она позволяет выявить наличие и направление связи, а также измерить ее тесноту и силу. Методологическими вопросами построения факторной группировки являются выбор группировочного признака, определение числа групп и величины интервала, выбор системы показателей для характеристики групп. Если типологическая группировка, преследующая цель разграничения качественно однородных совокупностей, должна отвечать их объективной качественной природе, то для аналитической группировки, цель которой исследование взаимосвязи признаков, такого объективного критерия нет. Поэтому в качестве группировочного чаше всего принимают факторный признак, выделенный на основе априорного анализа. Интервалы в аналитической группировке берутся преимущественно равные либо равнонаполненные (группы с приблизительно одинаковой частотой). Величина интервала рассчитывается так же, как при построении структурной группировки. Среди показателей групп обязательным является среднее значение результативного показателя по каждой группе. Теснота связи оценивается сравнением вариации этих средних значений с обшей дисперсией резуль­тативного показателя. Эмпирический коэффициент детерминации определяется как

 

Статистические сводки и группировки

Сводка — особая стадия статистического исследования, в ходе которой систематизируются первичные материалы стати­стического наблюдения. Проведение сводки включает 3 этапа:

• предварительный контроль материалов, т. е. проверку исходных данных;

• группировку данных по заданным признакам, определе­ние производных показателей;

• оформление результатов сводки в виде статистических таблиц, удобных для восприятия информации.

Предварительный контроль включает логическую проверку данных, т. е. смысловую согласованность сведений, исклю­чение «нелогичных» данных и арифметическую согласованность.

Пример. Рассогласованные данные.

В документах на предприятии обнаружены арифметическая и логическая рассогласованности:

 

 

№ п/п Заработная плата Возраст Общий стаж Непрерывный стаж
Итого      

 

Арифметическая — неправильно определена сумма зара­ботной платы.

В 3-й строке имеется логическая ошибка: человек 25-ти лет неможет иметь общего стажа 45 лет и, кроме того, непрерыв­на стаж, как часть общего, не может его превосходить.

Группировка данных производится в соответствии с програм­мой сводки для того, чтобы впоследствии представить полученную информацию в доступном для восприятия виде.

Группировка— объединение единиц совокупности в некоторые группы, имеющие свои характерные особенности, общие черты и сходные размеры изучаемого признака. Результаты группировки оформляются в виде группировочных таблиц, делающих информацию обозримой. Таблица содержит сводную числовую характеристику ис-1?емой совокупности по одному или нескольким существен-I признакам, взаимосвязанным логикой анализа.

Пример. Основа группированной таблицы. Название таблицы (общий заголовок). Группировочная таблица три вида заголовков: общий, верхний и боковые. Заголовки таблиц должны быть краткими и раскрывать содержание показателей.

 

 

Содержание строк Наименования граф (верхние заголовки)
А
Наименования строк (боковые заголовки)            
Итоговая строка           Итого­вая графа

 

 

Общий заголовок отражает содержание всей таблицы с ука­занием, к какому месту и времени она относится. Он распола­гается над макетом по центру и является внешним заголовком.

Верхние заголовки характеризуют содержание граф (заго­ловки сказуемого), а боковые (заголовки подлежащего) — строк.

Подлежащее статистической таблицы — объект, характе­ризующийся цифрами.

Сказуемое — система показателей, которыми характеризу­ется объект изучения, т. е. подлежащее.

В зависимости от строения подлежащего все статистиче­ские таблицы можно разделить на три группы:

• простые или перечневые;

• групповые;

• комбинационные.

Следует избегать появления клеток, в которых не может быть исходных данных. В клетках, где отсутствуют данные по причине неполноты исходной информации, делают специаль­ные пометки (...; —; НС).

Пример. Группировочная таблица.

Отношение студентов одного из факультетов к понижению размера стипендии (по результатам исследования в январе 2003 г.).

Сказуемое

  Поддерживаю Не поддерживаю Безразлично
Студенты 1-го курса
Студенты 2-го курса
Студенты 3-го курса
Студенты 4-го курса
Студенты 5-го курса
Итого

Подлежащее

Таким образом, группировка – это разделение единиц совокупности на группы по выбранным варьирующим признакам.

Группировки различают:

по задачам систематизации данных;

по числу группировочных признаков;

по используемой информации.

 

Метод группировок применяется для решения задач, воз­никающих в ходе научного статистического исследования:

• выделения социально-экономических типов явлений;

• изучения структуры явления и структурных сдвигов, про­
исходящих в нем;

• выявления связей и зависимостей между отдельными
признаками явления.

Для решения этих задач применяют (соответственно) 3 вида группировок: типологические, структурные и аналитические (факторные).

Типологическиегруппировки предназначаются для выяв­ления качественно однородных групп совокупностей, т.е. объек­тов, близких друг к другу одновременно по всем группировочным признакам. Например, группировка предприятий города по формам собственности.

Структурные— разделение однородной совокупности на группы, характеризующие ее структуру по определенному группировочному признаку. Например, группировка рабочих цеха ж? квалификации.

Аналитические— предназначены для выявления зависи­мости между признаками. Строят аналитические группировки, выделив результирующие, которые изменяются, и факторные, зависимость от которых исследуется. По числу группировочных признаков различают простые(по одному признаку) и сложные(по нескольким признакам — санированные и многомерные).

Комбинированныегруппировки строятся путем разбивки каждой группы на подгруппы в соответствии с дополнительными признаками.

Многомерные— строятся с помощью специальных алгоритмов, когда осуществляется поиск скопления в п-мерном пространстве. где каждый объект — точка, т.е. построить многомерную группировку — найти скопление точек.

При используемой информации различают первичные и вторичные группировки.

Первичные группировки производятся на основе исходных данных, полученных в результате статистических наблюдений.

Вторичные — результат объединения или расщепления первичной группировки.

 

Правила оформления статистических таблиц

Статистическая таблица обязательно имеет заголовок, в котором должны быть указаны цель построения таблицы, тер­ритория и время, к которому относятся данные. Если все еди­ницы измерения одинаковы, то они указываются в заголовке таблицы. Если же они разные — в верхних или боковых заго­ловках таблицы.

Разграфка таблицы должна включать как можно меньше линий — только горизонтальные линии, отделяющие таблицу от ее заголовка; заголовки граф от значений показателей; ито­говую строку таблицы. Вертикальных линий вообще может не быть. Таблица не очерчивается рамкой, если она не включена в текст. Иногда графы сказуемого нумеруются.

4.2. Сводка и группировка материалов статистического наблюдения

В результате первой стадии статистического исследования (статистического наблюдения) получают статистическую ин­формацию, представляющую собой большое количество пер­вичных, разрозненных сведений об отдельных единицах объекта исследования (например, записи о каждом гражданине страны при переписи населения: пол, национальность, возраст, обра­зование, род занятий и другие признаки).

Дальнейшая задача статистики заключается в том, чтобы привести эти материалы в определенный порядок, системати­зировать, и на этой основе дать сводную характеристику всей совокупности фактов при помощи обобщающих статистических показателей, отражающих сущность социально-экономических явлений и определенные статистические закономерности. Это достигается в результате сводки — второй стадии статистиче­ского исследования.

Статистическая сводка — научно организованная обработка материалов наблюдения, включающая в себя систематизацию группировку данных, составление таблиц, подсчет групповых и общих итогов, расчет производных показателей (средних относительных величин). Она позволяет перейти к обобщающим показателям совокупности в целом и отдельных ее час­тей, осуществлять анализ и прогнозирование изучаемых про­цессов.

Если производится только подсчет общих итогов по изу­чаемой совокупности единиц наблюдения, то сводка называет­ся простой. Например, для получения общей численности сту­дентов высших учебных заведений России достаточно сложить данные о численности студентов всех высших учебных заведе­ний (на начало 1995/96 учебного года в государственных вузах страны обучалось 2,66 млн. чел.).

По технике или способу выполнения сводка может быть ручной либо механизированной (с помощью ЭВМ).

Статистическая сводка должна проводиться по опреде­ленным программе и плану.

Программа статистической сводки устанавливает следующие этапы:

• выбор группировочных признаков; определение порядка формирования групп;

• разработка системы статистических показателей для ха­рактеристики групп и объекта в целом;

• разработка макетов статистических таблиц для представ­ления результатов сводки.

 

ПЛАН статистической сводки содержит указания о последовательности и сроках выполнения отдельных частей сводки, ее исполнителях и порядке изложения и представления результатов

В сводке статистического материала отдельные единицы статистической совокупности объединяются в группы при по­чет ода группировок.

Статистическая группировка — процесс образования однородных групп на основе расчленения статистической совокупностина части или объединения изучаемых единиц в частные совокупности по существенным для них признакам, каждая характеризуется системой статистических показателей. Например, группировка промышленных предприятий по формам собственности, населения по размеру среднедушевого дохода, коммерческих банков по сумме активов баланса и т.д.

Особым видом группировок является классификация. Представляющая собой устойчивую номенклатуру классов и групп, образованных на основе сходства и различия единиц изучаемо­го объекта. Классификация выступает в роли своеобразного статистического стандарта, устанавливаемого на определенный промежуток времени, например, ЕГРПО, Общероссийский клас­сификатор видов экономической деятельности, продукции и услуг (ОКДП), классификация основных фондов в промыш­ленном строительстве, капитальных вложений, затрат на про­изводство и др.

Метод статистических группировок позволяет разрабаты­вать первичный статистический материал. На основе группи­ровки рассчитываются сводные показатели по группам, появля­ется возможность их сравнения, анализа причин различий меж­ду группами, изучения взаимосвязей между признаками. Рас­чет сводных показателей в целом по совокупности позволяет изучить ее структуру.

Кроме того, группировка создает основу для последующей сводки и анализа данных. Этим определяется роль группировок как научной основы сводки.

Большие достижения в области применения метода груп­пировок имеет современная отечественная статистика. Вве­дение группировочных таблиц, содержащих показатели меж­дународной СНС, превращает группировки (классификации) в эффективный метод анализа и вскрытия резервов в эконо­мике.

 

 

4.3. Выполнение группировки по количественному признаку

При составлении структурных группировок на основе варь­ирующих количественных признаков необходимо определить количество групп и интервалы группировки.

Интервал — количественное значение, отделяющее одну единицу (группу) от другой, т. е. он очерчивает количествен­ные границы групп.

Как правило, величина интервала представляет собой раз­ность между максимальным и минимальным значениями при­знака в каждой группе.

Вопрос о числе групп и величине интервала следует решать с учетом обстоятельств, прежде всего исходя из целей иссле­дования, значения изучаемого признака и т. д.

Количество групп и величина интервала связаны между собой: чем больше образовано групп, тем меньше интервал, и наоборот. Количество групп зависит от числа единиц иссле­дуемого объекта и степени колеблемости группировочного при­знака. При небольшом объеме совокупности нельзя образовы­вать большое число групп, так как группы будут малочислен­ными.

При определении количества групп необходимо стре­миться к тому, чтобы были учтены особенности изучаемого явления. Поэтому количество групп должно быть оптимальным, в каждую группу должно входить достаточно большое число единиц совокупности, что отвечает требованию закона больших чисел. Однако в отдельных случаях представля­ет интерес и малочисленные группы: новое, передовое, пока не станет массовым, проявляется в незначительном числе фактов; поэтому задача статистики — выделить эти факты, изучить их.

Таким образом, при решении вопроса о численности единиц в группах нужно руководствоваться не формальными признаками, а знанием сущности изучаемого явления.

На количество выделяемых групп существенное влияние оказывает степень колеблемости группировочного признака: чем она больше, тем больше следует образовать групп.

Ориентировочно определить оптимальное количество групп с равнымиинтервалами можно по формуле американского ученого Стерджесса

 

N 15-24 25-44 45-89 90-179 180-359 360-719
n 6 7

 

Формула Стерджесса пригодна при условии, что распре­деление единиц совокупности по данному признаку приближа­ется к нормальному, и при этом применяются равные интерва­лы в группах. Чтобы получить группы, адекватные действи­тельности, необходимо руководствоваться сущностью изучае­мого явления.

Интервалы могут быть равные и неравные. При исследо­вании экономических явлений могут применяться неравные (прогрессивно возрастающие, прогрессивно убывающие) ин­тервалы. Так, например, по численности работающих про­мышленные предприятия могут быть разбиты на следующие группы: до 100 чел., 100-200; 200-300; 300-500; 500-1000; 1000 и более человек. Это объясняется тем, что количествен­ные изменения размера признака имеют неодинаковые зна­чения в низших и высших по размеру признака группах; из­менение количества работающих на 50-100 чел. имеет суще­ственное значение для мелких предприятий, а для крупных — не имеет.

Группировки с равными интервалами целесообразны в тех , случаях, когда вариация проявляется в сравнительно узких гра­ницах и распределение является практически равномерным (на­пример, при группировке рабочих одной профессии по размеру заработной платы, посевов какой-либо культуры — по урожай­ности).

Для группировок с равными интервалами величина ин­тервала

 

 

I= (X max – X min) /n

X max, X max – наибольшее и наименьшее значения признака, n- число групп.

Если, например, требуется произвести группировку с рав­ными интервалами по данным об уровне месячной заработной платы рабочих, которая в 2006 г. колебалась в пределах от 600-до 7500 руб., и необходимо при этом выделить 5 групп, то ве­личина интервала, в рублях, составит:

 

I =(7500-6000) /5 = 300

Если в результате деления получится нецелое число и воз­никнет необходимость в округлении, то округлять нужно, как правило, в большую сторону, а не в меньшую.

Прибавляя к минимальному значению признака (в данном случае 6000 тыс. руб.) найденное значение интервала, получа­ем верхнюю границу первой группы, тыс. руб.:

6000 + 300 = 6300.

Прибавляя далее значение интервала к верхней границе первой группы, получаем верхнюю границу второй группы

6300 + 300 = 6600, и т. д.

В результате получим такие группы рабочих по размеру заработной платы, руб.:

6000-6300; 6300-6600; 6600-6900; 6900-7200; 7200-7500.

В этом распределении имеет место неопределенность: к группе, например, отнести рабочего с заработком в 6300 первой или второй? Для устранения неопределенности открывают един из крайних интервалов или используют принцип единообразия — левое число включает в себя обозначенные, а правое — не включает. Значит рабочий, получающий 6300 руб., должен быть отнесен ко второй группе. Аналогично нужно поступать в отношении всех остальных групп могут быть закрытыми, когда указаны верхняя границы (как в приведенном примере), и открытыми, когда указана лишь одна из границ (первый или интервалы, величина которых принимается равной величине смежных с ними интервалов). Во втором случае, чтобы показать, что рабочий с заработной платой, равной, например, верхней границе интервала, включается в последнюю группу, ее следует обозначить «7500 и выше». И наоборот, чтобы значение, равное верхней границе интервала, не входит в данную группу, последнюю группу нужно обозначить «свыше 750». Подобные функции выполняют слова «до», «ме­нее» и «более».

Все сказанное выше относится к группировкам, которые производятся на основе анализа первичного статистического материала. Но иногда приходится пользоваться уже имею­щимися группировками, которые не удовлетворяют требова­ниям анализа. Например, имеющиеся группировки могут быть несопоставимы из-за различного числа выделенных групп или неодинаковых границ интервалов. Для приведе­ния таких группировок к сопоставимому виду в целях их дальнейшего сравнительного анализа используется метод вторичной группировки, являющейся особым видом группи­ровки.

Вторичная группировка — образование новых групп на ос­нове ранее осуществленной группировки.

Получение новых групп на основе имеющихся возможно двумя способами перегруппировки: объединением первоначаль­ных интервалов (путем их укрупнения) и долевой перегруппи­ровкой (на основе закрепления за каждой группой определен­ной доли единиц совокупности).

Использование вторичной группировки для приведения двух группировок с различными интервалами к единому виду рас­смотрим, на примере распределения акционеров двух районов области по размеру дивидендов на одну акцию в 1996 г. (по условным данным табл. 4.1).

Приведенные данные не позволяют сравнить распределе­ние акционеров двух районов по размеру дивидендов на одну акцию, так как в этих районах имеется различное число групп акционеров, и, кроме того, различны величины интервалов.

Необходимо ряды распределения привести к сопоста­вимому виду. За основу сравнения возьмем структуру рас­пределения акционеров второго района (как наиболее круп­ную). Следовательно, по первому району нужно произвести вторичную группировку или перегруппировку акционеров, образовав такое же число групп и с теми же интервалами, как во втором районе.