Содержание
1 Группировка данных 2
2 Корелляционно-регрессионный анализ 11
3 Временные ряды 19
4 Индексы 22
Список литературы 29
1
Группировка данных
Одним из основных наиболее распространенных методов обработки и анализа первичной статистической информации является группировка.
Под группировкой понимают расчленение единиц статистической совокупности на группы, однородные в каком-либо существенном отношении, и характеристику таких групп системой показателей в целях выделения типов явлений, изучения структуры и взаимосвязей. Следовательно, с помощью группировок решаются три задачи:
* разделение всей совокупности на качественно однородные группы - выделение социально-экономических типов. Эти группировки называются типологическими (например, группировки хозяйственных объектов по формам собственности, населения по общественным группам и др.);
* характеристика структуры явления и структурных сдвигов. Эти группировки называются структурными (например, определение значения каждого вида транспорта в транспортном балансе страны, изучение состава населения по полу, возрасту и другим признакам и т. д.);
* изучение взаимосвязей между отдельными признаками изучаемого явления. Такие группировки называются аналитическими (например, группировка предприятий определенной отрасли экономики по уровню производительности труда для выявления ее влияния на себестоимость продукции)1.
Разграничение трех видов группировки является в известной мере условным. Во многих случаях одна и та же группировка дает возможность решать все три задачи.
Группировка является аналитико-синтетическим процессом. Выделенные при группировке однородные части, отличающиеся друг от друга качеством или условиями своего развития, детально изучаются. После этого решается синтетическая задача - отражение процесса в целом, т. е. характеристика соотношения между выделенными группами.
Признак, на основе которого производится подразделение единиц наблюдения на группы, называется группировочным признаком или основанием группировки. Группировка может выполняться по одному признаку (простая группировка) и по нескольким признакам (комбинированная группировка).
Выбор группировочных признаков всегда должен быть основан на анализе качественной природы изучаемого явления. Всесторонний теоретико-экономический анализ сущности и закономерностей развития явления должен быть направлен на то, чтобы в соответствии с целью исследования положить в основание группировки существенные признаки.
Группировочные признаки могут быть атрибутивными и количественными. Атрибутивные признаки регистрируются в виде текстовой записи (например, профессия рабочих, социальная группа населения). Количественные признаки имеют цифровое выражение (стаж работы, размер дохода).
При группировке по атрибутивному признаку число групп определяется количеством соответствующих наименований, если число этих наименований не очень велико. Если признак имеет большое количество разновидностей, то при группировке ряд наименований объединяют в одну группу. Для обоснованного объединения их в группы разрабатываются классификации. В отличие от группировок при классификации Группировочные признаки установлены заранее на длительный период для решения многих задач, в то время как группировки выполняются для целей конкретного исследования. Примерами могут служить классификации отраслей экономики, автотранспортных предприятий по целевому назначению (грузовые, автобусные, таксомоторные и др.).
При группировке по количественному признаку число групп определяется в зависимости от характера изменения признака и задач исследования. Если количественный признак меняется прерывно (дискретно), т. е. может принимать только некоторые - чаще целые значения (например, тарифный разряд рабочих), то число групп должно соответствовать количеству значений признака.
При непрерывном изменении признак принимает любые значения (например, стаж работы или возраст рабочих), поэтому группы ограничиваются значениями признака в интервале "от - до". Интервалом называется разница между максимальным и минимальным значениями признака в каждой группе. На практике используются три вида интервалов: равные, неравные (постепенно увеличивающиеся) и специализированные.
Равные интервалы используются, если нужно охарактеризовать количественные различия в величине признака внутри групп одинакового качества (например, при группировке рабочих определенной профессии по проценту выполнения норм выработки).
Величина равного интервала исчисляется по формуле
хmax, хmin - соответственно наибольшее и наименьшее значения признака в изучаемой совокупности;
т - принятое число групп.
Для расчета величины интервала по этой формуле необходимо заранее установить число групп (при числе наблюдений более 200 используют 10-15 групп).
Возможен и другой способ определения величины интервала, не требующий предварительного установления числа групп. В этом случае используется формула Стерджесса:
где п - число наблюдений.
Выполняя расчет величины интервала по этой формуле, следует знаменатель предварительно округлить до целого числа, поскольку количество групп не может быть дробным.
Величину интервала обычно округляют до целого (всегда большего) числа, исключение составляют случаи, когда изучаются малейшие колебания признака.
Приведем пример: Исследована группа студентов на тесты IQ. Результаты статистических наблюдений представлены в таблице 1. Построить интервальный вариационный ряд.
Таблица 1
94
103
107
85
102
82
87
84
105
104
86
107
68
76
75
100
105
89
86
69
73
68
96
109
84
88
85
83
78
85
108
78
82
87
80
79
75
105
75
79
78
66
64
82
95
76
80
74
70
89
93
89
102
102
75
89
102
86
85
105
110
102
108
104
86
86
105
107
108
107
Ориентировочно определить оптимальное количество групп с равными интервалами можно по формуле Стерджесса:
n=1+3,322 lgN,
где N - число единиц совокупности,
Используя эту формулу получим следующее соотношение:
n=1+3,322*lg70=10,12
принимаем n=10.
Для группировок с равными интервалами величина интервала составляет i=(xmax-xmin)/n=(110-64)/10?5.
где xmax, xmin - наибольшее и наименьшее значение признака соответственно;
n - число групп.