Содержание



1        Группировка данных        2

2        Корелляционно-регрессионный анализ        11

3        Временные ряды        19

4        Индексы        22

Список литературы        29

1

Группировка данных

     Одним из основных наиболее распространенных методов обработки и анализа первичной статистической информации является группировка.

     Под группировкой понимают расчленение единиц статистической совокупности на группы, однородные в каком-либо существенном отношении, и характеристику таких групп системой показателей в целях выделения типов явлений, изучения структуры и взаимосвязей. Следовательно, с помощью группировок решаются три задачи:

* разделение всей совокупности на качественно однородные группы - выделение социально-экономических типов. Эти группировки называются типологическими (например, группировки хозяйственных объектов по формам собственности, населения по общественным группам и др.);

* характеристика структуры явления и структурных сдвигов. Эти группировки называются структурными (например, определение значения каждого вида транспорта в транспортном балансе страны, изучение состава населения по полу, возрасту и другим признакам и т. д.);

* изучение взаимосвязей между отдельными признаками изучаемого явления. Такие группировки называются аналитическими (например, группировка предприятий определенной отрасли экономики по уровню производительности труда для выявления ее влияния на себестоимость продукции)1.

     Разграничение трех видов группировки является в известной мере условным. Во многих случаях одна и та же группировка дает возможность решать все три задачи.

     Группировка является аналитико-синтетическим процессом. Выделенные при группировке однородные части, отличающиеся друг от друга качеством или условиями своего развития, детально изучаются. После этого решается синтетическая задача - отражение процесса в целом, т. е. характеристика соотношения между выделенными группами.

     Признак, на основе которого производится подразделение единиц наблюдения на группы, называется группировочным признаком или основанием группировки. Группировка может выполняться по одному признаку (простая группировка) и по нескольким признакам (комбинированная группировка).

     Выбор группировочных признаков всегда должен быть основан на анализе качественной природы изучаемого явления. Всесторонний теоретико-экономический анализ сущности и закономерностей развития явления должен быть направлен на то, чтобы в соответствии с целью исследования положить в основание группировки существенные признаки.

     Группировочные признаки могут быть атрибутивными и количественными. Атрибутивные признаки регистрируются в виде текстовой записи (например, профессия рабочих, социальная группа населения). Количественные признаки имеют цифровое выражение (стаж работы, размер дохода).

     При группировке по атрибутивному признаку число групп определяется количеством соответствующих наименований, если число этих наименований не очень велико. Если признак имеет большое количество разновидностей, то при группировке ряд наименований объединяют в одну группу. Для обоснованного объединения их в группы разрабатываются классификации. В отличие от группировок при классификации Группировочные признаки установлены заранее на длительный период для решения многих задач, в то время как группировки выполняются для целей конкретного исследования. Примерами могут служить классификации отраслей экономики, автотранспортных предприятий по целевому назначению (грузовые, автобусные, таксомоторные и др.).

     При группировке по количественному признаку число групп определяется в зависимости от характера изменения признака и задач исследования. Если количественный признак меняется прерывно (дискретно), т. е. может принимать только некоторые - чаще целые значения (например, тарифный разряд рабочих), то число групп должно соответствовать количеству значений признака.

     При непрерывном изменении признак принимает любые значения (например, стаж работы или возраст рабочих), поэтому группы ограничиваются значениями признака в интервале "от - до". Интервалом называется разница между максимальным и минимальным значениями признака в каждой группе. На практике используются три вида интервалов: равные, неравные (постепенно увеличивающиеся) и специализированные.

     Равные интервалы используются, если нужно охарактеризовать количественные различия в величине признака внутри групп одинакового качества (например, при группировке рабочих определенной профессии по проценту выполнения норм выработки).

     Величина равного интервала исчисляется по формуле

     хmax, хmin - соответственно наибольшее и наименьшее значения признака в изучаемой совокупности;

     т - принятое число групп.

     Для расчета величины интервала по этой формуле необходимо заранее установить число групп (при числе наблюдений более 200 используют 10-15 групп).

     Возможен и другой способ определения величины интервала, не требующий предварительного установления числа групп. В этом случае используется формула Стерджесса:

     где п - число наблюдений.

     Выполняя расчет величины интервала по этой формуле, следует знаменатель предварительно округлить до целого числа, поскольку количество групп не может быть дробным.

     Величину интервала обычно округляют до целого (всегда большего) числа, исключение составляют случаи, когда изучаются малейшие колебания признака.

     Приведем пример: Исследована группа студентов на тесты IQ. Результаты статистических наблюдений представлены в таблице 1. Построить интервальный        вариационный        ряд.

     Таблица 1

94

103

107

85

102

82

87

84

105

104

86

107

68

76

75

100

105

89

86

69

73

68

96

109

84

88

85

83

78

85

108

78

82

87

80

79

75

105

75

79

78

66

64

82

95

76

80

74

70

89

93

89

102

102

75

89

102

86

85

105

110

102

108

104

86

86

105

107

108

107

     

     Ориентировочно определить оптимальное количество групп с равными интервалами можно по формуле Стерджесса:

     n=1+3,322 lgN,

     где N - число единиц совокупности,

     Используя эту формулу получим следующее соотношение:

     n=1+3,322*lg70=10,12

     принимаем  n=10.

     Для группировок с равными интервалами величина интервала составляет  i=(xmax-xmin)/n=(110-64)/10?5.

     где xmax, xmin - наибольшее и наименьшее значение признака соответственно;

     n - число групп.