ДОПОЛНИТЬ ПО ВОПРОСАМ ИЗ УЧЕБНИКОВ
СТАТИСТИЧЕСКИЕ ТАБЛИЦЫ
Тема 4
КОНТРОЛЬНЫЕ ВОПРОСЫ
Задача 2.3
Кривая Лоренца. Оценки концентрации показателя статистической совокупности.
Особым случаем можно считать картодиаграммы, на которых характеристики измерений накладываются на картографический образ территории.
Например.
Наряду с распределением числа единиц совокупности по какому-либо признаку часто представляет интерес и распределение по этим же группам определенного суммарного показателя(у). Последнее может быть равномерным (т.е. соответствующим распределению числа единиц) и неравномерным (т.е. сконцентрированным в отдельных группах).
Для изучения степени неравномерности распределения определенного суммарного показателя между единицами отдельных групп вариационного ряда используются кривая Лоренца(или кривая концентрации – см. ниже) и рассчитанный на ее основе коэффициент Джини (G - см. ниже).
Рассмотрим их построение на конкретном примере.
Пусть имеются следующие распределение городов по числу жителей и распределение населения по этим группам городов в одном из государств (графы 1, 2, 3 таблицы):
Группа | Число городов, % к итогу | Численность населения, % к итогу | Кумулятивные итоги | |
городов с числом жителей, тыс. чел. | % городов cum Wj (или р) | % населения cumdv | ||
ДоЗ | 4,2 | 0,2 | 4,2 | 0,2 |
3-5 | 4,6 | 0,3 | 8,8 | 0,5 |
5-10 | 13,1 | 1,7 | 21,9 | 2,2 |
10-20 | 28,3 | 6,8 | 50,2 | 9,0 |
20-50 | 28,7 | 14,8 | 78,9 | 23,8 |
50-100 | 9,7 | 10,3 | 88,6 | 34,1 |
100-500 | 9,7 | 33,8 | 98,3 | 67,9 |
Свыше 500 | 1,7 | 32,1 | 100,0 | 100,0 |
Итого | 100,0 | 100,0 | - | - |
Построим кривую Лоренца для распределения населения по выделенным группам городов с разным числом жителей.
Следует иметь в виду, что для построения кривой Лоренца и распределение единиц совокупности (числа городов), и распределение суммарного показателя (численности населения в городах) должны быть представлены, прежде всего, в относительных величинах, т.е. в долях или процентах, а затем для обоих распределений рассчитаны накопленные (кумулятивные) итоги.
В нашем примере накопленные (кумулятивные) итоги частостей (долей) городов в процентах обозначены как сит wi, или рi, (графа 4), а долей населения в них — как cum dyi. или qt (графа 5). Символы pi для накопленных частостей числа единиц совокупности и qi для накопленных долей распределяемого в них суммарного показателя в последнее время все чаще встречаются в учебной литературе.
Чтобы графически показать неравномерность распределения населения по отдельным группам городов, строим квадрат 100 х 100 и на оси абсцисс откладываем значения кумулятивных итогов процента городов, а на оси ординат — значения кумулятивных итогов процента численности населения в них. Для каждой пары значений кумулятивных итогов находим точку пересечения на графике, проводя перпендикуляры к осям. Затем по точкам пересечения перпендикуляров к осям вычерчиваем кривую, которая и носит название кривой Лоренца(рис. 7).
Если бы каждому проценту накопленных (кумулятивных) частостей городов соответствовал такой же процент населения в них, то все точки расположились бы по диагонали квадрата и это означало бы равномерное распределение населения по выделенным группам городов. Естественно, чем больше фактическое распределение двух показателей отклоняется от равномерного, тем больше кривая Лоренца удалена от диагонали. Следовательно, чем больше это удаление (вогнутость), тем выше концентрация изучаемого показателя (в нашем примере — численности населения) в опре-деленных группах единиц (в нашем примере — в крупных городах).
Если значения признака в группах вариационного ряда даны в порядке убывания (от большего к меньшему), то построенная по таким данным кривая Лоренца будет расположена выше диаго-нали в форме выпуклости.
Несколько кривых Лоренца, построенных на одном квадрате, позволяют сравнивать уровень концентрации изучаемого показа-теля в разное время или по разным объектам.
Для количественного измерения степени концентрации имеется ряд показателей. Наиболее часто используется для этой цели так называемый коэффициент Джини(G). По своей сути он представляет собой отношение площади (S1), ограниченной линией равномерного распределения (диагональю квадрата) и кривой Лоренца, к половине площади квадрата (S1 +S2), т.е.
Площадь S2 можно представить как сумму площадей одного треугольника и нескольких прямоугольных трапеций, образованных кривой Лоренца, с основаниями wi и сторонами qi-1 и qi (см. рис. 7), т.е. приближенно площадь S2 можно определить как
где qi-1= q0 = 0, a qn= 1.
Тогда коэффициент Джини выразится следующей формулой:
Значение коэффициента Джини G=0,7 свидетельствует о сильной концентрации населения в крупных городах.
Коэффициент Джини приближенно может быть рассчитан и по другой формуле:
Используя эту формулу, получим в нашем примере тот же результат, что и по формуле (1):
(Если пользоваться в расчетах не кумулятивными долями, а процентами, то результат вычисления надо разделить на 10000.)
Кроме коэффициента Джини для измерения степени концентрации определенного суммарного показателя по выделенным группам единиц совокупности могут быть использованы и другие показатели, например коэффициент Лоренца и коэффициент Герфиндаля.
Коэффициент Лоренца(L) рассчитывается как полусумма разностей доли единиц совокупности (частостей wi) и доли изучаемого суммарного показателя (dyi) по всем группам, т.е. по формуле
(Если wiи dyi выражены в процентах, то в знаменателе вместо 2 ставится 200.)
Коэффициент Герфиндаля(H) рассчитывается как сумма квадратов долей изучаемого суммарного показателя по всем группам, т.е.
В коэффициенте Герфиндаля dyi можно записать по-разному в зависимости от условного обозначения распределяемого суммарного показателя. Например, если речь идет о производстве продукции по группам предприятий, то, обозначив ее через Qi а долю
Для распределения численности работающих (Т) по отдельным группам предприятий коэффициент Герфиндаля будет выглядеть
Коэффициент Джини в статистической практике часто используется для характеристики распределения общего объема денежных доходов по отдельным группам населения.
1. В чем суть и каково значение сводки как второго этапа статистического исследования?
2. Что такое централизованная и децентрализованная сводка?
3. Какова роль группировок в статистике?
4. Какие группировки называют простыми и какие комбинационными?
5. Что такое вторичная группировка?
6. Что представляют собой ряды распределения?
7. Что такое вариационный ряд?
8. Как строятся вариационные ряды по дискретному и непрерывному признакам с равными и неравными интервалами?
9. Что такое полигон и гистограмма?
10. Как строятся кумулята и огива?
11. Что представляет собой кривая Лоренца и каково ее значение в анализе?
12. Как рассчитываются коэффициенты Джини, Лоренца и Герфиндаля?
Результаты обработки и сводки статистических данных, как правило, оформляются в статистические таблицы.В каждой таблице есть свое подлежащее и сказуемое. Подлежащее— это совокупность или ее части, которые подвергаются характеристике. Сказуемое— все показатели, характеризующие подлежащее.
Выделяют простые, групповые и комбинационные таблицы, таблицы с простой и сложной разработкой сказуемого.
К числу простыхотносятся таблицы, в подлежащем которых дается простой перечень отдельных территориальных единиц, отраслей экономики или других объектов, а также таблицы, характеризующие динамику тех или иных показателей, как, например, следующая:
Некоторые социально-экономическиепоказатели по РФ.
Год | ||||||
Численность населения (на конец года), млн чел. | 146,3 | 145,6 | 145,0 | 144,2 | 143,5 | 142,8 |
Среднегодовая численность занятых в экономике, млн чел. | 64,5 | 65,0 | 65,6 | 66,0 | 66,4 | 67,0 |
Численность населения с душевым доходом ниже прожиточного минимума, % | 27,5 | 24,6 | 23,4 | 20,3 | 17,6 | |
Индекс ВВП, % к предыдущему году | 105,1 | 104,7 | 107,3 | 107,9 | 106,4 |
Если в подлежащем таблицы имеется группировка единиц изучаемой совокупности по одному признаку, то такая таблица называется групповой,например макет таблицы с группировкой хозяйств области по размеру посевных площадей:
Группа хозяйств с размером посевной площади, га | Число хозяйств | Общая посевная площадь, га | Валовой сбор зерновых, Ц | Средняя урожайность, Ц/га |
До 5000 5000-10000 10000-25000 25000-50000 Свыше 50000 | ||||
Итого |
Групповой является также приводимая ниже таблица, в подлежащем которой выделены группы магазинов РФ по размерам торговой площади на 1 января 1994 г.:
Группа магазинов с торговой площадью, м2 | Число магазинов | Розничный товарооборот в IV квартале 1993 г., % к итогу | |
тыс. | % к итогу | ||
До 20 | 6,9 | 1,7 | |
20-30 | 8,5 | 2,1 | |
30-50 | 18,5 | 6,1 | |
50-100 | 30,1 | 15,2 | |
100-160 | 16,5 | 13,1 | |
160-250 | 8,6 | 13,1 | |
Свыше 250 | 10,9 | 48,7 | |
Итого | 100,0 | 100,0 |
В подлежащем комбинационнойтаблицы содержится группировка по двум или нескольким признакам, например группировка хозяйств по размеру посевной площади и по числу коров.
Сказуемое в таблицах тоже может быть разработано по-разному. Различают простую и сложную разработки сказуемого. При простой разработке сказуемоговсе его показатели располагаются независимо друг от друга, например, дается характеристика студентов-заочников института:
Курс | Численность студентов заочников | |||||
Всего | мужчин | женщин | москвичей | иногородних | ||
I II | ||||||
III | ||||||
IV | ||||||
Простая разработка сказуемого имелась и во всех приведенных ранее примерах таблиц. При сложной разработке сказуемогопоказатели сказуемого сочетаются друг с другом, как, например, в приведенном ниже макете таблицы, где каждый показатель сказуемого дается раздельно для мужчин и женщин:
Курс | Численность студентов | ||||||||
москвичей | иногородних | Всего | |||||||
Итого | муж. | жен. | Итого | муж. | жен. | Итого | муж. | жен. | |
I II III IV | |||||||||
Всего |
Следует помнить, что при построении любой статистической таблицы нужно исходить из цели исследования и содержания обрабатываемого материала.