ДОПОЛНИТЬ ПО ВОПРОСАМ ИЗ УЧЕБНИКОВ

СТАТИСТИЧЕСКИЕ ТАБЛИЦЫ

Тема 4

КОНТРОЛЬНЫЕ ВОПРОСЫ

Задача 2.3

Кривая Лоренца. Оценки концентрации показателя статистической совокупности.

Особым случаем можно считать картодиаграммы, на которых характеристики измерений накладываются на картографический образ территории.

Например.

 

 

 

 

 

 

 

 

Наряду с распределением числа единиц совокупности по како­му-либо признаку часто представляет интерес и распределение по этим же группам определенного суммарного показателя(у). Послед­нее может быть равномерным (т.е. соответствующим распределению числа единиц) и неравномерным (т.е. сконцентрированным в от­дельных группах).

Для изучения степени неравномерности распределения опре­деленного суммарного показателя между единицами отдельных групп вариационного ряда используются кривая Лоренца(или кривая концентрации – см. ниже) и рассчитанный на ее основе коэффициент Джини (G - см. ниже).

Рассмотрим их построение на конкретном примере.

Пусть имеются следующие распределение городов по числу жителей и распределение населения по этим группам городов в одном из государств (графы 1, 2, 3 таблицы):

 

 

 

Группа Число городов, % к итогу Численность населения, % к итогу   Кумулятивные итоги
городов с числом жителей, тыс. чел. % городов cum Wj (или р) % населения cumdv    
ДоЗ 4,2 0,2 4,2 0,2
3-5 4,6 0,3 8,8 0,5
5-10 13,1 1,7 21,9 2,2
10-20 28,3 6,8 50,2 9,0
20-50 28,7 14,8 78,9 23,8
50-100 9,7 10,3 88,6 34,1
100-500 9,7 33,8 98,3 67,9
Свыше 500 1,7 32,1 100,0 100,0
Итого 100,0 100,0 - -

 

Построим кривую Лоренца для распределения населения по выделенным группам городов с разным числом жителей.

Следует иметь в виду, что для построения кривой Лоренца и распределение единиц совокупности (числа городов), и распреде­ление суммарного показателя (численности населения в городах) должны быть представлены, прежде всего, в относительных величи­нах, т.е. в долях или процентах, а затем для обоих распреде­лений рассчитаны накопленные (кумулятивные) итоги.

В нашем примере накопленные (кумулятивные) итоги частостей (долей) городов в процентах обозначены как сит wi, или рi, (графа 4), а долей населения в них — как cum dyi. или qt (графа 5). Символы pi для накопленных частостей числа единиц совокупности и qi для накопленных долей распределяемого в них суммарного показателя в последнее время все чаще встречаются в учебной литературе.

Чтобы графически показать неравномерность распределения населения по отдельным группам городов, строим квадрат 100 х 100 и на оси абсцисс откладываем значения кумулятивных итогов про­цента городов, а на оси ординат — значения кумулятивных итогов процента численности населения в них. Для каждой пары значений кумулятивных итогов находим точку пересечения на графике, про­водя перпендикуляры к осям. Затем по точкам пересечения пер­пендикуляров к осям вычерчиваем кривую, которая и носит назва­ние кривой Лоренца(рис. 7).

 

Если бы каждому проценту накопленных (кумулятивных) частостей городов соответствовал такой же процент населения в них, то все точки расположились бы по диагонали квадрата и это озна­чало бы равномерное распределение населения по выделенным группам городов. Естественно, чем больше фактическое распреде­ление двух показателей отклоняется от равномерного, тем больше кривая Лоренца удалена от диагонали. Следовательно, чем больше это удаление (вогнутость), тем выше концентрация изучаемого показателя (в нашем примере — численности населения) в опре-деленных группах единиц (в нашем примере — в крупных городах).

Если значения признака в группах вариационного ряда даны в порядке убывания (от большего к меньшему), то построенная по таким данным кривая Лоренца будет расположена выше диаго-нали в форме выпуклости.

Несколько кривых Лоренца, построенных на одном квадрате, позволяют сравнивать уровень концентрации изучаемого показа-теля в разное время или по разным объектам.

Для количественного измерения степени концентрации имеется ряд показателей. Наиболее часто используется для этой цели так называемый коэффициент Джини(G). По своей сути он представ­ляет собой отношение площади (S1), ограниченной линией равно­мерного распределения (диагональю квадрата) и кривой Лоренца, к половине площади квадрата (S1 +S2), т.е.

 

Площадь S2 можно представить как сумму площадей одного треугольника и нескольких прямоугольных трапеций, образован­ных кривой Лоренца, с основаниями wi и сторонами qi-1 и qi (см. рис. 7), т.е. приближенно площадь S2 можно определить как

 

где qi-1= q0 = 0, a qn= 1.

 

Тогда коэффициент Джини выразится следующей формулой:

 

Значение коэффициента Джини G=0,7 свидетельствует о силь­ной концентрации населения в крупных городах.

 

Коэффициент Джини приближенно может быть рассчитан и по другой формуле:

 

Используя эту формулу, получим в нашем примере тот же ре­зультат, что и по формуле (1):

 

 

(Если пользоваться в расчетах не кумулятивными долями, а про­центами, то результат вычисления надо разделить на 10000.)

Кроме коэффициента Джини для измерения степени концент­рации определенного суммарного показателя по выделенным груп­пам единиц совокупности могут быть использованы и другие по­казатели, например коэффициент Лоренца и коэффициент Герфиндаля.

Коэффициент Лоренца(L) рассчитывается как полусумма раз­ностей доли единиц совокупности (частостей wi) и доли изучаемо­го суммарного показателя (dyi) по всем группам, т.е. по формуле

 

(Если wiи dyi выражены в процентах, то в знаменателе вместо 2 ставится 200.)

Коэффициент Герфиндаля(H) рассчитывается как сумма квад­ратов долей изучаемого суммарного показателя по всем группам, т.е.

 

В коэффициенте Герфиндаля dyi можно записать по-разному в зависимости от условного обозначения распределяемого суммар­ного показателя. Например, если речь идет о производстве продук­ции по группам предприятий, то, обозначив ее через Qi а долю

 

 

Для распределения численности работающих (Т) по отдельным группам предприятий коэффициент Герфиндаля будет выглядеть

 

Коэффициент Джини в статистической практике часто исполь­зуется для характеристики распределения общего объема денежных доходов по отдельным группам населения.

 

1. В чем суть и каково значение сводки как второго этапа стати­стического исследования?

2. Что такое централизованная и децентрализованная сводка?

3. Какова роль группировок в статистике?

4. Какие группировки называют простыми и какие комбинаци­онными?

5. Что такое вторичная группировка?

6. Что представляют собой ряды распределения?

7. Что такое вариационный ряд?

8. Как строятся вариационные ряды по дискретному и непре­рывному признакам с равными и неравными интервалами?

9. Что такое полигон и гистограмма?

 

10. Как строятся кумулята и огива?

11. Что представляет собой кривая Лоренца и каково ее значение в анализе?

12. Как рассчитываются коэффициенты Джини, Лоренца и Герфиндаля?

 

Результаты обработки и сводки статистических данных, как правило, оформляются в статистические таблицы.В каждой табли­це есть свое подлежащее и сказуемое. Подлежащее— это совокуп­ность или ее части, которые подвергаются характеристике. Сказу­емое— все показатели, характеризующие подлежащее.

Выделяют простые, групповые и комбинационные таблицы, таблицы с простой и сложной разработкой сказуемого.

К числу простыхотносятся таблицы, в подлежащем которых дается простой перечень отдельных территориальных единиц, от­раслей экономики или других объектов, а также таблицы, характе­ризующие динамику тех или иных показателей, как, например, следующая:

Некоторые социально-экономическиепоказатели по РФ.

 

Год
Численность населения (на конец года), млн чел. 146,3 145,6 145,0 144,2 143,5 142,8
Среднегодовая числен­ность занятых в экономи­ке, млн чел. 64,5 65,0 65,6 66,0 66,4 67,0
Численность населения с душевым доходом ниже прожиточного минимума, % 27,5 24,6 23,4 20,3 17,6
Индекс ВВП, % к преды­дущему году 105,1 104,7 107,3 107,9 106,4

Если в подлежащем таблицы имеется группировка единиц изу­чаемой совокупности по одному признаку, то такая таблица назы­вается групповой,например макет таблицы с группировкой хо­зяйств области по размеру посевных площадей:

Группа хозяйств с размером посевной площади, га Число хозяйств Общая посевная площадь, га Валовой сбор зерновых, Ц Средняя урожай­ность, Ц/га
До 5000 5000-10000 10000-25000 25000-50000 Свыше 50000        
Итого        

 

Групповой является также приводимая ниже таблица, в под­лежащем которой выделены группы магазинов РФ по размерам торговой площади на 1 января 1994 г.:

Группа магазинов с торговой площадью, м2     Число магазинов Розничный товарообо­рот в IV квартале 1993 г., % к итогу    
тыс. % к итогу
До 20 6,9 1,7
20-30 8,5 2,1
30-50 18,5 6,1
50-100 30,1 15,2
100-160 16,5 13,1
160-250 8,6 13,1
Свыше 250 10,9 48,7
Итого 100,0 100,0

 

В подлежащем комбинационнойтаблицы содержится группиров­ка по двум или нескольким признакам, например группировка хозяйств по размеру посевной площади и по числу коров.

Сказуемое в таблицах тоже может быть разработано по-разному. Различают простую и сложную разработки сказуемого. При простой разработке сказуемоговсе его показатели располагаются независи­мо друг от друга, например, дается характеристика студентов-заоч­ников института:

 

 


Курс       Численность студентов заочников
Всего мужчин женщин москвичей иногородних
I II          
III          
IV          
             

 

Простая разработка сказуемого имелась и во всех приведенных ранее примерах таблиц. При сложной разработке сказуемогопока­затели сказуемого сочетаются друг с другом, как, например, в при­веденном ниже макете таблицы, где каждый показатель сказуемо­го дается раздельно для мужчин и женщин:

Курс   Численность студентов
москвичей иногородних Всего
Итого муж. жен. Итого муж. жен. Итого муж. жен.
I II III IV                  
Всего                  

 

Следует помнить, что при построении любой статистической таблицы нужно исходить из цели исследования и содержания об­рабатываемого материала.