Показатели вариации.

Модуль 2. Статистические методы изучения связей и зависимостей

Тема 5. Средние величины и показатели вариации.

 

Сущность средних в статистике.

Средняя арифметическая, ее свойства и техника исчисления.

Средняя гармоническая.

Мода и медиана.

Показатели вариации.

 

 

Средние величины играют особую роль в статистическом исследовании. Это определяется задачей статистики – выявлением закономерностей массовых явлений. Закономерности можно выявить, лишь обобщая однородные явления и давая обобщенную характеристику единицам явлений.

Средней величиной в статистке называется обобщающая характеристика совокупности однотипных явлений по какому-либо варьирующему признаку, которая показывает уровень признака, отнесенный к единице совокупности.

Основополагающим условием применения средних величин является массовость изучаемого явления. Только при этом условии они покажут общую тенденцию, лежащую в основе процесса в целом, и покажут ее типичный для данного периода уровень проявления.

К прочим условиям верного и экономически грамотного использования средних величин относятся:

- использование средней только в том случае, когда признак изменяется, варьирует у отдельных единиц совокупности;

- средние величины могут рассчитываться только в качественно однородных совокупностях.

Средние величины, будучи обобщающими показателями, для совокупности в целом затушевывают количественные различия изучаемого признака у отдельных единиц. Поэтому даже в пределах качественно однородной совокупности нередко нужно общие средние дополнять исчислением групповых средних, так как общие средние величины могут не раскрыть подлинных закономерностей изучаемых процессов.

Введем следующие условные обозначения:

Х Варианта признака – значение, величина признака отдельных единиц;
F Частота – величина, которая показывает сколько раз встречается признак с такой величиной в совокупности;
Среднее значение признака в совокупности.

Наиболее часто в практике встречаются средние арифметические и средние гармонические.

 

Средняя арифметическая используется в вариационном ряду распределения, где имеются частоты и варианты признака. Средняя арифметическая рассчитывается как:

1. Средняя арифметическая простая. Применяется когда частоты вариант равны между собой или равны единице.

=

-среднее значение признака в совокупности;

- сумма вариант признака;

n - количество частот.

Пример: определить среднюю цену на сахар за год, если средняя цена в первом квартале составила 2,50; во втором – 2,45; в третьем – 2,70; в четвертом – 2,60. Так как частоты равны единице, то используется средняя арифметическая простая:

грн.

2. Средняя арифметическая взвешенная. Используется, в случае, когда варианты совокупности имеют различную частоту.

=

- сумма всех частот в совокупности;

- общий объем значений частот варианты в совокупности.

Частоты отдельных вариант могут быть выражены не только абсолютными величинами, но и относительными значениями – частностями (w).

=

 

Пример: определить среднюю заработную плату работников магазина, если 1 человек получает 500 грн.; 3 – 450; 7 – 350; 2 – 250; 1 – 200. Так как варианты имеют различную частоту, то необходимо использование средней арифметической взвешенной:

грн.

 

В случае, когда варианты и частоты в интервальном вариационном ряду имеют большое численное значение, расчет среднего значения требует существенных усилий. Для сокращения трудоемкости расчетов использует некоторые особенности средней арифметической, позволяющие оптимизировать процесс расчета среднего значения и имеющие название способ моментов.

При расчете средней арифметической способом моментов необходимо:

1. Перейти от интервального ряда к дискретному путем нахождения среднего значения каждого интервала.

2. Вычесть из всех вариант постоянное число (лучше для этого использовать значение серединной варианты или варианты с наибольшей частотой) – A.

3. Разделить варианты на постоянное число, а именно величину интервала – i.

4. Рассчитать среднюю арифметическую из новых вариант или так называемый момент первого порядка.

M1 =

5. Для определения величины средней арифметической нужно величину момента первого порядка умножить на величину того интервала, на который делили все варианты, и прибавить к полученному произведению величину варианты, которую вычитали.

= i x M + A

Пример: на основании приведенных данных о результатах анализа жирности молока определить среднее значение.

Жирность молока, % Количество Жирность молока, % х – А (А = 3) Х1 = (х – А)/i (i – 1)
0,5 – 1,5 12 1 - 2 - 2
1,5 – 2,5 25 2 - 1 - 1
2,5 – 3,5 38 3 0 0
3,5 – 4,5 5 4 1 1

М1 =

%

Для проверки, произведем расчет среднего процента жирности молока, используя среднюю арифметическую взвешенную:

 

 

Учитывая, что статистические средние всегда выражают качественные свойства изучаемых общественных процессов и явлений, важно правильно выбрать формулу средней исходя из взаимосвязи явлений и их признаков. Когда статистическая информация не содержит частот по отдельным вариантам совокупности, а представлена как их произведение, применяется формула средней гармонической, то есть в этом случае веса приходится делить на варианты или, что то же самое, умножать на их обратное значение.

Средняя гармоническая – величина, обратная средней арифметической, из обратных значений признака. Выбор средней гармонической простой и взвешенной аналогичен средней арифметической:

- в случае, когда варианты равны между собой или равны единице, применяется средняя гармоническая простая:

 

- если варианты имеют различную частоту, используется средняя гармоническая взвешенная:

Пример: на основании приведенных данных о цене и объеме реализации картофеля за месяц на рынках города определить среднюю цену.

Рынки Цена, грн. Объем реализации, тыс. грн.
Южный 2,10 1025
Железнодорожный 1,80 1240
Центральный 2,40 890
Калининский 2,25 700

Для расчета средней цены необходимо использование средней гармонической простой, так как объем реализации выступает как произведение цены реализации на количество реализованной продукции.

грн.

 

 

Модой в статистике называется величина признака (варианта), которая чаще всего встречается в данной совокупности. В вариационном ряду это будет варианта, имеющая наибольшую частоту.

В дискретном ряду мода определяется визуально, так как это варианта, имеющая наибольшую частоту. В случае, если не одна, а две варианты имеют наибольшую частоту, в ряду будут две моды и распределение будет бимодальным.

Для определения моды в интервальном вариационном ряду используется следующая формула:

Mo= Xmo + Imo x

Xmo - минимальная граница модального интервала;

Imo - величина модального интервала;

Fm0-1 - частота интервала, предшествующего модальному;

Fm0 - частота модального интервала;

Fm0+1 - частота интервала, следующего за модальным.

Модальный интервал – интервал с наибольшей частотой.

Пример: на основании ранее рассмотренного примера определим моду

Жирность молока, % Количество Жирность молока, %
0,5 – 1,5 12 1
1,5 – 2,5 25 2
2,5 – 3,5 38 3
3,5 – 4,5 5 4

Для дискретного ряда распределения модой будет выступать значение жирности молока, равное 3%, так именно это значение наиболее часто встречается в рассмотренной совокупности – 38 раз.

Определим значение моды в интервальном ряду распределения:

Мо =

Медианой называется варианта, которая находится в середине вариационного ряда. Медиана делит ряд пополам, по обе стороны от нее находится одинаковое количество единиц совокупности.

Если непарное число вариант записано в порядке возрастания или убывания, то центральная из них будет медианой ((n+1)/2). Если число вариант парное, то медиана рассчитывается как средняя арифметическая простая двух средних вариант.

Для нахождения медианы в интервальном вариационном ряду используют следующую формулу:

Me = Xme + Ime x

Xme - начальное значение медианного интервала;

Ime - величина медианного интервала;

- сумма частот (численность ряда);

S (me-1) - сумма накопленных частот в интервалах, предшествующих медианному;

Fme - частота медианного интервала.

Медианный интервал это тот интервал, кумулятивная частота которого равна или превышает половину суммы частот.

Пример: на основании ранее рассмотренного примера определим медиану.

Жирность молока, % Количество Жирность молока, %
0,5 – 1,5 12 1
1,5 – 2,5 25 2
2,5 – 3,5 38 3
3,5 – 4,5 5 4

Для дискретного ряда распределения с парным числом вариант медианой будет являться средняя арифметическая простая двух средних вариант:

Ме =

Произведем расчет медианы для интервального ряда распределения:

Ме =

 

Средние величины дают обобщающую характеристику совокупности по варьирующим признакам, показывают типичный для данных условий уровень этих признаков. Но, как уже указывалось, наряду со средними величинами, большое практическое и теоретическое значение имеет изучение отклонений от средних. При этом интересуют не только крайние отклонения, но и совокупность всех отклонений. От размера и распределения отклонений зависит надежность средних характеристик.

Для характеристики величин колебания в статистике рассчитывают целый ряд показателей. Рассмотрим их на следующем примере:

Средние цены на пиво (за 1 литр) по Донецкой области за ряд лет составили:

- 1997 год – 1,49 грн.;

- 1999 год - 1,96 грн.;

- 2001 год – 3,10 грн.

1. Размах вариации – представляет собой разницу между наибольшим и наименьшим значением варьирующего признака.

R = Xmax - Xmin

R = 3,10 – 1,49 = 1,61 грн.

2. Среднее линейное (арифметическое) отклонение – характеризует распределение отклонений фактических значений от среднего. Используют:

- простое среднее линейное отклонение:

=

- взвешенное среднее линейное отклонение:

=