Показатели вариации

Показатели центра распределения, мода и медиана

Интервальные ряды распределения

Ряды распределения, признаки рядов распределения

ТЕМА №5

Тема: РЯДЫ РАСПРЕДЕЛЕНИЯ

1. Статистический ряд распределения –это упорядоченное распределение единиц совокупности на группы по определенному группировочному признаку, который изменяется количественно и качественно от одной единицы к другой или от одного периода времени к другому.

Ряды распределения могут быть:

1) атрибутивные,т.е. ряды распределения, построенные по качественным признакам.

2) вариационные,т.е. ряды распределения, построенные по количественным признакам:

· дискретные признаки, отличаются друг от друга на некоторую конечную величину, т.е. даны в виде прерывных чисел; (н/р число детей в семье, число работников)

· непрерывные признаки, могут отличаться друг от друга на сколь угодно малую величину; (н/р зарплата рабочих, размер среднедушевого денежного дохода)

Способы построения вариационного ряда для этих видов признаков различны.

Для построения дискретного ряда с небольшим числом вариантов достаточно перечислить все встречающиеся варианты значений признака, обозначаемые через Хi, а затем подсчитать частоту повторений каждого варианта Fi (например, распределение рабочих по разрядам, студентов по успеваемости и так далее).

Ряд распределения принято оформлять в виде таблиц, например:

Тарифный разряд рабочего, хi Число рабочих, имеющих этот разряд, fi Частота, Wi Накопленная частота, Si
итого 0,05 0,25 0,40 0,20 0,10 1,00

 

Т.о., ряд первичных данных, характеризующих квалификацию 20 рабочих, заменен коротким рядом, состоящим из 5 групп. Вместо абсолютного числа рабочих, имеющих определенный разряд можно установить долю рабочих этого разряда.

Вариационные ряды состоят из вариантов и частот (частостей).

Варианты – отдельные значения признака, которые он принимает в вариационном ряду распределения.

Частоты – числа, показывающие, как часто встречаются те или иные варианты в вариационном ряду распределения.

Частости – частоты, выраженные в долях единицы или в процентах к итогу.

2.В тех случаях, когда число вариантов дискретного признака достаточно велико, а также при анализе вариации непрерывного признака, когда значение признака у отдельных единиц может вообще не повторяться, строятся интервальные ряды распределения.

Интервал указывает определенные пределы значений варьирующегося признака и обозначается верхней и нижней границами интервала.

При построении интервальных рядов распределения необходимо прежде всего установить число групп (интервалов), на которые будут разбиты все единицы изучаемой совокупности.

Определение величины интервала (h) для построения вариационного ряда с равными интервалами производится следующим образом:

· вычисляется разность между максимальным и минимальным значением признака первичного ряда (определяется размах вариации R):

R =X max – Xmin;

· размах вариации делится на число групп k, то есть h = R / k..

Число групп приближенно определяется по формуле Стэрджесса:

K = 1+ 3,322 lg n,

где n – общее число изучаемых единиц совокупности, оно обычно дробное и его следует округлить.

3.Для характеристики среднего значения признака в вариационном ряду используются: средняя арифметическая, мода и медиана.

Средняя арифметическая для дискретного ряда распределения рассчитывается по формуле:

Хсред. = S хi fi / S fi ; где хi – варианта значений признака;

fi – частота повторения данного варианта.

В вариационном интервальном ряду средняя арифметическая определяется по формуле:

Хсред. = S хki fi / S fi ; ; где хki - середина соответствующего интервала.

В отличии от средней арифметической, рассчитываемой на основе использования всех вариантов значений признака, мода и медиана характеризуют величину варианта, занимающего определенное положение в ранжированном вариационном ряду.

Медиана (Ме) соответствует варианту, стоящему в середине ранжированного ряда. Положение медианы определяется ее номером NMe =(n + 1) / 2, где n – число единиц в совокупности.

Например:

№ группы Заработная плата, тыс.тенге Число работников, чел. Сумма накопленных частот
I II III IV V VI 50-60 60-70 70-80 80-90 90-100 Свыше 100 - - -

Мода - наиболее часто встречающееся значение признака совокупности. Для указанного в примере ряда распределения она также …..(максимальная частота).

В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода и медиана.

Для определения медианы в интервальном ряду используют следующую формулу:

М= x+ h=

;где Х Ме – нижняя граница медианного интервала;

h – величина интервала;

S(-1) – накопленная частота интервала, предшествовавшего медианному;

fMe – частота медианного интервала.

НАПРИМЕР:

 

Размер прибыли, млн.тг Число банков Накопленная частота
3,7 - 4,6
4,6 – 5,5
5,5 – 6,4
6,4 – 7,3
7,3 – 8,1
Итого  

В нашем примере рассчитаем медиану. По накопленным частотам определяем, что медиана находится в интервале 5,5 – 6,4.

Тогда:

Ме = 5,5+0,9* 0,5*20 – 6 = 6,175млн. тг

Т.о. 50% банков имеют прибыль менее 6,175 млн. тг, а 50% банков – более 6,175 млн. тг.

Теперь определиммоду. Наибольшая частота также соответствует интервалу 5,5 – 6,4,то есть мода должна находиться в этом интервале. Ее величину определяем по формуле:

М= xh;

 

где:

Хмо – начало модального интервала;

fMo - частота, соответствующая модальному интервалу;

f(-1) - предмодальная частота;

f(+1) -послемодальная частота.

Приведенная формула может быть использована в вариационных рядах с равными интервалами:

Мо = 5,5 + 0,9 (6 – 4 ) / ((6 – 4) + (6 - 5)) = 6,10 млн. тг

Т.о., в данной совокупности наиболее часто встречается размер прибыли 6,10 млн. тг

4. Для измерения степени колеблемости отдельных значений признака от средней исчисляются основные обобщающие показатели вариации: дисперсия, среднее квадратическое отклонение и коэффициент вариации.

Дисперсия (s2) – это средняя арифметическая квадратов отклонений отдельных значений признака от их средней арифметической.

В зависимости от исходных данных дисперсия вычисляется по формуле средней арифметической простой или взвешенной:

_

s2 = S (х - х)2 / n - простая

_

s2 = S (х - х)2 f / Sf - взвешенная

 

Среднее квадратическое отклонение (s) представляет собой корень квадратный из дисперсии и равно

 

s = ÖS (х - х)2 / n - невзвешенное

_

s = ÖS (х - х)2 f / S f -взвешенное.

В отличие от дисперсии среднее квадратическое отклонение является абсолютной мерой вариации признака в совокупности и выражается в единицах измерения варьирующего признака (тенге, тоннах, процентах и т.д.).

Для сравнения размеров вариации различных признаков, а также для сравнения степени вариации одноименных признаков в нескольких совокупностях исчисляется относительный показатель вариации – коэффициент вариации (V), который представляет собой процентное отношение среднего квадратического отклонения к средней арифметической:

V = s *100/ xсред

По величине коэффициента можно судить о степени вариации признаков, а следовательно, об однородности состава совокупности. Чем больше его величина, тем больше разброс значений признака вокруг средней, тем менее однородна совокупность по составу.

НАПРИМЕР:

 

Стаж, лет Среднесписочная численность работников, чел., f Середина интервала, хi   xi f   xi - xcp   (xi -xcp)2   (xi -xcp)2 f
До 3 3-5 5-7 7-9 свыше 9 -3 -1
Итого - - -

 

Определить:

1) средний стаж работников;

2) дисперсию;

3) среднее квадратическое отклонение;

4) коэффициент вариации.

Решение: 1. Хсред. = 500/100=5 лет

2.дисперсия

s2= 356/100=3,56=3,6

3.среднее квадратическое отклонение

s = Ö356/100 = Ö 3,6 = 1,8867

4.коэффициент вариации

V = 1,8867/5 * 100 =37,7 %

Правило сложения дисперсий (вариаций). Для статистической совокупности, сгруппированной по изучаемому признаку, возможно вычисление трех видов дисперсий: общей (s2), частных (внутригрупповых) – (si2) и межгрупповой (d2). Общая дисперсия характеризует вариацию всех единиц совокупности от общей средней, частные – вариацию признака в группах от групповой средней и межгрупповая - вариацию групповых средних от общей средней. Между указанными видами дисперсий существует соотношение, которое называют правилом сложения дисперсий: общая дисперсия равна сумме средней из частных дисперсий и межгрупповой:

s2 =`si2 + d2

Если основанием группировки является факторный признак, то с помощью правила сложения дисперсий можно измерить силу его влияния на результативный признак. Вычислив коэффициент детерминации и эмпирическое корреляционное отношение.

Коэффициент детерминацииравен отношению межгрупповой дисперсии к общей:

h2 = d2х / s2

 

Показывает долю общей вариации результативного признака, обусловленную вариацией группировочного признака.

Корень квадратный из коэффициента детерминации называется эмпирическим корреляционным отношением:

h = Öd2х / s2

По абсолютной величине он может изменяться от 0 до 1. Если h = 0, группировочный признак не оказывает влияния на результативный. Если h = 1, изменение результативного признака полностью обусловлено группировочным признаком, т. е. между ними существует функциональная связь.

 

ТЕМА №9 Тема: ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ