Показатели формы распределения

Для получения приблизительного представления о форме распределения строят графики распределения (полигон и гистограмму). В практике статистических исследований приходится встречаться с самыми различными распределениями. Однородные совокупности характеризуются, как правило, одновершинными распределениями. Многовершинность свидетельствует о неоднородности изучаемой совокупности. В этом случае необходима перегруппировка данных с целью выделения более однородных групп.

Обобщающие характеристики (показатели) центра распределения и степени вариации не дают представления о форме распределения, так как не вскрывают характера изменения частот. Для выражения особенностей формы распределения применяются ранговые характеристики, показатели дифференциации, асимметрии и эксцесса, кривые распределения.

Ранговые характеристики — варианты, занимающие в ранжированном вариационном ряду определенное место. К их числу относятся квартили (Q),децили (D), перцентили (Р).

Расчет квартилей и их практическое использование даны при рассмотрении показателей вариации.

Децили — значения признака, которые делят ранжированный ряд на десять равных по численности частей.

Перцентили — значения признака, делящие ранжированный ряд на 100 равных частей.

Расчет децилей и перцентилей выполняется аналогично исчислению квартилей.

Анализ вариационного ряда дополняется расчетом показателя дифференциации.

По ряду распределения определяется коэффициент децилъной дифференциации по формуле:

, (5.31)

где - максимальное значение у 10% фирм с наименьшими значениями ВТО;

- минимальное значение ВТО у 10% фирм с наибольшими значениями ВТО;

; (5.32)

; (5.33) - нижние границы интервалов, в которых находятся первая и девятая децили;

- ширины интервалов первой и девятой децили;

- сумма накопленных частостей в интервалах, предшествующих интервалам, в которых находятся первая и девятая децили;

- частости интервалов, в которых находятся первая и девятая децили.

Он показывает, во сколько раз наименьший уровень признака из 10% единиц, имеющих наибольший уровень признака, больше наибольшего уровня признака, из 10% единиц совокупности, имеющих наименьший уровень признака.

По первичным данным исчисляется коэффициент фондовой дифференциации по формуле:

, (5.34)

где - средние значения для 10% фирм с наибольшими и для 10% с наименьшими значениями ВТО.

Следует отметить что оба показателя являются ненормированными. Вследствие этого одно и тоже значение каждого из них можно толковать по-разному. Для устранения указанной неопределенности условимся вычислять значения и по формулам:

(5.35)

(5.36)

В соответствии со шкалой Чеддока степень дифференциации фирм по ВТО является слабой.

Многим распределениям присуща асимметрия. Наиболее простой мерой асимметрии является разность между средней арифметической () и модой (Мо) или медианой (Me) данного ряда. В симметричном ряду их значения совпадают и показатель асимметрии равен нулю. В рассматриваемом примере наблюдается положительная (правосторонняя) асимметрия Mo<Me<, а при отрицательной (левосторонней) асимметрии выполняется неравенство:Mo>Me>.

Для сравнительного анализа степени асимметрии нескольких распределений рассчитывается относительный показатель асимметрии ():

(5.37)

Величина показателя асимметрии может быть положительной и отрицательной. Положительная величина показателя асимметрии указывает на наличие правосторонней асимметрии. Отрицательный знак показателя асимметрии говорит о наличии левосторонней асимметрии. Чем больше абсолютная величинакоэффициента, тем больше степень скошенности. Принято считать, что если коэффициент асимметрии меньше 0,25, то асимметрия незначительная, если свыше 0,5, то асимметрия значительная.

Другой показатель асимметрии, предложенный шведским математиком Линдбергом, исчисляется по формуле:

(5.38)

где — процент тех значений признака, которые превышают величину средней арифметической;

50 — процент вариант, превосходящих среднюю арифметическую ряда нормального распределения.

Наиболее распространенным является показатель асимметрии, исчисляемый по формуле:

(5.39)

где ;

— центральный момент третьего порядка:

(5.40)

Этот показатель асимметрии не только определяет степень асимметрии, но и указывает на наличие или отсутствие асимметрии в распределении признака в генеральной совокупности. Оценка степени существенности этого показателя дается с помощью средней квадратической ошибки, рассчитываемой по формуле:

(5.41)

где n — число наблюдений.

Введём обозначения:

(5.37) Если то асимметрия существенна и распределение

признака в генеральной совокупности не является симметричным.

Учитывая, что указанное отношение по данным табл. 5.2 равно 0,11 асимметрию следует признать несущественной.

Для симметричных распределений рассчитывается показатель эксцесса (островершинности):

(5.43)

где — центральный момент четвертого порядка:

Эксцесс может быть положительным и отрицательным. У

островершинных распределений показатель эксцесса имеет положительный знак (+), а у плосковершинных — отрицательный знак (—). Предельным значением отрицательного эксцесса является значение = - 2; величина положительного эксцесса является бесконечной. В нормальном распределенииСледовательно, для нормального закона = 0.

Средняя квадратическая ошибка эксцесса исчисляется по формуле:

(5.44)

где n — число наблюдений.

Значение относительного показателя эксцесса можно определить по формуле:

(5.45)

Для приближенного определения величины эксцесса может быть использована формула Линдберга:

, (5.46)

где — процент количества вариант, лежащих в интервале, равном половине среднего квадратического отклонения (в ту и другую сторону от величины средней в общем количестве вариант данного ряда);

38, 29 — процент количества вариант, лежащих в интервале, равном половине среднего квадратического отклонения, в общем количестве вариант ряда нормального распределения.