Показатели вариации

Средняя величина дает обобщающую характеристику всей совокупности изучаемого явления. Однако два ряда распределения, имеющие одинаковую среднюю арифметическую величину, могут значительно отличаться друг от друга по степени колеблемости (вариации) величины изучаемого признака. Наличие различий в величине признака у отдельных единиц совокупности обусловлено влиянием большого числа факторов. Эти факторы могут оказывать разнонаправленное воздействие на анализируемый показатель. Например, снижение цен на строительные материалы может привести к уменьшению цен на I м2 жилья, а увеличение спроса на жилье может повысить эту цену и т.д. В результате совместного влияния различных факторов и складывается цена I жилья в определенное время. Но есть, например, и такой фактор, как экологическая обстановка в разных районах или географическое положение района, которая также обусловливает вариацию цен 1 м2 жилья в разных районах города. Поэтому при изучении вариации показателей можно выделить две группы факторов, влияющих на уровень и вариацию признака в исследуемой совокупности. Первую - составляют факторы, общие для всех единиц изучаемой совокупности. Во вторую группу входят факторы, свойственные конкретным единицам совокупности и определяющие их индивидуальные особенности. Если индивидуальные значения признака ряда мало отличаются друг от друга, то средняя арифметическая будет достаточно показательной характеристикой свойств данной совокупности. Если значения признака характеризуются значительным рассеянием, то средняя арифметическая будет ненадежной характеристикой этой совокупности и ее практическое применение будет ограничено.

Для измерения вариации признака применяются различные абсолютные и относительные показатели. К абсолютным показателям вариации относятся размах колебаний, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение.

Размах колебаний, или размах вариации, представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности:

R = xmax - xmin

Безусловным достоинством этого показателя является простота расчета, но значение этого показателя зависит только от значений крайних точек совокупности. На практике он находит применение в предупредительном контроле качества продукции.

Точнее характеризует вариацию признака показатель, учитывающий отклонения значений признака отдельных единиц совокупности от средней величины. К таким показателям относятся среднее линейное отклонение, дисперсия и среднее квадратическое отклонение.

Среднее линейное отклонение представляет собой среднюю величину из отклонений вариантов признаков от их средней. Дисперсия это средний квадрат отклонений от индивидуальных значений признака от их средней величины. Среднее квадратическое отклонение представляет собой корень квадратный из среднего квадрата отклонений отдельных значений признака от их средней. Так как алгебраическая сумма отклонений индивидуальных значений признака от средней арифметической (согласно нулевому свойству) всегда равна нулю, то для расчета среднего линейного отклонения используется арифметическая сумма отклонений, т.е. суммируются абсолютные значения индивидуальных отклонений значений признака независимо от знака.

Формулы для расчета абсолютных показателей вариации приведены в табл. 3.

Дисперсия σ2 представляет собой среднюю из квадратов отклонений значений признака от их средней величины. Таблица 3

Показатели Формулы расчета
простая взвешенная
1. Среднее линейное отклонение (d)     d= d=
2. Дисперсия (σ 2)     σ 2= σ 2=
2а. Преобразованная формула для расчета дисперсии   σ 2= σ 2=
3. Среднее квадратическое отклонение (σ)   σ = σ =

При расчете показателей вариации для интервального ряда распределения вместо интервальных значений подставляются центральные значения интервала.

Дисперсия обладает рядом свойств, некоторые из них позволяют упростить ее вычисления:

1) дисперсия постоянной величины равна нулю;

2) если все варианты значений признака уменьшить на одно и то же число, то дисперсия не уменьшится;

3) если все варианты значений признака уменьшить в одно и то же число раз, то дисперсия уменьшится в А2 раз.

Дисперсия представляется в квадратах единиц, в которых измеряется регистрируемый признак, что делает ее интерпретацию довольно затруднительной. Эту проблему можно преодолеть, рассчитав среднее квадратическое отклонение, которое представляет собой корень квадратный из дисперсии.

Размах вариации, среднее линейное и среднее квадратическое отклонения являются величинами именованными. Они имеют те же единицы измерения, что и индивидуальные значения признака.

Дисперсия и среднее квадратическое отклонение — наиболее широко применяемые показатели вариации. Объясняется это тем, что они входят в большинство теорем теории вероятностей, служащих фундаментом математической статистики. Кроме того, дисперсия может быть разложена на составные элементы, позволяющие оценить влияние различных факторов, обусловливающих вариацию признака. В последующих главах будет показано, как дисперсия используется для построения показателей тесноты корреляционной связи, при оценке результатов выборочных наблюдений и т.д.

Проиллюстрируем расчет показателей вариации на примере распределения численности рабочих f1 и f2 по уровню выработки х в двух филиалах организации связи, используя полученные средние (х12=5 тыс. руб. /чел.). Таблица 4

Выработка х Филиал 1 Филиал 2
f1 х- х-f1 (х-)2 (х-)2f1 f2 х- х-f2 (х-)2 (х-)2f2
-2 -2
-1 -1
Итого  

Тогда средние линейные отклонения будут равны:

d1= =120/150=0,8 тыс. руб./чел.; d2=200/130=1,54 тыс. руб./чел.

Дисперсии: σ 21==180/150=1,2; σ 22=360/130=2,77

Средние квадратические отклонения σ 1 ===1,1 тыс. руб./чел.; σ 2=1,66 тыс. руб./чел.

Таким образом, колеблемость выработки во втором филиале значительно выше, чем в первом.