Показатели вариации
Вариацией признака называется различие индивидуальных значений признака внутри изучаемой совокупности.
Она возникает в результате того, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов, которые по-разному сочетаются в каждом отдельном случае.
Средняя величина — обобщающая характеристика признака изучаемой совокупности, но она не показывает строение совокупности, не дает представления о том, как отдельные значения изучаемого признака группируются вокруг средней, сосредоточены ли они вблизи или значительно отклоняются от нее.
Если отдельные варианты недалеко отстоят от средней, то говорят, что данная средняя хорошо представляет изучаемую совокупность. Для изучения величины отклонений применяют показатели вариации.
При характеристике колеблемости признака применяют систему абсолютных и относительных показателей.
К абсолютным показателям вариации относятся: размах вариации; среднее линейное отклонение; дисперсия; среднее квадратическое отклонение. Эти показатели (кроме дисперсии) измеряются в тех же единицах, что и сам признак: в тоннах, метрах, секундах, рублях.
К относительным показателям вариации относятся: коэффициент осцилляции; линейный коэффициент вариации; простой коэффициент вариации. Эти показатели выражаются в процентах или относительных величинах.
1. Размах вариации— наиболее простой измеритель вариации и представляет собой разность между наибольшим и наименьшим значением признака:
R = , (20)
где xmax — наибольшее значение признака; xmin — минимальное значение признака.
Величина R показывает, в каких пределах колеблется размер признака, образующего ряд распределения. Показатель прост в вычислении и указывает на общие размеры вариации, но он не дает представления о степени колеблемости внутри совокупности, так как вычисляется на основе только двух крайних значений признака совокупности. И все же размах вариации имеет теоретическое и практическое значение. С его помощью определяют допустимые размеры колебаний, сравнивают их с установленными.
Более точную характеристику колеблемости можно получить, если сравнить все имеющиеся значения с их средней величиной. В таком случае исчисляют другие показатели колеблемости изучаемого признака — среднее линейное отклонение, дисперсию и среднее квадратическое отклонение.
2. Среднее линейное отклонениепредставляет собой среднюю из абсолютных значений отклонений отдельных вариант от их средней.
Среднее линейное отклонение рассчитывается по формуле средней арифметической простой или средней арифметической взвешенной:
. (21)
3. Дисперсиейназывается средний квадрат отклонений индивидуальных значений признака от их средней величины. Дисперсия равна:
Д = . (22)
Характеризует степень рассеяния (отклонения) статистических данных от их среднего значения. Малое значение дисперсии означает, что данные в основном сгруппированы вокруг их среднего значения, то есть близки к нему. Если же значение дисперсии велико, то это свидетельствует о значительном разбросе данных относительно средней.
4. Среднее квадратическое отклонениеравно корню квадратному из суммы квадратов отклонений индивидуальных значений признака от их средней величины, то есть из дисперсии:
σ = . (23)
5. Коэффициент вариации (V) представляет собой отношение среднего квадратического отклонения (абсолютного показателя вариации) к среднему значению и рассчитывается по формуле:
V = * 100%. (24)
С помощью коэффициента вариации можно оценивать колеблемость величин различных признаков, например: размер колеблемости производительности труда групп рабочих, занятых производством различных видов продукции, размера колеблемости урожаев различных сельскохозяйственных культур и т. д. Чем больше его величина, тем больше разброс значений вокруг средней, тем менее однородна совокупность по своему составу и тем менее представительна средняя.
Например, урожайность зерновых в двух хозяйствах района одинакова и составляет 25 ц/га. Однако средние квадратические отклонения различны и составляют в первом хозяйстве 5 ц/га, а во втором – 10 ц/га.
Определим коэффициенты вариации:
V1 = *100% = 5/25 * 100 % = 20 %;
V2 = * 100 % = 10/25 *100% = 40%.
Коэффициент вариации 20 % в первом хозяйстве свидетельствует об однородности статистических данных, то есть показывает, что урожайность зерновых на всех полях близка к средней. Вариация же 40 % во втором хозяйстве свидетельствует об обратном, то есть говорит о том, что урожайность на разных полях этого хозяйства существенно различается. Есть поля, где урожайность составляет 35-40 ц/га, и поля где она не превышает 10-15 ц/га. То есть средний размер урожайности в 25 ц/га не типичен для данного хозяйства, он не отражает фактической урожайности разных полей хозяйства. Соответственно здесь требуются дополнительные статистические исследования, например, группировка полей по урожайности и исследование влияющих на нее факторов.
Помимо коэффициента вариации вычисляют линейный коэффициент вариациикак отношение среднего линейного отклонения к средней в процентах:
.(25)
Отношение размаха вариации к средней называется коэффициентом осцилляции:
. (26)