Виды дисперсий в совокупности, разделенной на части. Правило сложения дисперсий
Если исходная совокупность является такой, что по значениям признака она делится на l групп, то общая дисперсия складывается из частных дисперсий. В таблице 2.2 представлен анализ такой совокупности.
Таблица 2.2 - Определение исходной совокупности по группам
Значение признака х | Число единиц в j-й группе | Итого | ||||
… | j | … | l | |||
х1 | f11 | … | f1j | … | f1l | |
… | … | … | … | … | … | … |
хi | fi1 | … | fij | … | fil | |
… | … | … | … | … | … | … |
хk | fk1 | … | fkj | … | fkl | |
Итого | … | … |
Здесь j – номер группы ( );
хi – i-е значение признака ( );
fij – частота i-го значения признака, число единиц в j-й группе;
mi – сумма частот i-го значения признака в каждой группе;
nj – сумма частот всех значений признака в j-й группе;
N – сумма частот всех значений признака во всех группах (объем совокупности).
Сначала вычисляем l частных средних ( ), т.е. среднее значение признака в каждой группе:
. (2.22)
На основе частных средних определяем общую среднюю ( ) по формулам
или . (2.23)
Общая дисперсиясовокупности
. (2.24)
Общая дисперсия отражает вариацию признака за счет всех факторов, действующих в данной совокупности.
Вариацию между группами за счет признака-фактора, положенного в основу группировки, отражает межгрупповая дисперсия, которая исчисляется как средний квадрат отклонений групповой средней от общей средней:
. (2.25)
Межгрупповая дисперсия характеризует систематическую вариацию результативного признака, т.е. вариацию между группами за счет признака-фактора, положенного в основу группировки.
Вариацию внутри каждой группы изучаемой совокупности отражает внутригрупповая дисперсия, которая исчисляется как средний квадрат отклонений значений признака х от частной средней :
или . (2.26)
Для всей совокупности внутригрупповую вариацию будет выражать средняя из внутригрупповых дисперсий, которая рассчитывается как средняя арифметическая из внутригрупповых дисперсий:
. (2.27)
Внутригрупповая дисперсия отражает случайную вариацию, т.е. часть вариации обусловленную влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основу группировки.
Между представленными видами дисперсий существует определенное соотношение, которое известно как правило сложения дисперсий:
. (2.28)
Таким образом, общая дисперсия складывается из двух слагаемых: первое – средняя из внутригрупповых дисперсий – измеряет вариацию внутри частей совокупности, второе – межгрупповая дисперсия – вариацию между средними этих частей.
Правило сложения дисперсий позволяет выявить зависимость результатов от определяющих факторов с помощью соотношения межгрупповой и общей дисперсий. Это соотношение называется эмпирическим коэффициентом детерминации (η2) и показывает долю вариации результативного признака под влиянием факторного.
. (2.29)
Эмпирическое корреляционное отношение (η) показывает тесноту связи между исследуемым явлением и группировочным признаком.
. (2.30)
η2 и η [0, 1]. (2.31)
Если связь отсутствует, то h = 0. В этом случае межгрупповая дисперсия равна нулю (δ2=0), т.е. все групповые средние равны между собой и межгрупповой вариации нет. Это означает, что группировочный признак не влияет на вариацию исследуемого признака х.
Если связь функциональная, то h = 1. В этом случае дисперсия групповых средних равна общей дисперсии ( ). Это означает, что группировочный признак полностью определяет характер изменения изучаемого признака.
Чем больше значение корреляционного отношения приближается к единице, тем полнее (сильнее) корреляционная связь между признаками (таблица 2.3).
Таблица 2.3 - Качественная оценка связи между признаками (шкала Чэддока)
Значение | Характер связи | Значение | Характер связи | |
η = 0 | Отсутствует | 0,5 ≤ η < 0,7 | Заметная | |
0 < η < 0,2 | Очень слабая | 0,7 ≤ η < 0,9 | Сильная | |
0,2 ≤ η < 0,3 | Слабая | 0,9 ≤ η < 1 | Весьма сильная | |
0,3 ≤ η < 0,5 | Умеренная | η = 1 | Функциональная |
Пример 2.1.
Определим групповые дисперсии, среднюю из групповых дисперсий, межгрупповую дисперсию, общую дисперсию по данным о производительности труда в двух бригадах:
Изготовлено деталей за час, шт. (производительность труда) | Количество рабочих, имеющих соответствующую производительность труда | |
в бригаде 1 | в бригаде 2 | |
хi | fi1 | fi2 |
Промежуточные расчеты занесем в таблицы:
хi | Бр. 1 | Бр. 2 | mi | Промежуточные расчеты для определения средних величин | ||
fi1 | fi2 | хi·fi1 | хi·fi2 | хi·mi | ||
Σ | n1=10 | n2=10 | N=20 | Σхi·fi1=138 | Σхi·fi2=178 | Σхi· mi =316 |
хi | Промежуточные расчеты для определения дисперсий | |||||
(хi – ) | (хi – ) | (хi – ) | (хi – )2·fi1 | (хi – )2·fi2 | (хi – )2·mi | |
-3,8 | -7,8 | -5,8 | 14,44 | 0,00 | 33,64 | |
-1,8 | -5,8 | -3,8 | 9,72 | 0,00 | 43,32 | |
0,2 | -3,8 | -1,8 | 0,12 | 14,44 | 12,96 | |
2,2 | -1,8 | 0,2 | 9,68 | 9,72 | 0,20 | |
4,2 | 0,2 | 2,2 | 17,64 | 0,08 | 14,52 | |
6,2 | 2,2 | 4,2 | 0,00 | 19,36 | 70,56 | |
Σ | – | – | – | 51,60 | 43,60 | 175,20 |
Средняя производительность труда для 1-й бригады:
= 13,8 шт./ч.
Средняя производительность труда для 2-й бригады:
= 17,8 шт./ч.
Средняя производительность труда для 1-й и 2-й бригады:
= 15,8 шт./ч.
Дисперсия 1-й группы (бригады) = 5,16 | Дисперсия 2-й группы (бригады) = 4,36 | |
Средняя из групповых дисперсий = 4,76 | Межгрупповая дисперсия = 4,0 | |
Общая дисперсия | =8,76 | |
Проверка по правилу сложения дисперсий: | = 4,76 + 4,00 = 8,76 | |
Эмпирический коэффициент детерминации:
= 0,457 = 45,7%.
Отсюда можно сделать вывод, что общая вариация производительности труда на 45,7% обусловлена вариацией между группами.
Эмпирическое корреляционное отношение
= 0,6757.
Значение h = 0,6757 показывает заметную связь по шкале Чэддока (см. таблицу 2.3) между исследуемым явлением (производительностью труда) и группировочным признаком (бригады).