Непараметрические методы сравнения двух выборок

Параметрические методы сравнения двух выборок

Параметрические и непараметрические методы сравнения двух выборок

При сравнении выборок используют параметрические и непараметрические методы. При решении вопроса о выборе параметрического или непараметрического метода сравнения необходимо иметь в виду, что параметрические методы обладают заведомо большей чувствительностью, чем их непараметрические аналоги. Поэтому исходной ситуацией является выбор параметрического метода (10).

Сравнение двух выборок по признаку, измеренному в метрической шкале, предполагает сравнение средних значений с использованием параметрического критерия t-Стьюдента.

В этом случае следует различать три ситуации по соотношению выборок между собой:

Ситуация 1. Критерий t-Стьюдента для одной выборки. Метод позволяет проверить гипотезу о том, что среднее значение изучаемого признака М отличается от некоторого известного значения А.

Ситуация 2. Критерий t-Стьюдента для независимых выборок.Метод позволяет проверить гипотезу о том, что средние значения двух генеральных совокупностей, из которых извлечены сравниваемые независимые выборки, отличаются друг от друга. Допущение независимости предполагает, что представители двух выборок не составляют пары коррелирующих значений признака.

Ситуация 3. Критерий t-Стьюдента для зависимых выборок.Метод позволяет проверить гипотезу о том, что средние значения двух генеральных совокупностей, из которых извлекаются сравниваемые зависимые выборки, отличаются друг от друга. Допущение о зависимости чаще всего значит, что признак измерен на одной и той же выборке дважды, например, до воздействия и после него.

Можно также проводить сравнение дисперсий двух выборок по критерию F-Фишера. Метод позволяет проверить гипотезу о том, что дисперсии двух генеральных совокупностей, из которых извлечены сравниваемые выборки, отличаются друг от друга. Как пишет А.Д.Наследов, «иногда этот метод приводит к ценным содержательным выводам, а в случае сравнения средних для независимых выборок сравнение дисперсий является обязательной процедурой» (10, с.162).

Решение о применении непараметрического метода становится оправданным, если не выполняются исходные предположения, лежащие в основе применения параметрического метода.

Применение непараметрических методов является оправданным при следующих условиях:

● есть основания считать, что распределение значений признака в генеральной совокупности не соответствует нормальному закону;

● есть сомнения в нормальности распределения признака в генеральной совокупности, но выборка слишком мала, чтобы по выборочному распределению судить о распределении в генеральной совокупности;

● не выполняется требование гомогенности дисперсии при сравнении средних значений для независимых выборок.

Как отмечает А.Д.Наследов, на практике преимущество непараметрических методов наиболее заметно, когда в данных имеются выбросы (экстремально большие или малые значения). Если размер выборки очень велик (больше 100), то непараметрические методы сравнения использовать нецелесообразно. С другой стороны, если объемы сравниваемых выборок очень малы (10 и меньше), то результаты применения непараметрических методов можно рассматривать лишь как предварительные (10).

● При сравнении двух независимых выборок используется критерий U-Манна-Уитни (Mann-WhitneyU).

● При сравнении двух зависимых выборок используется критерий Т-Вилкоксона (Wilcoxon signed-rank test).

● При сравнении более двух независимых выборок используется однофакторный дисперсионный анализ Краскала-Уоллеса (Kruskal-Wallis one-way analysis of variance).

● При сравнении более двух зависимых выборок используется критерий Фридмана (Friedman test).

Подводя итог сказанному, отметим, что в данном разделе мы не ставили перед собой задачу раскрыть все многообразие методов математической статистики. Основная цель – ориентация исследователя в тех методах, которые бы наиболее точно соответствовали цели и задачам исследования.

Таблицы для оценки достоверности различий приводятся во всех пособиях по математической статистике (см.также Приложение 1 и 2 настоящего издания), в учебнике «Экспериментальная психология» под авторством В.Н. Дружинина, а также в книге А.Д.Наследова «Математические методы психологического исследования. Анализ и интерпретация данных». В них же достаточно просто сформулированы правила, формулы вычисления среднего, моды и медианы, распределения, дисперсии. Обычно в психологических и педагогических исследованиях принимается достаточным 95% уровень достоверности различий. Кроме того, распространены компьютерные программы – «STATISTICA», «STADIA», «SPSS» и др., которые выполняют эти вычисления автоматически. Их использование значительно облегчает проведение корреляционного, факторного, кластерного и других видов анализа.