Сравнение выборок и проверка гипотез о равенстве средних.

 

Еще одним довольно распространенным элементом социологического анализа данных является сравнение выборок. Довольно часто исследователь с целью проверки гипотезы относительно разницы между социальным поведением групп прибегает к анализу средних по выборкам с последующим сравнением. Например, нам нужно рассмотреть – существует ли различие между уровнем заработной платы у работающих в компании мужчин и женщин. Для практической реализации задач такого типа как раз и приходится прибегать к сравнениям выборок. Рассмотрим эту процедуру применительно к использованию программы SPSS.

С методологической точки зрения при сравнении выборок ставится исследовательский вопрос – существуют ли различия в рассматриваемых выборках и, самое главное, - является ли это различие случайным или же, напротив, - статистически достоверным. Иногда, к подробному анализу прибегать не стоит, когда данные весьма красноречиво свидетельствуют о существенном различии. Однако, в большинстве случаев, такое различие далеко не всегда является очевидным.

На практике чаще всего используются t-тест для сравнения средних выборок. В программе SPSS чаще всего t-статистики вычисляются для двух независимых выборок, для двух зависимых выборок и для одной выборки. Рассмотрим эти способы подробнее.

Сразу стоит оговориться относительно возможностей применения t-статистик. Существует ряд условий, при выполнении которых мы можем пользоваться данной процедурой оценки средних по выборкам. В противном же случае исследователю стоит обратиться к другим методам. Итак, t-статистика может использоваться, если:

1. Существует основание предполагать, что наши переменные подчиняются нормальному распределению. Или же существует точное доказательство того, что нормальное распределение присутствует.

2. Предполагается, что наших выборок две.

Относительно первого замечания можно сказать, что если объем выборки достаточно велик, то вступает в силу центральная предельная теорема, согласно которой можно сделать предположение относительно нормальности распределения выборки. Если же объем выборки не очень велик (например меньше 100) или есть сомнения, то тогда изначально нужно провести процедуру оценивания распределения на нормальность. Для проведения теста на нормальность распределения применяется вычисление коэффициента Колмогорова-Смирнова. Рассмотрим процедуру его вычисления в программе SPSS.

Тест Колмогорова-Смирнова относится к непараметрическим. В программе SPSS вызов процедуры теста осуществляется через меню Analyze, выбор Nonparametric test (непараметрические тесты) и 1-Sample K-S (тест Колмогорова-Смирнова для одной выборки).

Рис. 36. Диалоговое окно теста на нормальность распределения.

 

В диалоговом окне для запуска теста на нормальность распределения Колмогорова-Смирнова нужно перенести в правую часть тестируемую переменную, отметить галочкой тест на нормальность (Normal) и нажать ОК. Пусть нам нужно как раз оценить такой параметр как уровень заработной платы. В результате выполнения теста программа SPSS представляет нам следующие данные.

Рис.37. Результаты выполнения теста на нормальность.

Для того, чтобы не перегружать себя лишней информацией, достаточно сконцентрировать свое внимание на последней строке, которая показывает значимость теста (Asymp. Sig.).

Тут нужно сделать важное методологическое пояснение. Проверка любых тестов основывается на выдвижении нулевой и альтернативной гипотезы. В данном случае нулевая гипотеза ставится как «Тестируемое распределение отличается от нормального». В результате нашего примера значимость теста очень низка, другими словами – статистически не достоверна (0,195). Это значит, что вероятность того, что наша гипотеза верна, составляет 80,5%. Вместе с тем принятый приемлемый уровень статистической достоверности составляет 95%. Следовательно, основываясь на результатах теста Колмогорова-Смирнова, мы можем сделать предположение, что наше распределение не отличается от нормального. Соответственно, мы можем переходить ко второму этапу оценки средних – вычислению t-статистик.

В данном случае мы хотим узнать – есть ли статистически значимое отличие в уровне зарплат мужчин и женщин. Вызов процедуры на выполнение t-статистики осуществляется из главного меню Analyze далее – Compare Means (сравнение средних) – Independed-Samples T test (тест для независимых выборок).

В раскрывающемся диалоговом окне нужно выбрать в качестве тестируемой переменной (Test Variable(s)) переменную «зарплата», а в качестве группирующей переменной (Grouping Variable) – переменную «пол». Далее в группирующей переменной нужно определить группы (Define Groups…). В нашем примере – это 1 и 2 (мужчины и женщины соответственно). Затем нажать кнопку Continue и запустить тест кнопкой ОК.

Рис. 38. Процедура запуска t-теста для двух независимых выборок.

В качестве независимых выборок выступают группы «мужчины» и «женщины», так как их ответы не влияют друг на друга и могут рассматриваться в качестве независимых. Результаты проведения t-теста изображены на рисунке 35. мы видим две таблицы. В первой содержатся сведения относительно количества мужчин и женщин в выборке. Их средние заработные платы, стандартное отклонение и стандартная ошибка среднего по каждой выборке. Если бы мы смотрели изначально только на эти данные, то можно было бы сделать предположение, что в данной компании средняя зарплата мужчин отличается от средней зарплаты женщин в большую сторону. В данном случае средняя зарплата у мужчин составляет 340,29 условные единицы, а у женщин 259,93. внимательный исследователь, однако, может обратить внимание на слишком большой разброс зарплат у мужчин. Тем не менее – разница более, чем в 80 условных единиц может показаться значительной. Однако как раз для этого и проводится статистическое исследование достоверности, которое представлено во второй таблице.

Рис. 39. Результаты проведения t-теста на независимость.

В правой части таблицы приведены результаты выполнения теста Левена о гомогенности дисперсий (Levene`s Test for Equality of Variances). Нас, прежде всего, интересует его значимость (sig.). В данном примере тест на гомогенность дисперсий не значим (0,097 больше, чем 0,05). Следовательно, дисперсии равны. В таком случае значимость t-статистики нужно смотреть по верхней строке (Equal variances assumed), в которой предполагается равенство дисперсий. В нашем примере значимость теста 0,097, что также больше, чем критическое значение 0,05. следовательно мы можем сделать вывод, что несмотря на то, что средние зарплаты у мужчин и женщин отличаются, это отличие статистически не значимо. Другими словами значимых отличий в уровне зарплат не существует.

Итак, общий алгоритм интерпретирования полученных результатов:

1. Смотрим статистику Левеня. Если тест не значим (больше 0,05). То предполагается равенство дисперсий и t-статистика смотрится по верхней строке. Если тест значим 9меньше 0,05), то предполагается неравенство дисперсий и t-статистика смотрится по нижней строке.

return false">ссылка скрыта

2. Если t-статистика значима (меньше 0,05), то принимается нулевая гипотеза о статистически достоверном отличии в средних. Если t-статистика не значима (больше 0,05), то гипотеза о статистически достоверном отличии средних отвергается.

Другой пример использования t-статистики относится к сравнению среднего по выборке с заданным параметром. Допустим мы принимаем на работу нового продавца. У нас есть средний показатель продаж за месяц. Новичок проработал месяц и требуется оценить, на сколько его уровень продаж отличается от среднего. В данном случае t-статистика вызывается в программе SPSS аналогичным образом: Analyze-Compare means-One sample T test.

Рис. 40. Т-тест для одной выборки.

В открывающемся диалоговом окне нужно выбрать переменную «продажи». Пусть у нас норма продаж составляет 600 у.е. Тогда мы в окне Test Value (тестируемое значение) вводим 600 и запускаем тест на выполнение кнопкой ОК.

В приведенных на рисунке 37 таблицах видно, что средние продажи нашего нового сотрудника составили около 582 у.е. Если бы мы остановились только на этих данных, то можно было бы сделать вывод о его профессиональной непригодности для работы в нашей организации, так как он показал результат ниже среднего.

Рис. 41. Результаты выполнения t-теста для одной выборки.

 

Вместе с тем, вторая таблица дает нам совершенно однозначный результат, о том, что данное отличие статистически не достоверно, так как t-тест не значим (sig. 0,773). Следовательно, мы не можем утверждать, что результат, который показал новый сотрудник, значимо отличается от среднего уровня продаж по компании.

Еще одним типом задач, которые довольно часто встречаются в социологических исследованиях и основаны на сравнении средних, является случай сравнения двух зависимых выборок. Типичный пример такого варианта, когда мы сравниваем одну и ту же выборку до и после определенного воздействия.

Рассмотрим пример. Пусть для нашего нового сотрудник, о котором только что шла речь, провели тренинг для повышения уровня продаж. Через определенный промежуток времени решили проверить, на сколько произошло изменение относительно прежнего уровня.

Процедура исследования средних по t-статистике для двух зависимых выборок запускается аналогично предыдущим: Analyze-Compare means-Paried Samples T test (тест для двух зависимых выборок).

Рис.42. Диалоговое окно для t-теста для двух зависимых выборок.

 

В открывшемся диалоговом окне нужно выбрать две переменные, соответствующие зависимым выборкам и запустить тест командой ОК. обратите внимание, что в данном случае выборки именно зависимые, так как относятся к одному человеку (нашему новому продавцу).

Рис. 43. Результаты t-теста для двух зависимых выборок.

Как видно из результатов, после тренинга продажи увеличились с 582,47 до 632,57. во второй таблице видны результаты корреляции, которые, кроме того, что статистически значимы (sig. 0,000), дополнительно свидетельствуют о высокой зависимости этих выборок (0,872), подтверждая нашу правоту.

Наконец, в последней таблице содержатся результаты самого теста. К сожалению, тест оказался не значим (sig. 0,105), что не позволяет сделать нам вывод о статистически значимом отличии. Другими словами, мы не можем утверждать, что в результате тренинга уровень продаж поднялся.