Проверка гипотез о средней и о доле
Гипотезы о средней
В статистической практике наиболее часто проверяются два вида гипотез о средних величинах:
• гипотеза о равенстве средней величины установленному нормативу;
• гипотеза о равенстве средних значений признака двух совокупностей.
Общий подход к проверке гипотезы о равенстве среднего значения признака в генеральной совокупности некоторой величине Н0: = а описан в параграфе 7. В качестве критерия в этом случае целесообразно использовать нормированное отклонение выборочной средней от заданной величины:
(8.1)
где (μ — средняя квадратическая ошибка выборочной средней, т.е. средняя ошибка выборки. При большом объеме выборки (n ≥ 30) средняя ошибка выборки μ рассчитывается по формуле а при n < 30 – по формуле Если полученное по результатам обследования фактическое значение t-статистики меньше табличного, т.е. tфакт < t, то гипотеза не отклоняется. В противном случае нулевую гипотезу следует отклонить.
Пример. При оценке влияния изменений в налоговой политике на платежеспособность предприятий одного из регионов установлено, что до указанных изменений средний коэффициент покрытия по этим предприятиям соответствовал нормативу, равному 2. После внесения изменений в действующую налоговую систему было проведено выборочное обследование 49 предприятий региона, в результате которого установлено, что средний коэффициент покрытия на них составил 1,7 при среднем квадратическом отклонении 0,6.
Выдвигаемая нулевая гипотеза состоит в том, что изменения в проводимой налоговой политике существенно не повлияли на платежеспособность предприятий региона, т.е. коэффициент покрытия остался на прежнем уровне: H0 : ≠ 2. В качестве альтернативной может быть рассмотрена гипотеза о том, что указанные изменения повлияли на степень платежеспособности предприятий: .
Для проверки выдвинутой гипотезы примем уровень значимости α=0,05. Так как вероятность , а ,
то для значения интеграла вероятностей Лапласа находим табличное значение t-статистики: t = 1,96 (см. Приложение 1).
Фактическое значение t-статистики
Так как tфaкт > t, то выдвинутая гипотеза отклоняется, т.е. изменения в налоговой системе повлияли на платежеспособность предприятий региона.
Для того чтобы сделать более определенный вывод о характере этих изменений, альтернативную гипотезу сформулируем следующим образом: изменения в налоговой системе привели к снижению платежеспособности предприятий региона, т.е. .
Зададим для этого случая уровень значимости а = 0,01. Вероятность , следовательно, значение интеграла вероятностей Лапласа в пределах от –t до 0 равно , а в пределах от -tдо +t соответственно 0,98.
По таблице Приложения 1 находим для данной вероятности значение t-cтатистики: t = 2,33. Так как tфакт > t, то нулевая гипотеза должна быть отклонена, т.е. с вероятностью 0,99 можно считать, что изменения в налоговой системе привели к снижению платежеспособности предприятий региона.
Если для проверки выдвинутой гипотезы используется малая выборка, то значение t-статистики определяется с помощью распределения Стьюдента. При этом степень обоснованности вывода зависит от того, насколько распределение генеральной совокупности соответствует нормальному закону.
Гипотеза о равенстве средних значений признака двух совокупностей выдвигается часто для того, чтобы проверить влияние какого-либо фактора на среднюю. Обозначим среднее значение признака в этих совокупностях через и , а дисперсии в генеральных совокупностях — соответственно и .В таком случае нулевая гипотеза может быть представлена следующим образом: . Для ее проверки проводится выборочное обследование, при котором объем выборки из первой совокупности составляет , а из второй - Обозначим соответствующие значения средних в этих выборках через и ,а дисперсии и .В качестве критерия при проверке этой гипотезы принимается t-статистика, фактическое значение которой по результатам выборочного обследования рассчитывается по формуле
(8.2)
где - стандартная ошибка разности выборочных средних.
Предположим, что дисперсии в двух совокупностях равны, т.е . Следовательно,
. (8.3)
Если дисперсии в выборочных совокупностях известны, то они могут быть использованы для оценки общей дисперсии. Расчет проводится по формуле средней арифметической взвешенной, где в качестве весов выступает число степеней свободы в каждой выборке :
Так как , а , то
Подставим полученное выражение в формулу (8.4), учитывая также формулу:
. (8.4)
Сравнивая фактическое значение t-статистики, рассчитанное по формуле (8.4) , с табличным (см. Приложение 3) при заданном уровне значимости, можно сделать вывод о необходимости согласиться с выдвинутой гипотезой или отклонить ее.
Пример. Для оценки влияния формы собственности на платежеспособность предприятий отрасли проведено выборочное обследование частных и государственных предприятий, в результате которого получены данные, приведенные в табл. 8.1
Таблица 8.1
Форма собственности | Число обследованных предприятий | Средний коэффициент покрытия | Дисперсия в выборочной совокупности |
Частная | 1,8 | 0,25 | |
Государственная | 1,2 | 1,18 |
В качестве нулевой выдвинем гипотезу о независимости степени платежеспособности предприятий от формы собственности, т.е. о равенстве коэффициентов покрытия на предприятиях указанных форм собственности: . Альтернативной является гипотеза . При проверке выдвинутой гипотезы примем уровень значимости . Рассчитаем по формуле (8.4) фактическое значение t-статистики:
Табличное значение найдем на основе распределения Стьюдента при α = 0,05 и числе степеней свободы v = 16 + 10 — 2 = 24.
Так как , то .
Соответствующее табличное значение t = 2,0639 (см. Приложение 3).Фактическое значение t-статистики меньше табличного, следовательно, с вероятностью 0,95 можно считать, что платежеспособность предприятий не зависит от принятой на них формы собственности.