ПРОВЕРКA ГИПОТЕЗЫ О РАВЕНСТВT СРЕДНИХ ДВУХ НОРМАЛЬНЫХ РАСПРЕДЕЛЕНИЙ С ИЗВЕСТНЫМИ ДИСПЕРСИЯМИ.

 

Иногда оказывается, что средний результат из основной серии опытов отличается от среднего результата другой серии опытов. Необходимо определить случайно или нет, это различие т.е. можно ли считать, что результат эксперимента представляет собой выборка из двух независимых генеральных совокупностей с одинаковыми средними, или средние этих совокупностей не равны.

Формальная постановка этой задачи выглядит следующим образом – изучаются две случайные величины, распределённые по нормальному закону:

, где σ – стандартное отклонение.

Предполагается, что дисперсии и известны, а математические ожидания не известны.

Пусть имеются две серии наблюдений величины Χ и Υ.

Χ: х1, х2, …, хn1.

Υ: y1, y2, …, yn2.

Выдвигаем следующую гипотезу, что mx=my. На основании наблюдений необходимо подтвердить или опровергнуть эту гипотезу. Если подтвердится нулевая гипотеза, то можно говорить о том, что различия между средними величинами в двух выборках статистически незначимо, т.е. объясняется как случайная ошибка.

Для проверки этой гипотезы используется z-тест. Для этого рассчитывается

z-критерий (z-статистика), который определяется следующим образом:

- среднее арифметическое значение из серии n наблюдений.

,

z-критерий распределён нормально с нулевым математическим ожиданием и единичной дисперсией.

Н1: mx ≠ my

Нулевая гипотеза о том, что средние значения равны: H0: =

Альтернативная гипотеза о том, что средние значения не равны, выглядит следующим образом: H1: .

При альтернативной гипотезе возможны варианты: либо <, либо >. Соответственно мы должны применить двусторонний критерий. Таким образом существуют две критические точки: и .

Эти точки выбираются из условия:

(1) Р(-∞ <Z< ) = ( для 1ой критической точки).

(2) Р(<Z<+∞) = (для 2ой критической точки).

По значению определяем левую и правую критические точки.

,

где F(z) – интегральная функция распределения случайной величины Z, а F-1(…) – обратная функция.

 

Определение: Пусть функция y = f(x) задана на сегменте [a, b], и пусть множеством значений этой функции является сегмент [α, β]. Пусть, далее, каждому y из сегмента [α, β] соответствует только одно значение x из сегмента [a, b], для которого f(x) = y. Тогда на сегменте [α, β] можно определить функцию x = f-1(y), ставя в соответствие каждому y из [α, β то значение x из [a, b], для которого f(x) = y. Функция x = f-1(y) называется обратной для функции y = f(x).

 

Значения критических точек можно найти через функцию: =НОРМСТОБР, указав в диалоговом окне значение вероятности () - для нахождения значения ,или же значение (1 - ) – для нахождения значения ).

 

Величина Z, распределённая нормально с параметрами Z=N(0;1), распределена симметрично:

=0,05

=0,025

= -1,96

= 1,96

Геометрическая интерпретация: вероятность попадания в области отклонения гипотезы равна сумме заштрихованных площадей.

 

Последовательность проведения тестирования:

1. Вычисляем статистику Z.

2. Задаёмся уровнем значимости .

3. Определяем критические точки, исходя из условий (1) и (2).

4. Сравниваем рассчитанное в п.1 значение Z со значением критических точек:

Если значение Z-статистики будет по абсолютной величине больше чем значение критической точки, то нулевая гипотеза отклоняется при данном уровне значимости . Это означает, что две совокупности, из которых сделана выборка, различны и, следовательно, средние значения и математические ожидания для этих выборок не равны. В противном случае принимается гипотеза о равенстве средних значений, и можно рассматривать эти две совокупности как одну общую с одним и тем же математическим значением.

В пакете EXCEL существует инструмент анализа, который называется «двухвыборочный Z-тест для средних» (Сервис – анализ данных – двухвыборочный Z-тест для средних). Он служит для проверки гипотезы о различии между средними (математическими ожиданиями) двух нормальных распределений с известными дисперсиями.

Когда вызывается этот инструмент, то появляется диалоговое окно, в котором задаются следующие параметры:

* Интервал переменной 1: вводится ссылка на ячейки, содержащие результаты наблюдений случайной величины Х.

* Интервал переменной 2: вводится ссылка на ячейки, содержащие результаты наблюдений случайной величины У.

* Гипотетическая средняя разность: вводится число, предполагаемой разности между средними для изучаемой генеральной последовательности. Для проверки гипотезы о равенстве средних необходимо ввести значение ноль.

* Дисперсия переменной 1 (известная): вводится известное значение дисперсии случайной величины Х.

* Дисперсия переменной 2 (известная): вводится известное значение дисперсии случайной величины У.

* Метки: если активируем, то первая строка воспринимается как заголовок и не считается.

* Альфа: задаётся уровень значимости , равный вероятности совершить ошибку первого рода.

Лабораторная работа №1:

Известны выборочные данные о диаметре валиков в миллиметрах, изготовляемых автоматом 1 и 2.

Автомат 1 182,3 183,0 181,8 181,4 181,8 181,6 183,2 182,4 182,5 179,7 179,9 181,9 182,8 183,4
Автомат 2 185,3 185,6 184,8 186,2 185,8 184,0 184,2 185,2 184,2          

Дисперсия для автомата 1: = 5 мм2.

Дисперсия для автомата 2: =7 мм2.

Уровень значимости = 0,05.

1.Используя двухвыборочный Z-тест для средних проверить гипотезу о равенстве средних значений.

2.Проверить эту же гипотезу, используя расчётные формулы.