Лабораторная работа №2. «Проверка гипотезы о законе распределения»
Цель работы: проверить гипотезу о нормальном законе распределения для функции времени наработки на отказ.
Проверка гипотезы о виде распределения строиться на основе нулевой гипотезы о том, что случайная величина X имеет заданную функцию распределения F(x). Выборка х,, х2, хп разбивается на к интервалов. Пусть nt — число элементов выборки, попавших в i -й интервал; i = 1,2, к. Используя предполагаемый закон распределения с учетом оценок параметров этого закона (среднее и среднеквадратичное отклонение), найденных по выборке, можно найти вероятность pi попадания случайной величины X в i-й интервал. Для проверки рассматриваемой гипотезы используется статистика
которая распределена по закону хи-квадрат с числом степеней свободы (к — l — 1), где l — число неизвестных параметров распределения, оцениваемых по выборке: например, для нормального распределения 1=2, так как оцениваются два параметра т и σ. Нулевая гипотеза не противоречит опытным данным, если выборочное значение статистики не превышает квантили распределения хи-квадрат (к — l — 1). Рассмотренный метод проверки гипотезы о виде распределения называется критерием согласия хи-квадрат.
Исходными данными для проверки гипотезы нормального распределения являются гистограмма лабораторной работы №1.
При использовании критерия хи-квадрат количество опытных значений в каждом интервале должно быть не менее пяти. Если в каком-то интервале их меньше, то интервалы объединяют.
Расчетные частоты Npi формуле вычисляются через вероятности попадания нормально распределенной величины в соответствующий интервал:
где функция стандартного нормального распределения Ф() вычисляется с помощью встроенной статистической функции НОРМРАСП(х, среднее значение т, стандартное отклонение, σ, интегральный).
Аргументы этой функции х — правая граница интервала, вводится адрес соответствующей ячейки; т (среднее) и стандартное отклонение вводятся абсолютные адреса характеристик, полученных с помощью Описательной статистики; значение интегральный = 1 (истина), в противном случае (ложь) вычисляется не функция распределения, а его плотность.
В ячейке ХИ2РАСЧЕТ определена величина критерия хи-квадрат как сумма ячеек столбца Расчет.
Расчеты выполняются в табличной форме.
№ | x | ni | F(x) | pi | Npi | расчет |
67,762 | 0,022213 | 0,022213 | 2,887743 | 0,004364 | ||
86,223 | 0,087303 | 0,065089 | 8,461632 | 0,025185 | ||
104,684 | 0,240385 | 0,153083 | 19,90073 | 0,482671 | ||
123,145 | 0,479035 | 0,23865 | 31,02451 | 1,94E-05 | ||
141,606 | 0,725718 | 0,246683 | 32,06878 | 3,820471 | ||
160,067 | 0,894789 | 0,16907 | 21,97912 | 2,242707 | ||
178,528 | 0,105211 | 13,67749 | 0,127877 | |||
∑ | ||||||
ХИ2РАСЧЕТ | 6,703294 | |||||
Среднее | 124,6325 | ХИ2ОБР | 9,487729 | |||
Ст откл | 28,2932 |
· Х – правые границы интервалов;
· n – частоты;
· F(x) – функция нормального распределения НОРМРАСП(х, среднее, ст. откл). Расчет F(x) производится для всех интервалов кроме последнего;
· р – вероятность. В первом диапазоне р1 = F(x1). В диапазоне со 2 по 6 интервал вероятность определяется по формуле рi = F(xi) - F(xi-1). Для последнего интервала вероятность определяется по формуле р7 = 1 - F(x6). Правильность расчета частот проверяется суммирование данного столбца. Сумма должна равняться 1.
· Np – расчетная частота определяется по формуле N*p, где N – объем выборки. Сумма столбца Np должна равняться N.
· Расчет – по формуле (n – Np)^2/Np. Сумма в столбце «Расчет» равна расчетное значение статистики хи-квадрат.
· ХИ2ОБР – критическое значение статистики хи-квадрат.
Граница критической области — квантиль распределения хи-квадрат может быть найдена с помощью встроенной функции ХИ20БР (вероятность, степени свободы). Аргумент вероятность — это уровень значимости (а = 0,05), а степени свободы к — l — 1 определяются как количество интервалов за вычетом количества оцениваемых параметров (здесь — два: т и σ) минус единица.
Гипотеза о нормальности распределения принимается, если выборочное значение статистики ХИ2ТЕСТ окажется меньше критического ХИ20БР.