Лабораторная работа №2. «Проверка гипотезы о законе распределения»

Цель работы: проверить гипотезу о нормальном законе распределения для функции времени наработки на отказ.

 

Проверка гипотезы о виде распределения строиться на основе нулевой гипотезы о том, что случайная величина X имеет заданную функцию распределения F(x). Выборка х,, х2, хп разбивается на к интервалов. Пусть ntчисло элемен­тов выборки, попавших в i -й интервал; i = 1,2, к. Используя предполагаемый закон распределения с учетом оценок парамет­ров этого закона (среднее и среднеквадратичное отклонение), найденных по выборке, можно найти вероят­ность pi попадания случайной величины X в i-й интервал. Для проверки рассматриваемой гипотезы используется статистика

которая распределена по закону хи-квадрат с числом степеней свободы (к — l — 1), где l — число неизвестных параметров рас­пределения, оцениваемых по выборке: например, для нормаль­ного распределения 1=2, так как оцениваются два параметра т и σ. Нулевая гипотеза не противоречит опытным данным, если выборочное значение статистики не превышает квантили распределения хи-квадрат (к — l — 1). Рассмотренный ме­тод проверки гипотезы о виде распределения называется крите­рием согласия хи-квадрат.

 

Исходными данными для проверки гипотезы нормального распределения являются гистограмма лабораторной работы №1.

 

При использовании критерия хи-квадрат количество опытных значений в каждом интервале дол­жно быть не менее пяти. Если в каком-то интервале их меньше, то интервалы объединяют.

 

Расчетные частоты Npi формуле вычисляются через вероятности попадания нормально распределенной величины в соответствующий интервал:

 


 

где функция стандартного нормального распределения Ф() вы­числяется с помощью встроенной статистической функции НОРМРАСП(х, среднее значение т, стандартное отклонение, σ, интегральный).

 

 

Аргументы этой функции х — правая грани­ца интервала, вводится адрес соответствующей ячейки; т (сред­нее) и стандартное отклонение вводятся абсолютные адреса характеристик, полученных с помощью Описательной статисти­ки; значение интегральный = 1 (истина), в противном случае (ложь) вычисляется не функция распределения, а его плотность.

 

В ячейке ХИ2РАСЧЕТ определена величина критерия хи-квадрат как сумма ячеек столбца Расчет.

 

Расчеты выполняются в табличной форме.

 

x ni F(x) pi Npi расчет
67,762 0,022213 0,022213 2,887743 0,004364
86,223 0,087303 0,065089 8,461632 0,025185
104,684 0,240385 0,153083 19,90073 0,482671
123,145 0,479035 0,23865 31,02451 1,94E-05
141,606 0,725718 0,246683 32,06878 3,820471
160,067 0,894789 0,16907 21,97912 2,242707
178,528   0,105211 13,67749 0,127877
       
          ХИ2РАСЧЕТ 6,703294
  Среднее 124,6325     ХИ2ОБР 9,487729
  Ст откл 28,2932        

 

· Х – правые границы интервалов;

· n – частоты;

· F(x) – функция нормального распределения НОРМРАСП(х, среднее, ст. откл). Расчет F(x) производится для всех интервалов кроме последнего;

· р – вероятность. В первом диапазоне р1 = F(x1). В диапазоне со 2 по 6 интервал вероятность определяется по формуле рi = F(xi) - F(xi-1). Для последнего интервала вероятность определяется по формуле р7 = 1 - F(x6). Правильность расчета частот проверяется суммирование данного столбца. Сумма должна равняться 1.

· Np – расчетная частота определяется по формуле N*p, где N – объем выборки. Сумма столбца Np должна равняться N.

· Расчет – по формуле (n – Np)^2/Np. Сумма в столбце «Расчет» равна расчетное значение статистики хи-квадрат.

· ХИ2ОБР – критическое значение статистики хи-квадрат.

 

Граница критической области — квантиль распределения хи-квадрат может быть найдена с помощью встроенной функции ХИ20БР (вероятность, степени свободы). Аргумент вероятность — это уровень значимости (а = 0,05), а степени свободы к — l — 1 определяются как количество интервалов за вычетом количества оцениваемых параметров (здесь — два: т и σ) минус единица.

 

Гипотеза о нормальности распределения принимается, если выборочное значение статистики ХИ2ТЕСТ окажется меньше критического ХИ20БР.