Оценка случайных погрешностей. Доверительная вероятность и доверительный интервал

Для количественной оценки случайных погрешностей и установления границ случайной погрешности результата измерения могут использоваться: предельная погрешность, интервальная оценка, числовые характеристики закона распределения. Выбор конкретной оценки определяется необходимой полнотой сведений о погрешности, назначением измерений и характером использования их результатов.

Предельная погрешность Δm – погрешность, больше которой в данном измерительном эксперименте не может появиться. Теоретически, такая оценка погрешности правомерна только для распределений, границы которых четко выражены и существует такое значение ± Δm , которое ограничивает возможные значения случайных погрешностей с обеих сторон от центра распределения (например, равномерное). На практике такая оценка есть указание наибольшей погрешности, которая может встретиться при многократных измерениях одной и той же величины. Недостатком такой оценки является то, что она не содержит информации о характере закона распределения случайных погрешностей. При арифметическом суммировании предельных погрешностей получаемая сумма может значительно превышать действительные погрешности.

Более универсальными и информативными являются квантильные оценки. Площадь, заключенная под всей кривой плотности распределения погрешностей, отражает вероятность всех возможных значений погрешности и по условиям нормирования равна единице. Эту площадь можно разделить вертикальными линиями на части. Абсциссы таких линий называются квантилями. Так, на рис.16 Δx1, есть 25%-ная квантиль, так как площадь под кривой f x) слева от нее составляет 25% всей площади. Абсцисса Δx2 соответствует 75%-ной квантили. Между Δx1, и Δx2 заключено 50% всех возможных значений погрешности, а остальные лежат вне этого интервала.

 

Рис. 16. Квантильные оценки случайной величины

Квантильная оценка погрешности представляется интервалом от − Δx(P) до + Δx(P), на котором с заданной вероятностью Ρ встречаются Ρ⋅100% всех возможных значений случайной погрешности. Интервал с границами ± Δx(P) называется доверительным интервалом случайной погрешности, между границами которого с заданной доверительной вероятностью

где q – уровень значимости; xН , xВ – нижняя и верхняя границы интервала, находится истинное значение оцениваемого параметра. Принято границы доверительного интервала (доверительные границы) указывать симметричными относительно результата измерения.

В метрологической практике используют главным образом квантильные оценки доверительного интервала. Под Р-процентным квантилем xP понимают абсциссу такой вертикальной линии, слева от которой площадьпод кривой плотности распределения равна Р %. Иначе говоря, квантиль –это значение случайной величины (погрешности) с заданнойдоверительной вероятностью Р. Так как квантили, ограничивающие доверительный интервал погрешности могут быть выбраны различными, то при оцениваниислучайной погрешности доверительными границами необходимо одно -временно указывать значение принятой доверительной вероятности (например, ±0,3 В при Ρ = 0,95). Доверительные границы случайной погрешности Δx(P), соответствующие доверительной вероятности Р, находят по формуле-

 

где t – коэффициент, зависящий от Ρ и формы закона распределения

 

 

 

Рис. 17. К понятию доверительных интервалов

На графике нормального распределения погрешностей (рис. 4.11) по оси абсцисс отложены интервалы с границами ±σ, ±2σ, ±3σ, ±4σ. Доверительные вероятности для этих интервалов приведены в табл.

Границы доверительных интервалов и соответствующие им

доверительные вероятности

Как видно из этой таблицы, оценка случайной погрешности группы наблюдений интервалом ±1σ соответствует доверительной вероятности 0,68. Такая оценка не дает уверенности в высоком качестве измерений, поскольку 32% от всего числа наблюдений может выйти за пределы указанного интервала, что совершенно неприемлемо при однократных измерениях и дезинформирует потребителя измерительной информации. Доверительному интервалу ±3σ соответствует Ρ = 0,997. Это означает, что практически с вероятностью очень близкой к единице ни одно из возможных значений погрешности при нормальном законе ее распределения не выйдет за границы интервала. Поэтому, при нормальном распределении погрешностей, принято считать случайную погрешность с границами ±3σ предельной (максимально возможной) погрешностью. Погрешности, вы-

ходящие за эти границы, классифицируют как грубые или промахи. В целях единообразия в оценивании случайных погрешностей интервальными оценками при технических измерениях доверительна вероятность принимается равной 0,95. Лишь для особо точных и ответственных измерений (важных, например, для безопасности и здоровья людей) допускается применять более высокую доверительную вероятность. Итак, для получения интервальной оценки многократных наблюдений нормально распределенной случайной величины необходимо:

− определить точечные оценки МО и СКО Sx случайной величины по формулам (4.3) и (4.6) соответственно;

− выбрать доверительную вероятность Р из рекомендуемого ряда значений 0,90; 0,95; 0,99;

− найти верхнюю xВ и нижнюю xH границы в соответствии с уравнениями F(xH ) = q/ 2 =1− P/ 2 и F(xВ ) =1− q/ 2 =1+ P/ 2 .

Значения xН и xВ определяются из таблиц значений интегральной функции распределения F(t) или функции Лапласа Ф(t ). Полученный доверительный интервал удовлетворяет условию

 

где n – число измеренных значений; zр – аргумент функции Лапласа Ф(t ), отвечающей вероятности P/ 2. В данном случае zр называется квантильным множителем. Половина длины доверительного интервала

 

называется доверительной границей погрешности результата измерений.При отличии закона распределения случайной величины от нормальногонеобходимо построить его математическую модель ММ и определятьдоверительный интервал с ее использованием.

Рассмотренный способ нахождения доверительных интервалов справедлив для достаточно большого числа наблюдений n , когда σ = Sx . Следует помнить, что вычисляемая оценка СКО Sx является лишь некоторым приближением к истинному значению σ . Определение доверительного интервала при заданной вероятности оказывается тем менее надежным, чем меньше число наблюдений. Расчет доверительных интервалов для случая, когда распределение результатов наблюдений нормально, но их дисперсия неизвестна, т.е. при малом числе наблюдений n , можно выполнить с использованием распределения Стьюдента S(t, k ). Оно описывает плотность распределения отношения (дроби Стьюдента):

 

где Q – истинное значение измеряемой величины. Величины вычисляются на основании опытных данных и представляют собой точечные оценки МО, СКО результатов измерений и СКО среднего арифметического значения. Вероятность того, что дробь Стьюдента в результате выполненных наблюдений примет некоторое значение в интервале [ − tр ; + tр],

 

 

где k – число степеней свободы, равное (n −1). Величины t р (называемые коэффициентами Стьюдента), рассчитанные с помощью двух последних формул для различных значений доверительной вероятности и числа измерений, табулированы. Следовательно, с помощью распределения Стьюдента можно найти вероятность того, что отклонение среднего арифметического от истинного значения измеряемой величины не превышает

,

ε – половина длины доверительного интервала, или доверительная граница погрешности измерений. В тех случаях, когда распределение случайных погрешностей не является нормальным, все же часто пользуются распределением Стьюдента с приближением, степень которого остается неизвестной. Распределение Стьюдента применяют при числе измерений n < 30, поскольку уже при n = 20,…, 30 оно переходит в нормальное и вместо

уравнения (4.18) можно использовать уравнение (4.17). Результат измерения записывается в виде:

 

где PД – конкретное значение доверительной вероятности. Множитель t при большом числе измерений n равен квантильному множителю zр . Прималом n он равен коэффициенту Стьюдента.Полученный результат измерения не является одним конкретнымчислом, а представляет собой интервал, внутри которого с некоторойвероятностью PД находится истинное значение измеряемой величины. Выделение середины интервала X вовсе не предполагает, что истинное значение находится ближе к нему, чем к остальным точкам интервала. Оно может находится в любом месте интервала, а с вероятностью 1− PД даже вне его.

Недостатком оценивания случайной погрешности доверительным интервалом при произвольно выбираемых доверительных вероятностях является невозможность суммирования нескольких погрешностей, так как доверительный интервал суммы не равен сумме доверительных интервалов. В то же время необходимость в суммировании случайных погрешностей существует, когда нужно оценить погрешность суммированием ее составляющих, подчиняющихся к тому же разным законам распределения.

В теории вероятностей показано, что суммирование статистически независимых случайных величин осуществляется путем суммирования их дисперсий

 

Таким образом, для того чтобы отдельные составляющие случайной погрешности можно было суммировать расчетным путем, они должны быть представлены своими СКО, а не предельными или доверительными границами. Формула (4.19) правомерна только для некоррелированных случайных величин. В том случае, когда суммируемые составляющие погрешности коррелированны, расчетные соотношения усложняются, так как требуется учет корреляционных связей. Методы выявления корреляционных связей и их учет являются предметом изучения в теории вероятностей [2, 4, 7, 12]. Рассмотренные свойства распределений следует понимать как «идеальные», полученные на основе бесконечно большого числа опытов. В реальных условиях результат измерения получают либо путем обработки ограниченной группы наблюдений, либо на основе однократного измерения.

Одинаковость меры точности всех результатов измерений.

Пусть в результате независимых измерений некоторой неизвестной случайной величины m получены n выборок со средними значениями X1, X2, ..., Xn. Разности d1 = X1 - m, d2 = X2 - m, ..., dn = Xn - m являются взаимно независимыми случайными величинами и называются истинными ошибками. Измерения называют равноточными, если величины di имеют одинаковое распределениеи тогда выборки называются однородными. Таким образом, при равноточных измерениях истинные ошибки являются независимыми одинаково распределенными случайными величинами. Если выборки принадлежат различным законам распределения, которые различаются параметрами при одном и том же виде, или видом и параметрами распределения, то они неоднородные.

Задачи обработки выборок подразделяются на две группы. К первой группе относятся задачи объединения выборок. Объединение выборок позволяет повысить точность оценок за счет увеличения объема обрабатываемых ЭД. Простое слияние неоднородных выборок для последующей оценки показателей по объединенной выборке, приводит к снижению качества оценок или даже к их полной непригодности. Необходимо применение специальных приемов объединения разнородных сведений в интересах использования всей содержащейся в выборках информации. Таким образом, при объединении выборок необходимо сначала проверить их однородность. Однородные выборки сливаются в одну общую выборку, которая обрабатывается с помощью обычных методов. Неоднородные выборкиобрабатываются раздельно или объединяются с помощью специальных приемов.

Вторая группа задач связана с сопоставлением параметров распределения выборок, т.е. с определением существенных различий в значениях параметров однотипных выборок. Наиболее широкое распространение получил один из видов подобного рода задач, так называемый дисперсионный анализ. В дисперсионном анализе исследуются методы проверки гипотезы о равенстве математических ожиданий случайных величин, представленных выборками ограниченного объема. Непосредственное сравнение оценок математических ожиданий совокупности выборок оказывается менее эффективным, чем сопоставление оценок дисперсий, это обстоятельство и дало наименование методу. Подобные задачи возникают при исследовании влияния каких-либо параметров на показатели качества объекта, например: привела ли модернизация оборудования к снижению времени обработки запросов; влияет ли размер кэша второго уровня на производительность системы при решении конкретных задач обработки данных. Эти задачи решаются в рамках однофакторного дисперсионного анализа. В более сложных ситуациях исследуется влияние нескольких факторов на нескольких уровнях (многофакторный дисперсионный анализ). Далее будет рассмотрен только однофакторный анализ.

Итак, пусть имеются выборки по одному устройству, но полученные на различных интервалах времени наблюдений, или имеются выборки по однотипным устройствам, сформированные за один и тот же или различные периоды наблюдений. Количество таких поступивших на обработку выборок т – не менее двух, каждая выборка имеет свой объем пi, i=1,m . Априорных сведений об однородности или неоднородности различных выборок нет. Следовательно, объектом обработки выступает совокупность независимых выборок результатов наблюдений по одному и тому же показателю однотипных объектов

 

Эта совокупность состоит из m слоев (строк). Каждая i-я строка представляет собой однородную случайную выборку результатов наблюдений за значениями случайной величины X, Y, … , W соответственно. Слой характеризуется своим, в общем случае векторным, параметром Тi распределения и может иметь свои статистики, т.е. свои функции от выборочных значений.