Неопределенность измерений
В конце 70-ых в начале 80-ых годов прошлого столетия Международное бюро мер и весов (МБМВ) создало Рабочую группу по составлению отчета о неопределенностях, которая разработала первую Рекомендацию INC-1 «Выражение экспериментальных неопределенностей». Рекомендация, которая является весьма кратким документом, была принята Международным комитетом мер и весов (МКМВ) в 1981 г. и вновь утверждена в 1986 г. Перевод Рекомендации INC-1 представлен в Приложении 1 к данному разделу. Задачу разработки подробного руководства, основанного на Рекомендации Рабочей группы, МКМВ передала Международной организации по стандартизации (ИСО).
Ответственность была возложена на Техническую консультативную группу по метрологии ИСО (TAG 4), поскольку одной из ее задач является координация развития основных направлений в области измерений, которые представляют взаимный интерес для ИСО и шести организаций, принимающих участие вместе с ИСО в работе TAG 4. Эти организации: Международная электротехническая комиссия (МЭК); МКМВ; Международная организация законодательной метрологии (МОЗМ); Международный союз по чистой и прикладной химии (ИЮПАК); Международный союз по чистой и прикладной физике (ИЮПАП) и Международная федерация клинической химии (МФКХ).
Рабочая группа 3 (ISO/TAG 4/WG 3), состоящая из назначенных TAG 4 экспертов, разработала «РУКОВОДСТВО ПО ПРЕДСТАВЛЕНИЮ НЕОПРЕДЕЛЕННОСТИ ИЗМЕРЕНИЯ» (далее Руководство), которое должно нормировать отчеты о неопределенностях, что создает основу для международного обмена измерительной информацией и признания результатов измерений.
Цели Руководства сформулированы в следующем виде:
· обеспечить полную информацию о том, как составлять отчеты о неопределенностях;
· предоставить основу для международного сличения результатов измерений.
Единый подход к оценке и выражению неопределенности измерений в международном масштабе поможет обеспечить однозначное понимание и корректное использование результатов измерений в науке, технике, торговле, промышленности и нормативных актах. Для обеспечения единства измерений необходимо наличие общепризнанной методики, позволяющей получать единообразные характеристики качества измерения, например, пригодные для выражения неопределенности измерения.
В соответствии с поставленными целями Руководство утверждает, что по итогам измерений некоторой физической величины должен составляться отчет. Отчет должен давать пользователю представление о качестве измерений и достоверности полученных результатов, которое позволит корректно проводить разбраковку объектов, сличать результаты независимых измерений одной и той же физической величины и решать другие задачи.
Разработчики Руководства утверждают, что даже если в результат внесены поправки на все известные и предполагаемые составляющие погрешности, остается неопределенность в отношении истинности указанного результата (или остается сомнение в уровне достоверности, с которым результат измерения представляет значение измеряемой величины).
Понятие «неопределенность», как наименование количественно оцениваемого свойства измерения, фактически введено как термин-конкурент термину «случайная погрешность», который традиционно используют в метрологии. Термин «неопределенность» введен потому, что по мнению авторов Руководства, «погрешность» – идеализированное понятие и поскольку погрешности не могут быть известны точно, применение термина следует ограничить.
В Руководстве сказано, что оно устанавливает общие правила оценивания и выражения неопределенности измерения, которые следует соблюдать при различных уровнях точности и во многих областях, начиная от магазина до фундаментальных исследований. Руководство предназначено для использования в широком спектре измерений, включая:
· измерения для поддержания контроля качества и обеспечения качества в процессе производства;
· измерения в ходе фундаментальных и прикладных исследований и разработок в науке и технике;
· измерения калибровочных мер и приборов;
· измерения в рамках всей национальной системы измерений для обеспечения единства измерений;
· измерения для разработки, поддержания и сличения международных и национальных эталонов единиц физических величин, включая стандартные образцы свойств веществ и материалов.
Руководстворассматривает выражение неопределенности измерения «хорошо определенной физической величины» – измеряемой величины, характеризуемой единственным значением. Если явление, представляющее интерес, можно представить только как распределение значений или оно является функцией одного или более параметров, изменяющихся во времени, речь идет не об одной измеряемой величине, а о ряде одноименных величин, описывающих это распределение или эту зависимость.
Как записано в Руководстве, оно дает общие правила оценивания и выражения неопределенности измерения, а не подробные технологические инструкции. В нем не рассматривают возможности использования частной оценки неопределенности конкретного измерения для различных целей, вопросы безопасности определенного хода операций. В Руководстве не анализируются возможности делать выводы о совместимости результатов с аналогичными, проблемы установления допусков и ряд других. Поэтому разработчики считают, что может возникнуть необходимость создания конкретных стандартов, основанных на Руководстве, в которых регламентируются решения задач, характерных для специфичных областей измерений, или различные применения количественных выражений неопределенности.
Особое внимание следует обратить на следующие положения, зафиксированные в Руководстве(цитируется по официальному переводу ВНИИМ):
3.2.4 Предполагают, что в результат измерения внесены поправки на все известные значимые систематические эффекты и что предприняты все усилия, чтобы узнать такие эффекты.
3.4.7 Грубые ошибки при регистрации или анализе данных могут вносить значительную неизвестную погрешность в результат измерения. Большие грубые ошибки обычно можно распознать путем должной проверки данных: небольшие – могут быть замаскированы или даже проявиться и виде случайных изменений. Меры неопределенности не предназначены дать объяснение таким ошибкам.
Иными словами, Руководство направлено на получение вероятностной оценки неопределенности измерений после того, как исключены результаты с грубыми погрешностями и все значимые систематические составляющие погрешности измерений. В оставшейся измерительной информации в традиционном метрологическом представлении присутствуют только собственно случайные составляющие погрешности измерений и неисключенные остатки систематических составляющих погрешности. Если эти неисключенные остатки считать рандомизированными, можно рассматривать параметры и характеристики случайных распределений ансамблей неисключенных остатков систематических погрешностей.
Из этого следует, что к оцениванию неопределенности следует приступать только после исключения результатов с грубыми погрешностями и исправления результатов измерений («исключения систематических эффектов»), то есть неопределенность есть характеристика случайных составляющих результатов измерений и (возможно) неисключенных остатков систематических погрешностей.
Такой подход позволяет обоснованно применять математический аппарат теории вероятностей и математической статистики к «исправленным результатам измерений», так же, как это делается в традиционной метрологии. Различия заключаются лишь в том, что Руководство акцентирует внимание на случайных составляющих погрешности и недостаточно внимательные пользователи «не замечают» настоятельных требований исключить значимые систематические составляющие.
В «Руководстве» представлено следующее «формальное определение термина "неопределенность измерения"», включенное в Международный словарь по метрологии (VIМ): неопределенность (измерения) есть параметр, связанный с результатом измерения, который характеризует дисперсию значений, которые могли быть обоснованно приписаны измеряемой величине.
ПРИМЕЧАНИЯ.
1 Параметром может быть, например, стандартное отклонение (или данное кратное ему) или полуширина интервала, имеющего установленный уровень доверия.
2 Неопределенность измерения обычно включает много составляющих. Некоторые из этих составляющих могут быть оценены из статистического распределения результатов рядов измерений и могут характеризоваться экспериментальными стандартными отклонениями. Другие составляющие, которые также могут характеризоваться стандартными отклонениями, оценивают из предполагаемых распределений вероятностей, основанных на опыте или другой информации.
3 Очевидно, что результат измерения является наилучшей оценкой значения измеряемой величины и что все составляющие неопределенности, включая те, которые возникают от систематических эффектов, таких как составляющие, связанные с поправками и эталонами сравнения, вносят вклад в дисперсию.
Не вполне корректное определение дополнено пояснением «слово "неопределенность", используемое без прилагательных, относится как к общему понятию, так и к любым или всем количественным мерам этого понятия».
Таким образом, авторы руководства предлагают неоднозначное истолкование термина, что стандартизация категорически исключает.
Далее в Руководстве сказано, что это определение является рабочим и сфокусировано на результат измерения и его оцененную неопределенность, однако оно не расходитсяс другими понятиями неопределенности измерения, такими как:
· мера возможной погрешности оцененного значения измеряемой величины, полученной как результат измерения;
· оценка, характеризующая диапазон значений, в пределах которого находится истинное значение измеряемой величины (VIМ, первое издание, 1984).
В Руководстве отмечается, что эти два традиционных понятия справедливы как идеальные, но они сосредоточивают внимание на неизвестныхвеличинах: «погрешность» результата измерения и «истинное значение измеряемой величины». Поэтому разработчики Руководства предлагают «новый подход», якобы свободный от использования неизвестныхвеличин.
Руководство предлагает следующие «специфичные термины».
Стандартная неопределенность – неопределенность результата измерения, выраженная как стандартное отклонение.
Оценка (неопределенности) по типу А – метод оценивания неопределенности путем статистического анализа рядов наблюдений.
Оценка (неопределенности) по типу В – метод оценивания неопределенности иным способом, чем статистический анализ рядов наблюдений.
Суммарная стандартная неопределенность – стандартная неопределенность результата измерения, когда результат получают из значений ряда других величин, равная положительному квадратному корню суммы членов, причем члены являются дисперсиями или ковариациями этих других величин, взвешенными в соответствии с тем, как результат измерения изменяется в зависимости от изменения этих величин.
Расширенная неопределенность – величина, определяющая интервал вокруг результата измерения, в пределах которого можно ожидать, находится большая часть распределения значений, которые с достаточным основанием могли быть приписаны измеряемой величине.
Коэффициент охвата – числовой коэффициент, используемый как множитель суммарной стандартной неопределенности для получения расширенной неопределенности.
ПРИМЕЧАНИЕ – Коэффициент покрытия k обычно находится в диапазоне от 2 до 3.
Перечень проявляет типичные для Руководства недостатки существенно затрудняющие его использование. В нем не различают результат («оценка неопределенности») и процесс («оценивание неопределенности»). По вине переводчика безграмотно описаны весовые коэффициенты составляющих («взвешенные в соответствии с тем, как результат измерения изменяется в зависимости от изменения этих величин»). Снова нарушают правила стандартизации терминов, предлагая два разных термина для одного понятия («коэффициент охвата» и «коэффициент покрытия»).
В классификации методов оценивания неопределенности на тип А и тип В представлены два различных способа получения оценки составляющих неопределенности. Оба они основаны на вероятностном оценивании распределений случайных величин, а составляющие неопределенности при любом типе оценивания количественно представляют как оценки дисперсией или стандартных отклонений.
Различия двух типов оценивания заключаются только в методе получении оценки: прямое получение оценки путем статистического анализа рядов наблюдений (оценивание неопределенности по типу А), или получение оценки без непосредственного статистического анализа рядов наблюдений (оценивание неопределенности по типу В). Стандартную неопределенность при оценивании по типу В получают из предполагаемой функции плотности вероятностей, причем по возможности используют оценки, полученные в ходе метрологических мероприятий.
Руководство утверждает, что для оценивания неопределенности по типу В могут быть использованы:
· данные предшествовавших измерений аналогичных величин, включая сведения о виде распределения вероятностей;
· сведения изготовителя о средствах измерений, данные поверки, калибровки, метрологической аттестации прибора и др., к которым при необходимости дополнительно приписывают виды распределения вероятностей;
· данные из справочников, стандартов, технических условий и т.п. источников, дополняемые общими знаниями о свойствах соответствующих средств измерений и о видах распределения вероятностей;
· оценки неопределенности констант и справочных данных, представленные в информационных источниках;
· данные, основанные на опыте исследователя в соответствующей области метрологии.
Значения неопределенностей в информационных источниках обычно представлены в виде границ некоторого интервала (например, указанием предельных отклонений значения величины от ее точечной оценки), который можно рассматривать как аналог расширенной неопределенности. Для получения оценки стандартной неопределенности в таком случае необходимо выбрать аппроксимацию предполагаемого распределения случайной величины. Наиболее распространенным способом формализации неполного знания о ней является постулирование равновероятного распределения возможных значений этой величины в указанных границах.
Расширенную неопределенность U получают умножением суммарной стандартной неопределенности u, на коэффициент охвата k. Фактически U представляет собой доверительный интервал, который с выбранной вероятностью накрывает истинное значение измеряемой величины. Коэффициент охвата k зависит от вида приписанного распределения и выбранной доверительной вероятности.
По определению суммарная стандартная неопределенность измерения, представляет собой оценку среднего квадратического отклонения результата косвенных измерений, посколькурезультатизмерения получают из значений ряда других величин.Суммарную стандартную неопределенность при этом рассчитывают как значение квадратного корня из суммы дисперсий (или ковариаций) этих величин с учетом весовых коэффициентов. Учет весовых коэффициентов, получаемых дифференцированием функции в частных производных, является характерным как раз для оценки среднего квадратического отклонения результата косвенных измерений.
Однако при оценке среднего квадратического отклонения результата прямых измерений по составляющим результат также получают как значение квадратного корня из суммы дисперсий всех составляющих. В этом случае также необходимо учитывать весовые коэффициенты составляющих (если они не одинаковы).
Следовательно, понятие «суммарная стандартная неопределенность», которое является аналогом доверительных границ случайной погрешности результата измерений следует рассматривать в двух вариантах:
· оценка неопределенности прямых измерений, получаемая «суммированием» нескольких составляющих, например, оценок неопределенностей применяемого прибора и мер при измерении методом сравнения с мерой, либо «суммированием» неопределенностей случайной составляющей и неисключенной систематической, которые могут оцениваться по типам А и/или В;
· оценка неопределенности косвенных измерений, получаемая «суммированием» оценок составляющих неопределенностей прямых измерений, входящих в функциональную зависимость для расчета результата косвенных измерений.
Очевидно, что для оценки суммарной неопределенности необходимы оценки всех значимых составляющих неопределенности, которые могут быть получены путем оценивания по типу А или по типу В.
В Руководстве описаны методы оценивания всех неопределенностей (стандартной, суммарной стандартной и расширенной неопределенности).
Взаимосвязь Руководства с традиционной метрологией
(вспомогательные материалы)
В п. 3.2 Руководства, названном «Погрешности, эффекты и поправки», рассматривается ключевой вопрос о систематической и случайной составляющих погрешности измерений, которые и составляют суть сопоставляемого с Руководством раздела традиционной метрологии.
В соответствии с положениями Руководства: «3.2.1 Обычно измерение обладает рядом несовершенств, которые вызывают погрешность результата измерения. Традиционно погрешность рассматривают как состоящую из двух составляющих – случайной и систематической.
ПРИМЕЧАНИЕ – Погрешность – идеализированное понятие, и погрешности не могут быть известны точно».
Прикладная метрология всегда признавала этот факт и оперировала понятиями «оценка погрешности», «норма погрешности», не отрицая несоответствие оценки погрешности ее идеальному (а потому недостижимому) значению. Исходя из этого, можно утверждать, что введение понятия неопределенность не внесло в традиционную метрологию ничего принципиально нового.
Особое внимание следует обратить на содержание п. 3.4.8 «Руководства».
«Хотя это Руководство дает схему определения неопределенности, оно не может заменить критическое размышление, интеллектуальную честность и профессиональное мастерство. Оценка неопределенности не является ни рутинной работой, ни чисто математической; она зависит от детального знания природы измеряемой величины и измерения. Поэтому качество и ценность упомянутой неопределенности результата измерения, в конечном счете, зависит от понимания, критического анализа и честности тех, кто участвует в приписывании ее значения».
Иными словами, Руководство не может заменить традиционную метрологию, знание которой необходимо для его корректного применения. Фактически Руководство регламентирует порядок и методику оценивания случайных составляющих результата измерений в качественном и количественном отношении после элиминации результатов с грубыми погрешностями и исключения систематических погрешностей («систематических эффектов»).
В Руководстве дается такая интерпретация термина неопределенность:
Слово «неопределенность» означает сомнение и, таким образом, в своем самом широком смысле «неопределенность измерения» означает сомнение относительно достоверности результата измерения. Из-за отсутствия различных слов для этого общего понятия неопределенности и специальных величин, которые дают количественные меры этого понятия, как, например, стандартное отклонение, необходимо использовать слово «неопределенность» в этих двух различных смыслах.
Можно предложить более корректный подход, в рамках которого различают неопределенность измерения (качественная оценка измерения, связанная с недостатком информации по его конкретным аспектам), и количественные оценки неопределенности, приписываемые измеряемой физической величине.
Под неопределенностью измерений фактически подразумевают то, что результат измерений фиксируется не конкретной точкой на оси физической величины, а интервалом значений, и то, что неизвестной (неопределенной) остается координата истинного значения. В более широком смысле можно говорить также и о неопределенности «закона распределения» результатов многократных наблюдений при измерении конкретной физической величины. Графическое отображение неопределенности представлено на рисунке 9.1.
р Р 0 Q Х – ku + ku Рисунок 9.1 – Графическая интерпретация неопределенности измерений при нормальном распределении случайной погрешности |
На рисунке отражены качественная оценка неопределенности (нормальное распределение), а также ее количественные оценки (стандартная неопределенность u и расширенная неопределенность ku при выбранной доверительной вероятности Р).
Исследование (качественное и количественное) неопределенности измерений обычно осуществляется в ходе анализа методики выполнения измерений и/или математической обработки результатов многократных наблюдений, полученных при измерении одной физической величины. В исследование обычно входят:
· нахождение оценок дисперсий или стандартных отклонений составляющих интегральную оценку неопределенности измерений и при необходимости их весовых коэффициентов (в литературе используют термин «бюджет неопределенности»);
· нахождение сопоставимых оценок случайной составляющей и неисключенных остатков систематической составляющей результата измерений и сравнение их значений;
· проверка по критериям согласия гипотез о видах распределения случайных составляющих, а при необходимости – и распределения неисключенных остатков «систематических эффектов»;
· статистическая проверка экстремальных наблюдений и отбраковывание наблюдений, содержащих «грубые ошибки» (грубые погрешности).
Неопределенность в оценке результатов, полученных, например, при измерении конкретной физической величины с многократными наблюдениями, зависит от множества объективных и субъективных причин, основные из которых:
· использованные технические ресурсы (средства измерений, организация среды в зоне измерений и др.);
· число наблюдений в серии;
· выбор гипотез о «законах распределения», критериев согласия, уровней значимости при проверке гипотез по критериям согласия;
· выбор метода отбраковывания наблюдений с явно выраженными грубыми погрешностями, «подозрительных» наблюдений, критериев статистического отбраковывания, уровней значимости при проверке гипотез по этим критериям;
· выбор значения доверительной вероятности для описания результата измерений.
Последний фактор можно признать несущественным, поскольку формы представления результатов измерений фактически позволяют пользователю перейти от зафиксированного в описании значения доверительной вероятности к любому выбранному.
Анализ показывает, что неопределенность измерений есть комплексное явление, обусловленное техническими возможностями и квалификацией метрологов, организующих и выполняющих измерения. В узкой трактовке неопределенность измерений связывают только с оценками погрешностей измерений, а более конкретно – с усеченной областью их распределения, полученной в результате статистической обработки данных многократных наблюдений при измерениях.
Для удобства тех, кто не имеет под рукой самого Руководства, в Приложениях к данному модулю кроме РЕКОМЕНДАЦИИ INC-1 «Выражение экспериментальных неопределенностей» (Приложение 1), приведены также выдержки из Руководства (Приложение 2). Цитаты даны в полном соответствии с официальным переводом ВНИИМ с сохранением стиля.