測量的目的是為了得到測量結果,但在許多場合下僅給出測量結果往往還不充分。任何測量都存在缺陷,所有的測量結果都會或多或少地偏離被測量的真值,因此在給出測量結果的同時,還必須同時指出所給測量結果的可靠程度。在各種測量領域,經(jīng)常采用諸如測量誤差、測量準確度和測量不確定度等術語來表示測量結果質(zhì)量的好壞。
一、測量誤差的定義
測量誤差常常簡稱為誤差。國家計量技術規(guī)范JJF1001-1998《通用計量術語及定義》中給出測量誤差的定義為: 測量結果減去被測量的真值。 注:(1)由于真值不能確定,實際上用的是約定真值。 (2)當有必要與相對誤差相區(qū)別時,此術語有時稱為測量的絕對誤差。注意不要與誤差的絕對值相混淆,后者為誤差的模。 該誤差定義從20世紀70年代以來沒有發(fā)生過變化。 根據(jù)誤差的定義,若要得到誤差就必須知道真值。但真值無法得到,因此嚴格意義上的誤差也無法得到。雖然在誤差定義的注解中同時還指出:“由于真值不能確定,實際上用的是約定真值”,但此時還需考慮約定真值本身的誤差。因而可能得到的只是誤差的估計值。何況有些測量連約定真值都無法得到,例如,地球和月球之間距離的測量。對這一類既不可能知道其真值,又無法知道其約定真值的測量,是無法得到誤差的。 此外,在“誤差”這一術語的使用上也經(jīng)常出現(xiàn)概念混亂的情況,即“誤差”這一術語的使用經(jīng)常有不符合誤差定義的情況。根據(jù)誤差的定義,誤差是一個差值,它是測量結果與真值或約定真值之差。在數(shù)軸上它表示為一個點,而并不表示為一個區(qū)間或范圍。既然它是兩個量的差值,就應該是一個具有確定符號的量值。當測量結果大于真值時,誤差為正值;而當測量結果小于真值時,誤差為負值。由此可見,誤差這一參數(shù)既不應當也不可能以“±”號的形式表示。過去人們在使用“誤差”這一術語時,有時是符合誤差定義的,例如測量儀器的示值誤差,它表示“測量儀器的示值與對應輸入量真值之差”。但經(jīng)常也有誤用的情況,例如過去通過誤差分析所得到的測量結果的所謂“誤差”,實際上并不是真正的誤差,而是被測量不能確定的范圍,或者說是測量結果可能存在的最大誤差,它不符合誤差的定義。 必須要強調(diào)的是既然誤差等于測量結果減去被測量的真值(或約定真值),因此誤差只有通過測量才能得到。通過所謂的分析方法是得不到誤差的,或者說通過分析方法得到的不可能是誤差。
二、系統(tǒng)誤差和隨機誤差
誤差可以分為系統(tǒng)誤差和隨機誤差兩類。系統(tǒng)誤差的定義為: 在重復性條件下,對同一被測量進行無限多次測量所得結果的平均值與被測量的真值之差。 注:(1)如真值一樣,系統(tǒng)誤差及其原因不能完全獲知。 (2)對測量儀器而言,其系統(tǒng)誤差也稱為測量儀器的偏差。 由定義可知,系統(tǒng)誤差僅與無限多次測量結果的平均值有關,而與在重復性條件下得到的不同測量結果無關。因此,在重復性條件下得到的不同測量結果應該具有相同的系統(tǒng)誤差。 由于系統(tǒng)誤差和真值有關,而真值是無法確切知道的,只能用約定真值代替,因而可能得到的只是系統(tǒng)誤差的估計值,并具有一定的不確定度。系統(tǒng)誤差可以通過對測量結果進行修正而消除。由于誤差等于負的修正值,因此系統(tǒng)誤差的不確定度就是修正值的不確定度。 不宜按過去的說法將系統(tǒng)誤差分成已定系統(tǒng)誤差和未定系統(tǒng)誤差。也不宜說未定系統(tǒng)誤差按隨機誤差處理。未定系統(tǒng)誤差其實是不存在的,過去所說的未定系統(tǒng)誤差從本質(zhì)上說并不是誤差,而是不確定度。 系統(tǒng)誤差一般來源于影響量,它對測量結果的影響已經(jīng)被識別并可以定量地進行估算。這種影響稱之為“系統(tǒng)效應”。若該效應比較顯著,也就是說如果系統(tǒng)誤差比較大,則可在測量結果上加上修正值而予以補償,得到修正后的測量結果。 隨機誤差的定義為: 測量結果與在重復性條件下,對同一被測量進行無限多次測量所得結果的平均值之差。 注:(1)隨機誤差等于誤差減去系統(tǒng)誤差。 (2)因為測量只能進行有限次數(shù),故可能確定的只是隨機誤差的估計值。 根據(jù)定義,若測量結果為無限多次測量結果的平均值,顯然此時的隨機誤差為零,也就是說測量結果中已經(jīng)不含有隨機誤差分量,只存在系統(tǒng)誤差。但實際上不可能進行無限多次測量,因而在測量結果中隨機誤差和系統(tǒng)誤差分量都存在。在重復性條件下得到的不同測量結果具有不同的隨機誤差,但有相同的系統(tǒng)誤差。例如,在短時間內(nèi)對某一砝碼的質(zhì)量連續(xù)稱量兩次,雖然得到的測量結果可能不同,例如分別為10.006g和10.008g,即它們的隨機誤差各不相同,但它們的系統(tǒng)誤差是相同的。 直到現(xiàn)在,有許多關于誤差或不確定度的教科書中還經(jīng)常錯誤地將由多次重復測量結果計算得到的實驗標準差稱為“隨機誤差”。1993年前,隨機誤差被定義為在同一量的多次測量過程中,以不可預知方式變化的測量誤差分量。這里所謂的不可預知分量是指在相同測量條件下的多次測量中,誤差的符號及其絕對值變化不定的分量。其大小用多次重復測量結果的實驗標準差表示。 由于隨機變量的數(shù)學期望值等于對該隨機變量進行無限多次測量的平均值,因此也可以說,隨機誤差是指測量誤差中數(shù)學期望為零的誤差分量,而系統(tǒng)誤差則是指測量誤差中數(shù)學期望不為零的誤差分量。 根據(jù)定義,誤差、系統(tǒng)誤差和隨機誤差均表示兩個量值之差,因此隨機誤差和系統(tǒng)誤差也都應該具有確定的符號,同樣也不應當以“±”號的形式出現(xiàn)。由于隨機誤差和系統(tǒng)誤差都是對應于無限多次測量的理想概念,而實際上無法進行無限多次測量,只能用有限次測量的結果作為無限多次測量結果的估計值,因此可以確定的只是隨機誤差和系統(tǒng)誤差的估計值。 誤差經(jīng)常用于已知約定真值的情況,例如經(jīng)常用示值誤差來表示測量儀器的特性。
三、誤差、隨機誤差和系統(tǒng)誤差之間的關系
由誤差、隨機誤差和系統(tǒng)誤差的定義可知: 誤差=測量結果-真值 =(測量結果-總體均值)+(總體均值-真值) =隨機誤差+系統(tǒng)誤差 或測量結果=真值+誤差=真值+隨機誤差+系統(tǒng)誤差 圖1給出測量結果的隨機誤差、系統(tǒng)誤差和誤差之間關系的示意圖。無限多次測量結果的平均值也稱為總體均值。圖中的曲線為被測量的概率密度分布曲線,該曲線下方與橫軸之間所包含部分的面積表示測得值在該區(qū)間內(nèi)出現(xiàn)的概率,因此縱坐標表示概率密度。注意圖中表示隨機誤差、系統(tǒng)誤差和誤差的箭頭方向,向右表示其值為正,反之則為負值。由圖1可知,誤差等于隨機誤差和系統(tǒng)誤差的代數(shù)和。既然誤差是一個差值,因此任何誤差的合成,不論隨機誤差或系統(tǒng)誤差,都應該采用代數(shù)相加的方法。這一結論與我們過去常用的誤差合成方法不一致。過去在對隨機誤差進行合成時,通常都采用方和根法。兩者的區(qū)別在于隨機誤差定義的改變。
圖1 測量誤差示意圖
也有些作者將誤差分為四類:系統(tǒng)誤差、隨機誤差、漂移和粗差。但主要還是前面兩類。漂移是由不受控的影響量的系統(tǒng)影響所引起的,常常表現(xiàn)為時間效應或磨損效應。因此漂移可以用單位時間內(nèi)的變化或使用一定次數(shù)后的變化來表示。從實質(zhì)上來說,漂移是一種隨時間或隨使用次數(shù)而改變的系統(tǒng)誤差。 測量結果中還可能存在粗差,粗差是由測量過程中不可重復的突發(fā)事件所引起的。電子噪聲或機械噪聲可以引起粗差。產(chǎn)生粗差的另一個經(jīng)常出現(xiàn)的原因是操作人員在讀數(shù)和書寫方面的疏忽以及錯誤地使用測量設備。必須將粗差和其他幾種誤差相區(qū)分,粗差是不可能再進一步描述的。粗差既不可能被定量地描述,也不能成為測量不確定度的一個分量。由于粗差的存在,使測量結果中可能存在異常值。在計算測量結果和進行測量不確定度評定之前,必須剔除測量結果中的異常值。在測量過程中,如果發(fā)現(xiàn)某個測量條件不符合要求,或者出現(xiàn)了可能影響到測量結果的突發(fā)事件,可以立即將該數(shù)據(jù)從原始記錄中剔除,并記錄下剔除原因。在計算測量結果和進行不確定度評定時,異常值的剔除應通過對數(shù)據(jù)作適當?shù)臋z驗,并按一定的規(guī)則進行。 無論隨機誤差或系統(tǒng)誤差,所有的誤差從本質(zhì)上來說均是系統(tǒng)性的。如果發(fā)現(xiàn)某一誤差是非系統(tǒng)性的,則主要是因為產(chǎn)生誤差的原因沒有找到,或是對誤差的分辨能力不夠所致。因此,可以說隨機誤差是由不受控的隨機影響量所引起的。由隨機效應引入的不確定度可以用標準偏差以及分布類型來表示。多次測量結果的平均值常常作為估計系統(tǒng)誤差的基礎。
圖2 測量結果的誤差類型圖解
圖2給出幾種不同類型誤差的圖解。圖中,直線1表示真值,它是不隨時間而變化的,因此是一條與時間坐標平行的直線,但其位置是不可能確切知道的。2和3表示在兩個不同的時間t1和t2進行測量所得到的分散性,即被測量的概率密度分布曲線。由于漂移的存在,在兩個不同的時間得到的多次測量結果的平均值是不同的。斜線4表示測量結果的漂移,即無限多次測量結果的平均值隨時間的變化。5和6分別表示在時間t1和t2進行無限多次測量所得結果的平均值(即它們的數(shù)學期望值)。于是根據(jù)系統(tǒng)誤差的定義,它們與真值1的差7和8就分別表示在兩個不同時間t1和t2進行測量時的系統(tǒng)誤差。9和10分別表示在時間t1和t2具體進行測量時得到的某個測量結果。它們與無限多次測量結果的平均值5和6之差即為隨機誤差(圖中11和12)。兩條虛線之間所夾的區(qū)域為不確定區(qū)域,是測量結果可能出現(xiàn)的范圍。出現(xiàn)在不確定區(qū)域之外的測量結果13和14是在計算中應予以剔除的粗差。 測量結果的不確定度的定義為: 表征合理地賦予被測量之值的分散性,與測量結果相聯(lián)系的參數(shù)。 注:1.此參數(shù)可以是諸如標準偏差或其倍數(shù),或說明了置信水準的區(qū)間的半寬度。 2.測量不確定度由多個分量組成。其中一些分量可用測量列結果的統(tǒng)計分布估算,并用實驗標準偏差表征。另一些分量則可用基于經(jīng)驗或其他信息的假定概率分布估算,也可用標準偏差表征。 3.測量結果應理解為被測量之值的最佳估計,而所有的不確定度分量均貢獻給了分散性,包括那些由系統(tǒng)效應引起的(如,與修正值和參考測量標準有關的)分量。 首先要注意定義中“被測量之值”這一說法的含義。一般說來,“被測量之值”可以理解為被測量的真值,但在這里不能直接將“被測量之值”理解為“真值”,因為“真值的分散性”的說法無法理解。由于JJF1001-1998中給出“測量結果”的定義為:由測量所得到的賦予被測量的值,將兩者進行比較可以發(fā)現(xiàn)這里的“被測量之值”似乎應該可以理解為“測量結果”,但它與我們通過測量所得到的“測量結果”仍有差別。在對被測量進行測量時,最后給出一個測量結果,它是被測量的最佳估計值(可能是單次測量的結果,也可能是重復性條件下多次測量的平均值)。而這里“被測量之值”應理解為許多個測量結果,其中不僅包括通過測量得到的測量結果,還應包括測量中沒有得到但又是可能出現(xiàn)的測量結果。例如,用一臺電壓表測量某一電壓,且電壓表讀數(shù)不加修正值,若對于該測量點電壓表的最大允許誤差為±1V,用該電壓表進行了20次重復測量,則該20個讀數(shù)的平均值就是測量結果,還可以由它們得到測量結果的分散性。但“被測量之值”的分散性就不同了,它除了包括測量結果的分散性外,還應包括在受控范圍內(nèi)改變測量條件(例如溫度)所可能得到的測量結果,當電壓表的示值誤差在最大允許誤差范圍內(nèi)變化時所可能得到的測量結果,以及所有系統(tǒng)效應對測量結果的影響。由于后者不可能在“測量結果的分散性”中出現(xiàn),因此“被測量之值的分散性”應比“測量結果的分散性”大,也包含更多的內(nèi)容。這就是在定義的注3中所說的在分散性中應包括那些由系統(tǒng)效應所引起的不確定度分量,而系統(tǒng)效應引入的不確定度分量在測量結果的分散性中并沒有反映出來。 根據(jù)定義,測量不確定度表示被測量之值的分散性,因此不確定度表示一個區(qū)間,即被測量之值可能的分布區(qū)間。這是測量不確定度和測量誤差的最根本的區(qū)別,測量誤差是一個差值,而測量不確定度是一個區(qū)間。在數(shù)軸上,誤差表示為一個“點”,而不確定度則表示為一個“區(qū)間”。 測量不確定度是測量者合理賦予給測量結果的,因此測量不確定度將或多或少與評定者有關,例如與評定者的經(jīng)驗、知識范圍、認識水平等有關。因此測量不確定度評定將或多或少帶有一些主觀色彩。定義中的“合理”是指應該考慮各種因素對測量結果的影響所作的修正,特別是測量應處于統(tǒng)計控制狀態(tài)下,即處于隨機控制過程中。也就是說測量應在重復性條件或復現(xiàn)性條件下進行。 為了表征這種分散性,測量不確定度可以用標準偏差,或標準偏差的倍數(shù),或說明了置信水準區(qū)間的半寬度來表示。 當測量不確定度用標準偏差σ表示時,稱為標準不確定度,統(tǒng)一規(guī)定用小寫拉丁字母“u”表示,這是測量不確定度的第一種表示方式。但由于標準偏差所對應的置信水準(也稱為置信概率)通常還不夠高,在正態(tài)分布情況下僅為68.27%,因此還規(guī)定測量不確定度也可以用第二種方式來表示,即可以用標準偏差的倍數(shù)kσ來表示。這種不確定度稱為擴展不確定度,統(tǒng)一規(guī)定用大寫拉丁字母U表示。于是可得標準不確定度和擴展不確定度之間的關系: U=kσ=ku 式中k為包含因子。 擴展不確定度U表示具有較大置信水準區(qū)間的半寬度。包含因子有時也寫成kp的形式,它與合成標準不確定度uc(y)相乘后,得到對應于置信水準為p的擴展不確定度Up=kpuc(y)。 在不確定度評定中,有關各種不確定度的符號均是統(tǒng)一規(guī)定的,為避免他人的誤解,一般不要自行隨便更改。 在實際使用中,往往希望知道測量結果的置信區(qū)間,因此還規(guī)定測量不確定度也可以用第三種表示方式,即說明了置信水準的區(qū)間的半寬度a來表示。實際上它也是一種擴展不確定度,當規(guī)定的置信水準為p時,擴展不確定度可以用符號Up表示。 測量不確定度的第二種和第三種表示方式給出的實際上都是擴展不確定度。當已知包含因子k時,擴展不確定度U是從其中包含多少個(k個,k即為包含因子)標準不確定度u的角度出發(fā)所描述的擴展不確定度。而當p已知時,擴展不確定度Up則是從該區(qū)間所對應的置信水準p的角度出發(fā)來描述的擴展不確定度。對于前者,已知k而不知道p,后者則正好相反,已知p而不知道k。兩者各自分別從不同的角度出發(fā)來描述擴展不確定度,因此包含因子k與置信水準p之間應該存在某種函數(shù)關系,但它們之間的關系與被測量的概率密度分布有關。也就是說,只有在知道被測量分布的情況下,才可以由k確定p或由p確定k。而在測量不確定度評定中,經(jīng)常會遇到已知置信水準p而需要確定包含因子k的情況,這就是為什么在測量不確定度評定中經(jīng)常需要考慮各輸入量以及被測量分布的原因。而在過去的誤差評定中一般不討論分布問題。 JJF1059-1999規(guī)定,當置信水準p為0.99和0.95時,Up可分別簡單地以U99和U95表示。 誤差可以用絕對誤差和相對誤差兩種形式來表示,不確定度也同樣可以有絕對不確定度和相對不確定度兩種形式。絕對形式表示的不確定度與被測量有相同的量綱。相對形式表示的不確定度,其量綱為1,或稱為無量綱。絕對不確定度常簡稱為不確定度,而相對不確定度則往往在其不確定度符號“U”或“u”上加上腳標“rel”以示區(qū)別。被測量x的標準不確定度u(x)和相對標準不確定度Urel(x)之間的關系為: 擴展不確定度也同樣可以有絕對和相對兩種形式,絕對擴展不確定度U(x)和相對擴展不確定度Urel(x)之間也有同樣關系: 在計算相對不確定度時,分母中的x應取其真值。由于真值無法知道,實際上用的是約定真值。而在實際工作中一般常以該量的最佳估計值,即測量結果來代替。 若隨機變量x的值有可能為零,則不能采用相對誤差或相對不確定度的表示形式。例如,在對測量儀器進行校準時,被測量是儀器的示值誤差。在表示所測得的示值誤差的不確定度時,就不應該用相對不確定度來表示,因為測量儀器的示值誤差有可能為零。 由于測量結果會受許多因素的影響,因此通常不確定度由多個分量組成。評定方法分為A、B兩類。測量不確定度的A類評定是指用對觀測列進行統(tǒng)計分析的方法進行的評定,其標準不確定度用實驗標準差表征;而測量不確定度的B類評定則是指用不同于對觀測列進行統(tǒng)計分析的方法進行的評定。因此可以說所有與A類評定不同的其他評定方法均稱為B類評定,它可以由根據(jù)經(jīng)驗或其他信息的假定概率分布估算其不確定度,也以估計的標準偏差表征。所有各不確定度分量的合成稱為合成標準不確定度,規(guī)定以符號uc表示,它是測量結果的標準偏差的估計值。 由于無論A類評定或B類評定,它們的標準不確定度均以標準偏差表示,因此兩種評定方法得到的不確定度實質(zhì)上并無區(qū)別,只是評定方法不同而已。在對各不確定度分量進行合成得到合成標準不確定度時,兩者的合成方法也無區(qū)別。因此在進行不確定度評定時,過分認真地討論每一個不確定度分量究竟屬于A類評定或是B類評定是沒有必要的。 不少人習慣上將由A類評定和B類評定得到的不確定度分別方便地稱為A類不確定度和B類不確定度。這一說法也未嘗不可,但不能由此而得到一個不恰當?shù)慕Y論:不確定度分為A類不確定度和B類不確定度兩類。對不確定度本身并不分類,每一個分量的標準不確定度都要用標準偏差表示,而所謂的A類和B類僅是為了敘述方便起見而對其按評定方法進行的分類,而不是對不確定度本身的分類。 根據(jù)定義,測量不確定度是與測量結果相聯(lián)系的參數(shù),意指測量不確定度是一個與測量結果“在一起”的參數(shù),在測量結果的完整表述中應該包括測量不確定度。 |