一、总体标准偏差、实验标准偏差和合并样本标准偏差总体标准偏差(population standard deviation)规范化的符号为σ,定义为:σ=Ni=1#Σ(xi-μ)2/N"(1) 式中:μ——总体均值,N次测量结果分布的期望;N——测量次数,N接近无穷大;xi——N 个测量结果中的第i个值。在xi的不确定度评定中,由于N不可能接近无穷大而只用实验标准偏 差s作为其估计,但s只是σ的一个偏小的估计,也就是说有以下情况:s可能大于或小于σ,即 s>σ或s<σ。但它们的概率不等,即s>σ的概率小于50%,而s<σ的概率大于50%。 这种情况在重复观测次数n较小时尤为明显。不过,当n≥4的情况下,这种偏小的情况在不确定度评定中就可不予考虑。σ又称之为真标准偏差(truestandard deviation)。含义是准确的值、理想或理论上的值,而s由于是按有限次数n所评定,只是一个近似值或估计值。实验标准偏差(experimental standard deviation)s定义为:s(xi)=ni=1Σ(xi-x)2n-1#"(2)式中: s(xi)——任意一个测量结果xi的实验标准偏差;xi——第i个测量结果;n——对同一 被测量在规定条件下(既可以是重复性条件,也可以是某给定的复现性条件)的独立重复观测次数 ;x——n个xi的算术平均值,它是μ的无偏估计。由于式(2)所表示的是测量结果xi分散 性的一个量,表达的是一个区间大小,因而在式子右边开方后不取正负号而只取正值(一般不再冠 以符号)。式(2)与xi的分布状态无关。尽管xi的残差vi=xi-x是xi的随机误差估 计值(任何一个测量结果中所包含的随机误差只可能有估计值而不可能有真值),但s(xi)不 能作为测量结果xi的随机误差的估计。所有这些重复的测量结果,没有一个共同的随机误差之估 计,而s(xi)只是这些测量结果分布的标准偏差或误差分布的标准偏差。当重复观测是在重复 性条件下进行的情况下,式(2)给出的s(xi)为重复性标准偏差sr,即方法所确认的重复 性标准差,有的规范用rep作为其符号。如是在复现性条件下所得到则称之为复现性标准差sR 。通过式(2)所得出的s(xi)的不可靠程度达到1/"#2(n-1)。因此,n越大所得 s越可靠。例如,如果要求其不可靠的程度小于1/10,则n应大于50。在不确定度评定中, 比较理想的是n≥30,一般能达到n≥20就很好了。合并样本标准偏差或组合样本偏差(pooledexperimentalstandard deviation;pooled estimate of standarddeviation)sp在ISO等7个国际组织公布的《测量不确定度表示指南》(Guide to the Expression of Uncertainty in Mea-surement)(1993)的正文与附录中均未提及。sp是通过多个被测量的重复 观测结果,按统计方法所获得的任意一次结果xi的实验标准偏差,更为确切地表示为sp(xi )。在计量技术规范JJF1059-1999《测量不确定度评定与表示》的4.2和4.3节 中给出了几种sp(xi)的评定方法。采用sp是个简单、方便而且能够可靠地得到标准偏差的 方法。它与实验标准偏差s没有本质上的区别而只是评定计算的方法不同。二、采用合并样本标准 偏差的必要前提在JJF1059的4.3节中强调了规范化的常规测量。这是个必要前提,但并 非充分前提。这一前提应理解为整个测量过程,包括从取样、样品的预处理、测量仪器的等级或技 术要求、数据的处理一直到最后所得到的被测量最佳估计值这一全过程,也包括各影响量的取值及 其测量均应是规范化的。除此之外,还有一个必要前提是,这些被测量之值虽然大小各异,但其差 别对单次测量结果qk的sr并不带来2006.3中国计量Email:chinametro logy@263.net明显影响。如果被测量之值的大小与sr有明显的相关性,例如sr随 被测量之值的增大而相应地增大,那么,应该对被测量之值限定某个范围,也可以把被测量之值按 不同的sr划分为若干档次进行分别评定,也可以通过历次所测量的不同大小的被测量所得到的不 同大小的sr(尽管其自由度不大),拟合成一条曲线。而通过被测量数量的增加,可以使这一曲 线充分可靠。例如:按ZBG12019-1989测量锑的质量分数、氧化钠的质量分数,其重 复性标准差均可不分档次给出;按GB6549-1996氯化钾产品中的水分质量分数w(H2 O),按小于和等于4%与大于4%分两个档次给出;按SH/T0253-1992的方法轻质 石油产品中总硫含量测量结果的重复性标准差则应按总含量(质量分数)的变化给出一个拟合直线 。按GB/T6600-1986的方法,则应按对工业用裂解碳四中组分平均质量分数的大小, 用曲线给出其测量结果的重复性标准差。三、通过过去对若干被测量Q的重复条件下观测结果评定 sp(qk)的方法与实例为了方便计算,应挑选过去对Q重复观测次数n相同的记录。对于n并 不要求很大,例如n=3、4或6均可,甚至只重复了两次(n=2)。设共有m张过去的检测记 录,各为一个Q的测量,因此包括m个被测量,在每张记录中均有n个平行测量结果的平均值而可 算出n个残差v。m张记录共可得m·n个残差,全部残差的平方和除以m(n-1)即单次测量 结果的合并样本方差sp2(qk),其自由度达到m(n-1)。例:历次对每个Q的重复观测 次数n=6的记录共10张(m=10个被测量),其观测结果与各张上的平均值如表1。表3中 的m=10个∑vi2之和,即m·n=60个残差之和为43265×10-6,所以m(n- 1)=10×(6-1)=50得sp2(qk)=43265×10-6/50=865×10 -6sp(qk)=29.5×10-3即任意一次qk的合并样本标准偏差,自由度为m(n- 1)=50,即总测量次数减被测量个数。四、通过过去对若干被测量Q的两次重复条件下测量结 果之差Δi评定sp(qk)的方法与实例两次结果之差Δi的标准偏差与s(Qk)之间存在: s(Δi)="!2s(qk)因此,按统计方法评定出s(Δi)后即可计算出s(qk)=s (Δi)/"$2,而s(Δi)可通过若干被测量Q的两次重复观测结果计算出Δi,代入贝塞 尔公式得出,即:s(Δi)=mi=1Σ(Δi-Δ)2m-1!"式中:m——参与评定的Q 的个数;Δ——所得m个Δi的算术平均值。例:设对m=20个被测量Q各进行两次平行试验的 历次检验记录中分别得出的q1与q2列入表4,并计算出其差值Δi和Δ,表中给出了差值残差 的vi=Δi-Δ以及vi2。Δi=210i2=01ΣΔi=7280×10-3=3.9× 10-320i=1Σvi2=115.8×10-6s(Δi)=20i=1Σvi220-1!"="$115.8×10-6/19=6.1×10-3表110个被测量Q的检测结果表2按表1所得出的60个残差7676技术篇TECH N O LO G Y SEC TIO N误差与不确定度中国计量2006.3Email:chinametrology@263.n et计sp(qk)=6.1×10-3/!"2=4.3而其两次结果平均值q的重复性标准偏 差为s(q)=sp(qk)/!"2=3×10-3自由度为20-1=19五、通过若干被测 量Q的平均方差计算sp(qk)如果能按JJF1059的4.4节采用极差法对重复次数n不 多的结果简单地评定出s(qk),虽然它们每个s(qk)的自由度不大,但采用平均方差计算 也能得到自由度充分大的sp(qk)。例如,以本文上述表1的数值为例,这m=10个被测量 在各6次重复观测中的极差R分别依次为:0.07、0.04、0.08、0.06、0.08 、0.08、0.09、0.07、0.10、0.07。按JJF1059表1极差系数在n= 6时为C=2.53。这样,分别得si(qk)为:0.0277、0.0158、0.031 6、0.0233、0.0316、0.0316、0.0356、0.0277、0.0395 、0.0277。其自由度均为4.5(按同一表)。按式sp(qk)=10i=1Σsi2( qk)m!!得sp(qk)="110(0.02772+……+0.02772)!=29. 9×10-3与该例所得29.5×10-3比较,大了约1%。按极差法取平均方差进行评定的 结果,按JJF1059表1,s(qk)的自由度为4.5,因而这里的sp(qk)自由度为 4.5×10=45,应该说也够大的了。这里应注意到采用极差法时,有个必要前提是qk可能 值的分布接近正态。而表1中的各个单次结果,根据n=6不能作出是否正态分布的结论,只有按 中心极限定律来判断。当不接近正态分布的情况下,使用了极差法,则据此评定的s(qk)会有 所偏大。实际的分布偏离正态越远,则所得s(qk)偏得越大。本例中出现了1%的偏大应认为 正常。六、sp(qk)中所包含的不确定度分量合并样本标准偏差sp(qk)与实验标准偏差 s(qk)一样,包含了在重复观测过程中全部随机效应导致的不确定度分量。由于在计算sp时 ,往往采用了过去的检验记录中的平行试验结果,而且又是若干被测量的结果,其中不免包含了某 些在试验过程中更换了的测量仪器,例如:滴定管、温度计等,这类在实验室中往往数量较多而且 在平行试验时是随机取用的仪器的系统效应导致的分量。即它们的最大允许误差(MPE)所带来的不确定度分量。作者单位【原国家计量局】表3m·n个残差二次方及m个之和表4通过两次之差Δ计算的实例7777TECH N O LO G Y SEC TIO N技术篇误差与不确定度测量不确定度理解与应用 合并样本标准偏差
More abstracts about the 测量不确定度理解与应用 合并样本标准偏差与测量不确定度评定