实验数据误差分析和数据处理.docx
- 文档编号:8694221
- 上传时间:2023-02-01
- 格式:DOCX
- 页数:18
- 大小:102.78KB
实验数据误差分析和数据处理.docx
《实验数据误差分析和数据处理.docx》由会员分享,可在线阅读,更多相关《实验数据误差分析和数据处理.docx(18页珍藏版)》请在冰豆网上搜索。
实验数据误差分析和数据处理
第二章实验数据误差分析和数据处理
第一节实验数据的误差分析
由于实验方法和实验设备的不完善,周围环境的影响,以及人的观察力,测量程序等限制,实验观测值和真值之间,总是存在一定的差异。
人们常用绝对误差、相对误差或有效数字来说明一个近似值的准确程度。
为了评定实验数据的精确性或误差,认清误差的来源及其影响,需要对实验的误差进行分析和讨论。
由此可以判定哪些因素是影响实验精确度的主要方面,从而在以后实验中,进一步改进实验方案,缩小实验观测值和真值之间的差值,提高实验的精确性。
一、误差的基本概念
测量是人类认识事物本质所不可缺少的手段。
通过测量和实验能使人们对事物获得定量的概念和发现事物的规律性。
科学上很多新的发现和突破都是以实验测量为基础的。
测量就是用实验的方法,将被测物理量与所选用作为标准的同类量进行比较,从而确定它的大小。
1.真值与平均值
真值是待测物理量客观存在的确定值,也称理论值或定义值。
通常真值是无法测得的。
若在实验中,测量的次数无限多时,根据误差的分布定律,正负误差的出现几率相等。
再经过细致地消除系统误差,将测量值加以平均,可以获得非常接近于真值的数值。
但是实际上实验测量的次数总是有限的。
用有限测量值求得的平均值只能是近似真值,常用的平均值有下列几种
(1)算术平均值算术平均值是最常见的一种平均值。
设为、X2、……、Xn为各次测量值,n代表测量次数,则算术平均值为
(2-1)
-X1X2亠亠Xn
X
n
(2)几何平均值几何平均值是将一组n个测量值连乘并开n次方求得的平均值。
即
(2-2)
r
X几=nXiX2Xn
应指出,变量的对数平均值总小于算术平均值。
当x1/x2<2时,可以用算术平均值代替对
数平均值。
当Xi/X2=2,X寸=1・443,X=1.50,(X对-X)/X对=4.2%,即兀/X?
<2,引起的误差不超过4.2%
以上介绍各平均值的目的是要从一组测定值中找出最接近真值的那个值。
在化工实验和科学研究中,数据的分布较多属于正态分布,所以通常采用算术平均值。
2.误差的分类
根据误差的性质和产生的原因,一般分为三类:
(1)系统误差系统误差是指在测量和实验中未发觉或未确认的因素所引起的误差,而这些因素影响结果永远朝一个方向偏移,其大小及符号在同一组实验测定中完全相同,当实验条件一经确定,系统误差就获得一个客观上的恒定值。
当改变实验条件时,就能发现系统误差的变化规律。
系统误差产生的原因:
测量仪器不良,如刻度不准,仪表零点未校正或标准表本身存在偏差等;周围环境的改变,如温度、压力、湿度等偏离校准值;实验人员的习惯和偏向,如读数偏高或偏低等引起的误差。
针对仪器的缺点、外界条件变化影响的大小、个人的偏向,待分别加以校正后,系统误差是可以清除的。
(2)偶然误差在已消除系统误差的一切量值的观测中,所测数据仍在末一位或末两位数字上有差别,而且它们的绝对值和符号的变化,时而大时而小,时正时负,没有确定的规律,这类误差称为偶然误差或随机误差。
偶然误差产生的原因不明,因而无法控制和补偿。
但是,
倘若对某一量值作足够多次的等精度测量后,就会发现偶然误差完全服从统计规律,误差的大小或正负的出现完全由概率决定。
因此,随着测量次数的增加,随机误差的算术平均值趋近于零,所以多次测量结果的算数平均值将更接近于真值。
(3)过失误差过失误差是一种显然与事实不符的误差,它往往是由于实验人员粗心大意、过度疲劳和操作不正确等原因引起的。
此类误差无规则可寻,只要加强责任感、多方警
惕、细心操作,过失误差是可以避免的。
3、精密度、准确度和精确度
反映测量结果与真实值接近程度的量,称为精度(亦称精确度)。
它与误差大小相对应,测量的精度越高,其测量误差就越小。
“精度”应包括精密度和准确度两层含义。
(1)精密度:
测量中所测得数值重现性的程度,称为精密度。
它反映偶然误差的影响程度,精密度高就表示偶然误差小。
(2)准确度测量值与真值的偏移程度,称为准确度。
它反映系统误差的影响精度,准确度高就表示系统误差小。
(3)精确度(精度)它反映测量中所有系统误差和偶然误差综合的影响程度。
在一组测量中,精密度高的准确度不一定高,准确度高的精密度也不一定高,但精确度高,则精密度和准确度都高。
为了说明精密度与准确度的区别,可用下述打靶子例子来说明。
如图2-1所示。
图2-1(a)中表示精密度和准确度都很好,则精确度高;图2-1(b)表示精密度很好,但准确度却不高;图2-1(c)表示精密度与准确度都不好。
在实际测量中没有像靶心那样明确的真值,而是设法去测定这个未知的真值。
学生在实验过程中,往往满足于实验数据的重现性,而忽略了数据测量值的准确程度。
绝对真值是不可知的,人们只能订出一些国际标准作为测量仪表准确性的参考标准。
随着人类认识运动的推移和发展,可以逐步逼近绝对真值。
4、误差的表示方法
利用任何量具或仪器进行测量时,总存在误差,测量结果总不可能准确地等于被测量的真值,而只是它的近似值。
测量的质量高低以测量精确度作指标,根据测量误差的大小来估计测量的精确度。
测量结果的误差愈小,则认为测量就愈精确。
(1)绝对误差测量值X和真值A。
之差为绝对误差,通常称为误差。
记为:
D=X_Ao(2-5)
由于真值几一般无法求得,因而上式只有理论意义。
常用高一级标准仪器的示值作为实际
值A以代替真值A。
由于高一级标准仪器存在较小的误差,因而A不等于A,但总比X更接近
于A。
X与A之差称为仪器的示值绝对误差。
记为
d=X-A(2-6)
与d相反的数称为修正值,记为
c=-d=A-X(2-7)
通过检定,可以由高一级标准仪器给出被检仪器的修正值C。
利用修正值便可以求出该仪
器的实际值A。
即
A=XC(2-8)
(2)相对误差衡量某一测量值的准确程度,一般用相对误差来表示。
示值绝对误差d
与被测量的实际值A的百分比值称为实际相对误差。
记为
(2-9)
、叭=d100%
A
(2-10)
以仪器的示值X代替实际值A的相对误差称为示值相对误差。
记为
x=X100%
般来说,除了某些理论分析外,用示值相对误差较为适宜。
(3)引用误差为了计算和划分仪表精确度等级,提出引用误差概念。
其定义为仪表示
示值绝对误差
量程范围
-J
100%一100%
Xn
(2-11)
值的绝对误差与量程范围之比。
d--示值绝对误差;
X--标尺上限值-标尺下限值。
n
(4)算术平均误差算术平均误差是各个测量点的误差的平均值。
、.平=i=1,2「,n(2-12)
n
n—测量次数;
di—为第i次测量的误差。
(5)标准误差标准误差亦称为均方根误差。
其定义为
—F(2-13)
\n
上式使用于无限测量的场合。
实际测量工作中,测量次数是有限的,则改用下式
口-匡兰(2-14)
、一n-1
标准误差不是一个具体的误差,c的大小只说明在一定条件下等精度测量集合所属的每一个观测值对其算术平均值的分散程度,如果c的值愈小则说明每一次测量值对其算术平均值分散度就小,测量的精度就高,反之精度就低。
在化工原理实验中最常用的U形管压差计、转子流量计、秒表、量筒、电压等仪表原则上均取其最小刻度值为最大误差,而取其最小刻度值的一半作为绝对误差计算值。
5、测量仪表精确度
、-nmax
最大示值绝对误差量程范围―
100%=d
100%
(2-15)
测量仪表的精确等级是用最大引用误差(又称允许误差)来标明的。
它等于仪表示值中的最大绝对误差与仪表的量程范围之比的百分数。
式中:
Smax仪表的最大测量引用误差;dmax仪表示值的最大绝对误差;
Xn——标尺上限值一标尺下限值。
通常情况下是用标准仪表校验较低级的仪表。
所以,最大示值绝对误差就是被校表与标准表之间的最大绝对误差。
测量仪表的精度等级是国家统一规定的,把允许误差中的百分号去掉,剩下的数字就称为仪表的精度等级。
仪表的精度等级常以圆圈内的数字标明在仪表的面板上。
例如某台压力计的允许误差为1.5%,这台压力计电工仪表的精度等级就是1.5,通常简称1.5级仪表。
仪表的精度等级为a,它表明仪表在正常工作条件下,其最大引用误差的绝对值Smax不能超
过的界限,即
、nmax二虹100%乞a%(2-16)
Xn
由式(2-16)可知,在应用仪表进行测量时所能产生的最大绝对误差(简称误差限)为
dmax-a%Xn(2-17)
而用仪表测量的最大值相对误差为
dmaxXn(2-18)
-nmax厂-a%-'‘
XnX
由上式可以看出,用只是仪表测量某一被测量所能产生的最大示值相对误差,不会超过仪表允许误差a%乘以仪表测量上限%与测量值X的比。
在实际测量中为可靠起见,可用下式对
仪表的测量误差进行估计,即
(2-19)
[例2-1]用量限为5A,精度为0.5级的电流表,分别测量两个电流,Ii=5A,I2=2.5A,试求测量Ii和I2的相对误差为多少?
I5
、mi=a%n=0.5%0.5%
Ii5
I5
「m2=a%-=0.5%1.0%
122.5
由此可见,当仪表的精度等级选定时,所选仪表的测量上限越接近被测量的值,则测量的误差的绝对值越小。
[例2-2]欲测量约90V的电压,实验室现有0.5级0-300V和1.0级0-100V的电压表。
问选用哪一种电压表进行测量为好?
用0.5级0-300V的电压表测量90V的相对误差为
-Un300
、m0.5=1%才=0.5%-901.7%
用1.0级0-100V的电压表测量90V的相对误差为
-U100
^10二2%乂」=1.0%汉一=1.1%m1.02U90
上例说明,如果选择得当,用量程范围适当的1.0级仪表进行测量,能得到比用量程范围
大的0.5级仪表更准确的结果。
因此,在选用仪表时,应根据被测量值的大小,在满足被测量数值范围的前提下,尽可能选择量程小的仪表,并使测量值大于所选仪表满刻度的三分之二,即X>2X/3。
这样就可以达到满足测量误差要求,又可以选择精度等级较低的测量仪表,从而降低仪表的成本。
二、有效数字及其运算规则
在科学与工程中,该用几位有效数字来表示测量或计算结果,总是以一定位数的数字来表示。
不是说一个数值中小数点后面位数越多越准确。
实验中从测量仪表上所读数值的位数是有限的,而取决于测量仪表的精度,其最后一位数字往往是仪表精度所决定的估计数字。
即一般应读到测量仪表最小刻度的十分之一位。
数值准确度大小由有效数字位数来决定。
1、有效数字
一个数据,其中除了起定位作用的"0”外,其他数都是有效数字。
如0.0037只有两位有
效数字,而370.0则有四位有效数字。
一般要求测试数据有效数字为4位。
要注意有效数字不
一定都是可靠数字。
如测流体阻力所用的U形管压差计,最小刻度是1mm但我们可以读到
0.1mm女口342.4mmHg又如二等标准温度计最小刻度为0.1C,我们可以读到0.01C,如
15.16C。
此时有效数字为4位,而可靠数字只有三位,最后一位是不可靠的,称为可疑数字。
记录测量数值时只保留一位可疑数字。
为了清楚地表示数值的精度,明确读出有效数字位数,常用指数的形式表示,即写成一个小数与相应10的整数幕的乘积。
这种以10的整数幕来记数的方法称为科学记数法。
如75200
有效数字为4位时,记为7.520*105
5
有效数字为2位时,记为
7.5*10
有效数字为3位时,记为7.52*10
2、有效数字运算规则
(1)记录测量数值时,只保留一位可疑数字。
(2)当有效数字位数确定后,其余数字一律舍弃。
舍弃办法是四舍六入,即末位有效数字
后边第一位小于5,则舍弃不计;大于5则在前一位数上增1;等于5时,前一位为奇数,则进1为偶数,前一位为偶数,则舍弃不计。
这种舍入原则可简述为:
"小则舍,大则入,正好等于奇变偶”。
如:
保留4位有效数字3.71729t3.717;
5.14285t5.143
7.62356t7.624
9.37656t9.376
(3)在加减计算中,各数所保留的位数,应与各数中小数点后位数最少的相同。
例如将
24.650.00821.632三个数字相加时,应写为24.65+0.01+1.63=26.29。
(4)在乘除运算中,各数所保留的位数,以各数中有效数字位数最少的那个数为准;其结果的有效数字位数亦应与原来各数中有效数字最少的那个数相同。
例如:
0.0121X25.64X1.05782应写成0.0121X25.64X1.06=0.328。
上例说明,虽然这三个数的乘积为0.3281823,但只应取其积为0.328。
(5)在对数计算中,所取对数位数应与真数有效数字位数相同。
三、误差的基本性质
在化工原理实验中通常直接测量或间接测量得到有关的参数数据,这些参数数据的可靠程度如何?
如何提高其可靠性?
因此,必须研究在给定条件下误差的基本性质和变化规律。
1、误差的正态分布
如果测量数列中不包括系统误差和过失误差,从大量的实验中发现偶然误差的大小有如下几个特征:
(1)绝对值小的误差比绝对值大的误差出现的机会多,即误差的概率与误差的大小有关。
这是误差的单峰性。
(2)绝对值相等的正误差或负误差出现的次数相当,即误差的概率相同。
这是误差的对称性。
(3)极大的正误差或负误差出现的概率都非常小,即大的误差一般不会出现。
这是误差的有界性。
(4)随着测量次数的增加,偶然误差的算术平均值趋近于零。
这叫误差的低偿性。
根据上述的误差特征,可疑的出误差出现的概率分布图,如图2-2所示。
图中横坐标表示
偶然误差,纵坐标表示个误差出现的概率,图中曲线称为误差分布曲线,以y=f(x)表示。
其
数学表达式有高斯提出,具体形式为:
上
y—1e左(2--20)
<2HCT
或y=2e山2"(2--21)
上式称为高斯误差分布定律亦称为误差方程。
式中
的关系为
6为标准误差,h为精确度指数,6和h
(2--22)
若误差按函数关系分布,则称为正态分布。
6越小,测量精度越高,分布曲线的峰越高切窄;6越大,分布曲线越平坦且越宽,如图1-3
所示。
由此可知,6越小,小误差占的比重越
大,测量精度越高。
反之,则大误差占的比重越大,测量精度越低。
2、测量集合的最佳值
在测量精度相同的情况下,测量一系列观测值Mi,M2,M3,……,Mn所组成的测量集合,假设其平均值为M,则各次测量误差为
v,m
Xi=Mi-Mm,i=1、2…n,
当采用不同的方法计算平均值时,所得到误差值不同,误差出现的概率亦不同。
若选取适当的计算方法,使误差最小,而概率最大,由此计算的平均值为最佳值。
根据高斯分布定律,只有各点误差平方和最小,才能实现概率最大。
这就是最小乘法值。
由此可见,对于一组精度相同的观测值,采用算术平均得到的值是该组观测值的最佳值。
3、有限测量次数中标准误差6的计算
图2-2误差分布
f(x)
图2-3不同6的误差分布曲线
由误差基本概念知,误差是观测值和真值之差。
在没有系统误差存在的情况下,以无限多
次测量所得到的算术平均值为真值。
当测量次数为有限时,所得到的算术平均值近似于真值,
称最佳值。
因此,观测值与真值之差不同于观测值与最佳值之差。
令真值为A,计算平均值为a,观测值为M并令d=M-a,D=M-A则
di—M1-a.Di—M1-A
d2=M2-a,D2=M2-A
dn-Mn_a,Dn=Mn_A
、dj=、Mi_naDi=、Mi-nA
因为、Mi_na=0\Mj=na
代入vDi二、Mj-nA中,即得
a-A
n
将式(2—23)式代入dj=Mi-a中得
ZDjZD
dj=(Mj_A)_j=Dj-
(2—23)
(2—24)
将式(2—24)两边各平方得
22x'Dix'Di2
di2=D:
_2Di-(-)2
nn
22'DiVDi2
d2二D2-2D2-(-)
nn
22VDiVDi2
dn二D;-2Dn-(-)2
nn
对i求和7di24Di2/,n(匕)2
一一nn
因在测量中正负误差出现的机会相等,故将(工Di)2展开后,Di-D2、Di.D3…,为正为负的数目相等,彼此相消,故得
'、•di2八Di2—2J
n
、di2Di2
n
从上式可以看出,在有限测量次数中,自算数平均值计算的误差平方和永远小于自真值计算的误差平方和。
根据标准误差的定义
CJ=J
\n
(2—25)
式中》D2代表观测次数为无限多时误差的平方和,故当观测次数有限时,
CF
\n-1
4.可疑观测值的舍弃
由概率积分知,随机误差正态分布曲线下的全部积分,相当于全部误差同时出现的概率,
x2
即p=/1[e^dx=1(2—26)
若误差x以标准误差(T的倍数表示,即x=td,则在土t6范围内出现的概率为2①(t),超出这个范围的概率为1-2①(t)。
①(t)称为概率函数,表示为
1t丄2
①(t)=^=0e2dt(2—27)
2①(t)与t的对应值在数学手册或专著中均附有此类积分表,读者需要时可自行查取。
在使用积分表时,需已知t值。
由表2-1和图(2-4)给出几个典型及其相应的超出或不超出凶的概率。
由表2-1知,当t=3,|x|=3d时,在370次观测中只有一次测量的误差超过3d范围。
在有限次的观测中,一般测量次数不超过十次,可以认为误差大于3d,可能是由于过失误差或实
验条件变化未被发觉等原因引起的。
因此,凡是误差大于3d的数据点予以舍弃。
这种判断可疑
实验数据的原则称为3d准则。
5.函数误差
上述讨论主要是直接测量的误差计算问题,但在许多场合下,往往涉及间接测量的变量,所谓间接测量是通过直接测量的量之间有一定的函数关系,并根据函数被测的量,如传热问题
中的传热速率。
因此,间接测量值就是直接测量得到的各个测量值的函数。
其测量误差是各个测量值误差的函数。
fW
图2-4误差分布曲线的积分
表2-1误差概率和岀现次数
t
|x|=tb
不超出凶的
概率2©(t)
超出凶的概率
1-2机t)
测量次数
n
超出|x|的
测量次数
0.67
0.67b
0.49714
0.50286
2
1
1
1b
0.68269
0.31731
3
1
2
2b
0.95450
0.04550
22
1
3
3b
0.99730
0.00270
370
1
4
4b
0.99991
0.00009
11111
1
(1)函数误差的一般形式在间接测量中,一般为多元函数,而多元函数可用下式表示:
y=f(X1,X2,…,Xn)(2—28)
式中y—间接测量值;
Xi—直接测量值。
由台劳级数展开得
b=色钗+孫舐2屮八+厅^Xn(2—29)
tX1&2£Xn
或mfXi
i±tXi
它的最大绝对误差为⑹f织(2—30)
住及i
式中工一误差传递系数;
;Xi
△Xi—直接测量值的误差;
△y—间接测量值的最大绝对误差。
函数的相对误差3为
y
汎;:
f-:
x2…
■
Ax
n
y
;x
y%y
;x
y
(2—31)
-X1
:
X2
GXn
(2)某些函数误差的计算
1函数y=x±z绝对误差和相对误差
由于误差传递系数f=1f=于〕,则函数最大绝对误差r1l、—
(2—32)
(2—33)
:
-X:
-Z
△y=±(|△x|+|△z|)
相对误差型"坐凹
yx+z
2
函数形式为y=K兰,X、Z、W为变量
=y
Kz
Kx
Kxz
+
iz
+
——Aw
w
w
w
(2—34)
函数的最大绝对误差为
(2—35)
函数的最大相对误差为
0亠
+
△z
+
z
y
x
z
w
现将某些常用函数的最大绝对误差和相对误差列于表2—2中。
[例2-3]用量热器测定固体比热容时采用的公式Cp二业辺CpH2O
m(ti—12)
式中M—量热器内水的质量
m—被测物体的质量
to—测量前水的温度
ti—放入量热器前物体的温度
t2—测量时水的温度
CpH2o—水的热容,4.187Kj/(kg.•K)
测量结果如下:
M=250±0.2gm=62.31±0.02g
t0=13.52±0.01Ct1=99.32±0.04C
t2=17.79±0.01C
试求测量物的比热容之真值,并确定能否提高测量精度。
解:
根据题意,计算函数之真值,需计算各变量的绝对误差和误差传递系数。
为了简化计
算,令90=t2--t0=4.27C,01=t1—t2=81.53C,.
函数式
误差传递公式
最大绝对误差Ay
最大相对误差6r
y=^-+x24xa
®=岂血1出山2I出山3I)
6J/y
y=捲+x2
$=對Zx|+|触I)
6=^y/y
y=XM2
3=±(1为念2|+|X2馭|)
6=鱼
&1+心
X1X
-)
y=><1X2X3
3=弐|X1X2&3I+IX^^X?
I+|X2X3&1|)
X1X2X3
n
y=x
△y=±(nxn丄Ax)
&=d(n
X
y
~T~
1■丄
®=宝一xnix)
n
n
报
X
y=为/X2
扎、,4X2AX1+xtAx2、
△y—-^-a2)
X2
d=±(
X1X
-)
y=cx
Q=ijc纲
aV
空)
X
y=igx
Av
0=40.4343—
X
&=Ay/y
y=lnx
lx
&=Ay/y
mi
表2-2某些函数的误差传递公式
各变量的绝对误差为
•M=0.2g.4f;t2:
t0=0.010.01=0.02
•m=0.02g.吒〜划一|小=0.040.01=0.05
各变量的误差传递系数为
仝一^O「^V^74110」
fCpMCpH2O
:
r0m弓
2504.187
62.3181.53
=0.206
-:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验 数据 误差 分析 数据处理