试验数据的处理分析.docx
- 文档编号:24625899
- 上传时间:2023-05-29
- 格式:DOCX
- 页数:20
- 大小:195.57KB
试验数据的处理分析.docx
《试验数据的处理分析.docx》由会员分享,可在线阅读,更多相关《试验数据的处理分析.docx(20页珍藏版)》请在冰豆网上搜索。
试验数据的处理分析
实验数据的处理方法
杨鹏
【摘要】物理学是一门实验的科学,物理学中的新概念、新规律的发现都依赖于反复的实验。
而处理实验数据时,需选择适当的实验数据处理方法,才能较准确、客观的反映实验结果,减小误差。
本文介绍了实验数据处理中涉及到的一些基本概念,重点综述了物理实验中常用的数据处理方法。
并指出了各自适用的条件及优缺点。
关键词】误差;数据处理;作图法;最小二乘法;逐差法
Abstract:
Physicsisanexperimentalscience,Newconceptsinphysics,thediscoveryofnewrulesrelyontrialanderror,Theexperimentaldataprocessin,gNeedtoselecttheappropriatetreatmentoftheexperimentaldata,Tomoreaccuratelyreflecttheobjectiveresults,Reduceerrors.ThisarticledescribestheexperimentaldataprocessinginvolvedinsomeofthebasicconceptsSummaryofexperimentsfocusedonthephysicaldataprocessingmethodscommonlyused.Andpointedouttheadvantagesanddisadvantagesofeachapplicablecondition.
Keywords:
Error;DataProcessing;Mapping;Leastsquares;Bysubtraction
【引言】数据处理是指由实验测得的数据,必须经过科学的分析和处理,才能揭示出各物理量之间的关系。
我们把从获得原始数据起到得出结论为止的加工过程称为数据处理。
正确的处理实验记录的数据,对我们科学的了解被测量或研究对象的客观规律,选择恰当的实验数据处理方法,最大限度的减小误差让实验数据无限接近理想条件下的结果,这是实验数据处理的意义所在。
在这方面研究的文献有很多,例如费业泰的《误差理论与数据处理》等。
要对实验结果进行分析,根据不同的实验方法,我们可以采用不同的数据处理方法,常用的有作图法、最
第1页小二乘法、逐差法等。
本文将分别对这些方法进行了介绍。
一、实验数据处理中涉及到的基本概念
对实验结果进行半定量分析,需要借助许多评价参量,这里涉及到许多表征实验数据好坏及数据离散程度的基本概念,特别是描述处理后数据的可靠性的参量,尤其具有重要意义。
以下将对一些重要概念进行介绍。
1.真值及约定真值
真值有多种定义,如“被测量本身所具有的真实大小称为真值。
”[1]“如果实验已消除系统误差,只存在偶然误差。
则无穷多个观测值得平均值,就是被测物体的真值。
”[2]“正在研究某量时所处的条件下严格的确定的量值。
”[3]由此可见,真值是客观存在的,但也还是一个理想的概念,通常是不可确切知道的。
约定真值被认为是非常接近真真值的,它们之间的差别可忽略不计,无系统误差条件下的算术平均值、标称值、校准值、理论值、公认值等均可作为约定真值来使用。
2.影响量和干扰量
影响量不是测量的对象,但却影响被测量的量值或仪器示值,它通常是一种与待测的量有一定函数关系的另一种性质的量[9]。
例如在测量电阻时,由于多数材料的电阻随温度改变,因此在测量电阻时温度在影响着电阻值的测量结果,但它却不是测量对象,所以温度就是电阻测量中的影响量。
影响量在测量结果中带来的影响可以在测出影响量的大小后,按其函数关系从测量结果中加以消除。
干扰量是一种与待测的量没有必然联系的外界强行渗入量。
例如拍摄全息照片时外界的振动,探测器的噪声,都会影响测量工作造成干扰,这样的一些量称为干扰量[9]。
为了保证测量的准确度,在安排测量条件时,要消除影响量和最大限度减小干扰量。
3.精度
反映测量结果与真实结果接近程度的量,称为精度,它与误差的大小相对应,因此可用误差的大小来表示精度的高低,误差小则精度高,误差大则精度高低。
精密度:
它反映测量结果中随机误差的影响程度准确度:
它反映测量结果中系统误差的影响程度精确度:
它反映测量结果中系统误差和随机误差综合的影响程度,其定量特
第2页
征可用测量的不确定度(或极限误差)来表示。
[4]用一种打靶的例子,可以更好
的理解和掌握,如下图:
4.误差
测量值减去真值为测量值的误差,即:
测量值-真值=误差
上述误差亦称绝对误差,假设测量值为x,真值为a,误差为,则有误差=x-a,与a的比值r=/a称为相对误差。
对误差的来源可以概括为四个方面[4]:
1,
测量装置误差,这里面分三个方面来说,a,标准量具误差:
以固定形式复现标准量具的器具,如标准量块、标准先问吃、标准电池、标准电阻、标准砝码等,它们本身体现的量值,不可避免的都还有误差。
b,仪器误差:
凡用来直接或间接将被测量和已知量进行比较的仪器设备,称为仪器或仪表,如天平、压力表、温度计等,它们本身都具有误差。
c,附件误差:
仪器的附件及附属工具,如测长仪的标准环规,千分尺的调整量棒等的误差,也会引起测量误差。
2,环境误差:
由于各种环境因素与规定的标准状态不一致而引起的测量装置和被测量本身的变化所造成的误差,如温度、适度、气压、振动、照明、重力加速度等所引起的误差。
通常仪器仪表在规定的正常工作条件所具有用的误差,而超出此条件时所增加的误差称为附加误差。
3,方法误差:
由于测量方法不完善所引起的误差,如测量一个轴的直径ds,因近似数取值的不同,将会引起误差。
4,人员误差:
由于测量者受分辨能力的限制或是崛起变的生理变化,固有习惯引起的读数误差,以及实验室的疏忽等所引起的误差。
总之,在计算测量结果的精度时,对上述四个方面的误差来源,必须进行全面的分析,力求不遗漏,不重复,特别是对误差影响较大的哪些因素。
第3页
4.1系统误差
先看两个例子[51)用一个2.5级0—1A的安培计测一回路的电流强的I为0.73A,而用另一个0.5级0—1A的安培计测同一回路电流为0.716A;
(2)用一天平称一物体的质量,物体在左盘,砝码在右盘,平衡时测量值为74.2519g,物体与砝码交换后则为74.2501g;
(1)是由于仪器自身误差的问题,
(2)是由于天平左右臂长不完全相等引入的系统误差,可将物体放在天平左、右盘上各称一次取平均值去消除。
上述各项测量值的差异在重复测量时依然不变,这表示其误差的符号和大小是恒定的,此类误差称为系统误差。
对系统误差的研究主要是:
(1)探索系统误差的来源,设计实验方案消除或消减该项误差。
(2)估计残存系统误差的可能的范围。
[5]
4.2偶然误差在同一条件下,对同一物理量进行重复测量,各次测量值一般不完全相同,这是由于测量时存在的偶然误差。
一个测得值的偶然误差是多项偶然因素综合作用的结果,在测量前不能得知测得值将偏大或偏小。
图
(2).单摆周期测量100次的统计直方图
这里以测单摆周期的实验为例:
用手控制数字毫秒计,测量一摆的周期共
100次,测量值的大小变化不定,似乎没有规律,其实这种偶然现象服从统计规律。
现将测得值分布的区域分为9个区间,统计各区间内测量的个数Ni,以测量值为横坐标,Ni/N为纵坐标(N为总数)作统计直方图,图2[5]是一次实验的结果。
从图上可以看出,比较多的测量值集中在分布区域的中部,而区域的左右
第4页
两半的测量值个数都接近一半,由此可以设想被测量的真值就在数据比较集中的部分。
在上述测量之后,用光电门控制一台数字毫秒计去测同一个摆的周期,测
10次,测量值分布在1.866s到1.868s的小区域中,由于此时的偶然误差显著小于前者,可将光电控制测量的平均值T0作为手控测量的近真值,对于测量值的偶
然误差作如下的统计,取T0=1.8670s,则
Ti-T00(ε>)0占52%
多次测量均有同上相似的结果,因而得出如下几点认识:
(1)每次测量的偶然误差是不确定的。
(2)出现正号或负号偶然误差的机会相近。
(3)出现绝对值小的偶然误差的机会多一些。
5.算术平均值与标准偏差
5.1算术平均值
设n次测量值x1,x2,⋯,xn的误差为1,2,⋯,n,真值为a,则
(x1-a)+(x2-a)+⋯+(xn-a)=1+2+⋯+n
将上式展开整理后,两侧除以n,得
n)
1
(x1+x2+⋯+xn)-a=(1+2+⋯+
n
它表示算术平均值的误差,等于各测量值误差的平均值,假如各测量值的误差只是偶然误差,而偶然误差有正有负,相加时可抵消一些,所以n越大,算术平均值越接近真值。
因此可以用算术平均值作为被测量真值的最佳估计值。
又当测量值的误差中包含有已知的系统误差,则相加时它们不能抵消,这时应当用算术平均值加上修正值为被测量真值的最佳估计值(修正值与系统误差绝对值相同,符号相反)。
5.2标准偏差
具有偶然误差的测量值将是分散的,对分散的情况的定量表示用标准偏差s,
第5页
n为测量值个数。
例,比如有如下两组数值:
表1.两组数值集中程度不同的实验测量数据
A
2.1
2.6
2.8
2.9
3.0
3.2
3.7
B
2.1
2.4
2.7
2.9
3.1
3.4
3.7
两组数值都在2.1到3.7之间,平均值都是2.9,计算标准偏差为sA=0.497≈0.50sB=0.557≈0.5,6可以看出A组数比较像中间集中,B组数则稍差,表现除它们分散上的差异。
6.有效数字
在做实验时总要记录很多的数据,并对数据进行计算或处理,但在记录时应取几位,计算后应保留几位,这是实验数据处理的重要问题,必须有一个明确的认识。
实验时处理的数值,应能反应出被测量的实际大小的数值,即记录与运算后保留的应为能传递出被测量实际大小信息的全部数字,这样的数字称为有效数字。
例如用一最小分度1mm的尺,测得一物体的长度为7.62cm,其中7和6是准确度出来的,最后一位数字2是估读的,并且仪器本身也将在这一位出现误差,即这一位不一定是2,只是近似的,但是还是一位有效数字。
在实际取舍时按照实验条件以及题目要求为参考。
使用有效数字规则时的注意事项:
[5]
(1)物理公式中的有些数值,不是实
1验测量值。
例如,测量圆柱体的直径d和长度l求体积V的公式V1d2l中的
4
1不是测量值,在确定V的有效数字位数时不必考虑1的位数。
(2)对数运算44时,首数不算有效数字。
(3)首位数是8或9的m位数值在乘除运算中,计算有效数字时,可多算一位。
(4)有多个数值参加运算时,在运算中途应比按有效数字运算规则规定的多保留一位,以防止由于多次取舍引入计算误差,但运算最后仍应舍去。
(4)数值的修约规则:
①开始要舍去的第一位数是1、2、3、4时就舍去;是6、7、8、9时在舍去时进1。
②要舍去的一位是5,而保留的最后一
第6页位是奇数,则舍去5进1,是偶数则舍去5不进位,但是5的下一位不是0是仍
然要进位。
[5]
二、物理实验中常用的数据处理与分析方法
实验数据处理的方法有很多,对不同的实验记录数据要选择不一样的数据处理方法,以下介绍几种常用的实验数据处理方法,并最后对各自的优缺点进行总结。
1.列表法把数据按一定规律列成表格,可使物理量之间的一一对应关系简明、醒目,也有助于发现实验中的规律。
列表时应注意:
(1)表格设计合理、简单明了,便于观察。
(2)各栏目中均应注明物理量的名称和单位。
(3)各量排列顺序尽量与测量数据顺序一致,用有效数字填写。
特殊需要可以采用其他规律[7]。
这种方法在实验室常用到,如果将实验要记录的数据在表格中一一罗列出来,这样清晰明了,在处理数据是一目了然。
如表[2]
表[2]某物理量的测量
物理量名称
测量值
1
2
3
2.分组计算法
设变量x、y间存在y=a+bx的直线关系,由于测量存在误差,对n次测量有
第7页
y1abx1v1
y2abx2v2
ynabxnvn
式中vi表示测量误差。
现在将n组测量分为前后两部分,从中取对应的两组:
这样可的n个ai和bi,再求a、s(a)和b、s(b)。
如n为奇数,中间数可公用3.最小二乘法[5]
假设变量x、y间存在直线关系y=a+bx,参量a、b分别为y轴截距和斜率,当将测量值(xi,yi)带入此式时,由于存在测量误差yiabxi,引入误差项vi后
有yiabxivi,或viyi(abxi),对n次测量,可有
v1y1(abx1)
v2y2(abx2)
vnyn(abxn)
由于n个方程中有n+2个未知数,所以不能从解联立方程组求出a、b值。
设y为等精度测量值,最小二乘法原理指出,满足vi2极小值条件下求出的参量a、
^
2
via[yi(abxi)]2
第8页
^xi2yixixiyi
anxi2(xi)2
nxiyixiyi
xi2(xi)2
r来描述,其
^则由②及③,又可得出bsxysxx,aybx。
为了反映变量x、y间的线性关系的密切程度,常用关联系数
估算式为
^(xix)(yiy)sxy
r[(xix)(yiy)]12sxxsxy
^
从理论上讲,r>0就应该承认x、y之间存在一定的相关关系,但是由于r值
^
是从较少的数据中求出的,根据数理统计理论,对于一定的n值,r要在大于某
一临界值r临时,才可以认为存在线性相关关系。
下表给出了各n值的r临值。
表3
各n值的
r临值[5]
n
3
4
5
6
7
8
9
r临
0.998
0.990
0.950
0.917
0.874
0.834
0.798
n
10
11
12
13
14
15
16
r临
0.765
0.735
0.708
0.684
0.661
0.641
0.623
n
17
18
19
20
21
22
r临
0.606
0.590
0.575
0.561
0.549
0.537
^^
可以证明参量a、b的标准偏差sa、sb和y的标准偏差sy之间的关系为
第9页
^^
⑤Sy[(yiabxi)]12[1rsyy]12⑥
n2n2
4.作图法研究两个变量的关系就是用曲线或函数式将二个变量的联系变现出来。
那么首先在这里先介绍实验图线的描绘。
常用直角坐标纸为方格纸,制图线时需注意的问题:
(1)标的横轴为自变量,纵轴为因变量。
一般是以被测量为变量,但有时为了使获得的图线是一条直线,而将被测量做某种变换后的数值做变量。
这种变换不仅是由于直线便于描绘,更重要的是直线的斜率和截距所包涵的物理内容是我们所需要的。
(2)标的原点,不一定要和变量的零点一致,若变量x的变化范围是从a到b,则将坐标原点在取在a的附近即可。
因为有时a距x的零点很远,如果将原点取在x的零点出,则坐标纸上将出现很大的空白区域,白白浪费了坐标纸。
(3)标轴的分度要和测量的有效数字位数对应,坐标纸的一小格表示为被测量的最后一位的一个单位、两个单位或五个单位比较好,要避免用一小格表示三、七或九个单位。
因为那样不仅坐标点和读数都不方便,也容易出现错误。
(4)和y轴二变量的变化范围(a—b)(c—d),表现在坐标纸上的长度应该相差不大,最多也不要长过一倍。
注明x、y轴代表的测定量及单位,按测量数据标出坐标点。
4.1在我们讨论变量间的函数关系,这类问题有两种不同的情况:
(1)已知两个变量函数关系的形式,但是其中有位置参量;
如果两个变量x、y之间是直线关系,即y=a+bx则可用n组测量值(xi,yi)作图,所得直线的截距即参量a,斜率是参量b。
但是实验中两个变量的关系往
第10页
往不是直线,例如,弹簧振子的振动周期T和所负载m的关系为
T2mcm0,式中m0为弹簧自身的重量,c和k是待定参量。
测量不同m对应的T,可以作T—m图线,图3为一例。
由于它是曲线,因而无法从图上得出待定参量值。
改换变量,将函数关系转变为直线关系,对此周其公式可以
改成T2(4cm0)4(m),他表示T2与m间为直线关系,作T2--m直线
(图4),从图上求出截距a,斜率b,则a=4cm0,b=4由此可求
kk
出k和c值。
即对于非线性函数,要通过变换变量使之成为线性函数,再用作图
法求出截距和斜率,进而确定待定参量。
图(3)弹簧振子的T—m曲线图(4)弹簧振子的T—m曲线
非线性函数如何变换要看函数的形式,例如:
yaebx[lny]lnab[x]
Ex1
yR[y]RRE[]
xx
2y
yaxbx[]ab[x]
x
上列式中的括号[]为变换后的变量。
(2)两个变量函数关系的形式尚未知时
首先用测量值作图,如果得一直线,则从图上求出截距和斜率,函数关系就完全
第11页
确定了;当得到的是曲线时,就要分析曲线的形式,参照已知的函数曲线,给出假定的函数式,再用上述
(1)中处理非线性函数的方法,使之线性化,但这样做不一定一次就成功,可能要反复几次才可得出较好的结果[4]。
通过电阻伏安特性研究的实验为例,对作图法和最小二乘法进行比较,其公式为RUI,式中U为电压,I为电流,R微电阻,测量数据见表4,用所测量的结果画图如图(5)。
表4电阻伏安特性测量表
物理量
1
2
3
4
5
6
7
8
9
10
U(V)
0.622
0.718
0.823
0.922
1.021
1.134
1.235
1.323
1.412
1.526
I(A)
0.234
0.264
0.305
0.331
0.369
0.421
0.461
0.479
0.521
0.565
在直线上取两点,A(0.600,0.223)、B(1.500,0.553),利用作图法进行处理,
求得斜率K图I2-I10.5530.2230.367,求K图值的标准偏差,由于
U2U11.5000.600
K图=0.367,所以作图法拟合直线为I=0.367U,将表4中的U代入得表5
表5电阻伏安特性I值
物理量
1
2
3
4
5
6
7
8
9
10
U(V)
0.622
0.718
0.823
0.922
1.021
1.134
1.235
1.323
1.412
1.526
I'=0.367U
0.228
0.263
0.302
0.308
0.375
0.416
0.453
0.484
0.518
0.560
第12页
I(A)
0.234
0.2640.305
0.331
0.3690.4210.4610.4790.521
0.565
III'
0.006
0.0010.003
-0.007
-0.0060.0050.008-0.0060.003
0.005
I的偏
差I
Ii
0.0
0002.09056K图0.的0标06准
偏差
i1n1
10
1图
面再估算读取数据时产生的误差.由于坐标纸最小分格之间人眼无法辨别具体
数据,因此存在视觉误差U、I,K图21
图U2U1
差相同,且为坐标纸最小分格的一半则U=0.005,I=0.0025代入数据得:
读取数据时的误差是较大的。
若坐标分度值取得不当,求斜率K图时,从直线上取
的两点距离较近的话,产生的误差就更大。
利用最小二乘法处理数据,求斜率K乘值,由U=1.0736,U2=1.2356,
2
K乘
U=1.1526,I=0.395,UI=0.4546,UI=0.424,得:
1.23561.15260.3670.37。
求K乘值的标准偏差,由
K乘=0.37得到最小二乘法拟合曲线为I=0.37U,将表4中的U代入的表6
表6数据列表
物理量
1
2
3
4
5
6
7
8
9
10
U(V)
0.622
0.718
0.823
0.922
1.021
1.134
1.235
1.323
1.412
1.526
I'=0.367U
0.230
0.266
0.305
0.341
0.378
0.420
0.457
0.489
0.522
0.565
I(A)
0.234
0.264
0.305
0.331
0.369
0.421
0.461
0.479
0.521
0.565
III'
0.004
-0.002
0.000
-0.010
-0.009
0.001
0.004
-0.010
0.001
0.000
第13页
小结:
图=0.3670.01,K乘=0.3670.007,即最小二乘法拟合的直线较精确。
100.00590.007
1012.36115.26
5.逐差法
逐差法是为了减小系统误差,而在实验数据处理当中常用的一种方法。
当实验中的两个物理量满足正比例关系时,依次记录改变相同的量时的值、或者某一研究对象随实验条件周期性变化时,依次记录研究对象达到某一条
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 试验 数据 处理 分析