大数据处理及误差分析报告.docx
- 文档编号:29716817
- 上传时间:2023-07-26
- 格式:DOCX
- 页数:84
- 大小:238.05KB
大数据处理及误差分析报告.docx
《大数据处理及误差分析报告.docx》由会员分享,可在线阅读,更多相关《大数据处理及误差分析报告.docx(84页珍藏版)》请在冰豆网上搜索。
大数据处理及误差分析报告
实用文档
物理实验课的基本程序
物理实验的每一个课题的完成,一般分为预习、课堂操作和完成实验报告三个阶段。
§1实验前的预习
为了在规定时间内,高质量地完成实验任务,学生一定要作好实验前的预习。
实验课前认真阅读教材,在弄清本次实验的原理、仪器性能及测试方法和步骤的基础上,在实验报告纸上写出实验预习报告。
预习报告包括下列栏目:
实验名称写出本次实验的名称。
实验目的应简单明确地写明本次实验的目的要求。
实验原理扼要地叙述实验原理,写出主要公式及符号的意义,画上主要的示意图、电路图或光路图。
若讲义与实际所用不符,应以实际采用的原理图为准。
实验内容简明扼要地写出实验内容、操作步骤。
为了使测量数据清晰明了,防止遗漏,应根据
实验的要求,用一张A4白纸预先设计好数据表格,便于测量时直接填入测量的原始数据。
注意要正
确地表示出有效数字和单位。
§2课堂操作
进入实验室,首先要了解实验规则及注意事项,其次就是熟悉仪器和安装调整仪器(例如,千
分尺调零、天平调水平和平衡、光路调同轴等高等)。
准备就绪后开始测量。
测量的原始数据(一定不要加工、修改)应忠实地、整齐地记录在预先设计好的实验数据表格里,数据的有效位数应由仪器的精度或分度值加以确定。
数据之间要留有
间隙,以便补充。
发现是错误的数据用铅笔划掉,不要毁掉,因为常常在核对以后发现它并没有错,
不要忘记记录有关的实验环境条件(如环境温度、湿度等),仪器的精度,规格及测量量的单位。
实
验原始数据的优劣,决定着实验的成败,读数时务必要认真仔细。
运算的错误可以修改,原始数据
则不能擅自改动。
全部数据必须经老师检查、签名,否则本次实验无效。
两人同作一个实验时,要
既分工又协作,以便共同完成实验。
实验完毕后,应切断电源,整理好仪器,并将桌面收拾整洁方能离开实验室。
§3
实验报告
实验报告是实验工作的总结。
要用简明的形式将实验报告完整而又准确地表达出来。
实验报告
要求文字通顺,字迹端正,图表规矩,结果正确,讨论认真。
应养成实验完后尽早写出实验报告的
习惯,因为这样做可以收到事半功倍的效果。
完整的实验报告应包括下述几部分内容:
数据表格
在实验报告纸上设计好合理的表格,将原始数据整理后填入表格之中(
有老师签
名的原始数据记录纸
要附在本次报告一起交)。
数据处理
根据测量数据,可采用列表和作图法(用坐标纸)
,对所得的数据进行分析。
按照
实验要求计算待测的量值、绝对误差及相对误差。
书写在报告上的计算过程应是:
公式→代入数据
→结果,中间计算可以不写,绝对不能写成:
公式→结果,或只写结果。
而对误差的计算应是:
先
列出各单项误差,按如下步骤书写,公式→代入数据→用百分数书写的结果。
结果表达
按下面格式写出最后结果:
N(待测量)N(..测量结果)
N(总绝对误差)
Er(相对误差)
N
100%
N
结果分析对本次实验的结果及主要误差因数作简要的分析讨论,并完成课后的思考题。
还可以谈谈实验的心得体会。
如果实验是为了观察某一物理现象或者观察某一物理规律,可只扼要地写出实验结论。
以上是对报告的一般性要求。
不同的实验,可以根据具体情况有所侧重和取舍,不必千篇一律。
标准
间接测量。
实用文档
误差处理
物理实验的任务,不仅仅是定性地观察物理现象,也需要对物理量进行定量测量,并找出各物理量之间的内在联系。
由于测量原理的局限性或近似性、测量方法的不完善、测量仪器的精度限制、测量环境的不理想以及测量者的实验技能等诸多因素的影响,所有测量都只能做到相对准确。
随着科学技术的不断发展,人们的实验知识、手段、经验和技巧不断提高,测量误差被控制得越来越小,但是绝对不可能使误差降为零。
因此,作为一个测量结果,不仅应该给出被测对象的量值和单位,而且还必须对量值的可靠性做出评价,一个没有误差评定的测量结果是没有价值的。
下面介绍测量与误差、误差处理、有效数字、测量结果的不确定度评定等基本知识,这些知识不仅在后面的实验中要经常用到,而且也是今后从事科学实验工作所必须了解和掌握的。
§1测量与误差
一、测量及其分类
所谓测量,就是借助一定的实验器具,通过一定的实验方法,直接或间接地把待测量与选作计量单位的同类物理量进行比较的全部操作。
简而言之,测量是指为确定被测对象的量值而进行的一组操作。
按照测量值获得方法的不同,测量分为直接测量和间接测量两种。
直接从仪器或量具上读出待测量的大小,称为直接测量。
例如,用米尺测物体的长度,用秒表
测时间间隔,用天平测物体的质量等都是直接测量,相应的被测物理量称为直接测量量。
如果待测量的量值是由若干个直接测量量经过一定的函数运算后才获得的,则称为
例如,先直接测出铁圆柱体的质量
4m
m、直径D和高度h,再根据公式
计算出铁的的密度
D
2h
ρ,这就是间接测量,ρ称为间接测量量。
按照测量条件的不同,测量又可分为等精度测量和不等精度测量。
在相同的测量条件下进行的一系列测量是
等精度测量。
例如,同一个人,使用同一仪器,采用
同样的方法,对同一待测量连续进行多次测量,此时应该认为每次测量的可靠程度相同,故称之为
等精度测量,这样的一组测量值称为一个测量列。
在不同测量条件下进行的一系列测量,例如不同的人员,使用不同的仪器,采用不同的方法进
行测量,则各次测量结果的可靠程度自然也不相同,这样的测量称为不等精度测量。
处理不等精度
测量的结果时,需要根据每个测量值的“权重”
,进行“加权平均”,因此在一般物理实验中很少采
用。
等精度测量的误差分析和数据处理比较容易,下面所介绍的误差和数据处理知识都是针对等精度测量的。
二、误差与偏差
1.真值与误差
任何一个物理量,在一定的条件下,都具有确定的量值,这是客观存在的,这个客观存在的量值称为该物理量的真值。
测量的目的就是要力图得到被测量的真值。
我们把测量值与真值之差称为测量的绝对误差。
设被测量的真值为χ0,测量值为χ,则绝对误差ε为
ε=χ–χ0
(1)
由于误差不可避免,故真值往往是得不到的。
所以绝对误差的的概念只有理论上的价值。
2.最佳值与偏差
在实际测量中,为了减小误差,常常对某一物理量x进行多次等精度测量,得到一系列测量值x1,x2,,xn,则测量结果的算术平均值为
标准
实用文档
12n1
nn
n
i
(2)
i1
算术平均值并非真值,但它比任一次测量值的可靠性都要高。
系统误差忽略不计时的算术平均
值可作为最佳值,称为近真值。
我们把测量值与算术平均值之差称为偏差(或残差):
vii(3)
三、误差的分类
正常测量的误差,按其产生的原因和性质可分为系统误差和随机误差两类,它们对测量结果的影响不同,对这两类误差处理的方法也不同。
1.系统误差
在同样条件下,对同一物理量进行多次测量,其误差的大小和符号保持不变或随着测量条件的
变化而有规律地变化,这类误差称为系统误差。
系统误差的特征是具有确定性,它的来源主要有以下几个方面:
仪器因素由于仪器本身的固有缺陷或没有按规定条件调整到位而引起误差。
例如,仪器标尺的刻度不准确,零点没有调准,等臂天平的臂长不等,砝码不准,测量显微镜精密螺杆存在回程差,或仪器没有放水平,偏心、定向不准等。
理论或条件因素由于测量所依据的理论本身的近似性或实验条件不能达到理论公式所规定
的要求而引起误差。
例如,称物体质量时没有考虑空气浮力的影响,用单摆测量重力加速度时要求摆角→0,而实际中难以满足该条件。
人员因素由于测量人员的主观因素和操作技术而引起误差。
例如,使用停表计时,有的人总是操之过急,计时比真值短;有的人则反应迟缓,计时总是比真值长;再如,有的人对准目标时,
总爱偏左或偏右,致使读数偏大或偏小。
对于实验者来说,系统误差的规律及其产生原因,可能知道,也可能不知道。
已被确切掌握其
大小和符号的系统误差称为可定系统误差;对于大小和符号不能确切掌握的系统误差称为未定系统误差。
前者一般可以在测量过程中采取措施予以消除,或在测量结果中进行修正。
而后者一般难以做出修正,只能估计其取值范围。
2.随机误差
在相同条件下,多次测量同一物理量时,即使已经精心排除了系统误差的影响,也会发现每次测量结果都不一样。
测量误差时大时小,时正时负,完全是随机的。
在测量次数少时,显得毫无规律,但是当测量次数足够多时,可以发现误差的大小以及正负都服从某种统计规律。
这种误差称为
随机误差。
随机误差的特征是它的不确定性,它是由测量过程中一些随机的或不确定的因素引起的。
例如,人的感受(视觉、听觉、触觉)灵敏度和仪器稳定性有限,实验环境中的温度、湿度、气流
变化,电源电压起伏,微小振动以及杂散电磁场等都会导致随机误差。
除系统误差和随机误差外,还有过失误差。
过失误差是由于实验者操作不当或粗心大意造成的,例如看错刻度、读错数字、记错单位或计算错误等。
过失误差又称粗大误差。
含有过失误差的测量
结果称为“坏值”,被判定为坏值的测量结果应剔除不用。
实验中的过失误差不属于正常测量的范畴,
应该严格避免。
3.精密度、正确度和准确度
评价测量结果,常用到精密度、正确度和准确度这三个概念。
这三者的含义不同,使用时应注意加以区别。
精密度反映随机误差大小的程度。
它是对测量结果的重复性的评价。
精密度高是指测量的重复性好,各次测量值的分布密集,随机误差小。
但是,精密度不能确定系统误差的大小。
正确度反映系统误差大小的程度。
正确度高是指测量数据的算术平均值偏离真值较少,测量的系统误差小。
但是,正确度不能确定数据分散的情况,即不能反映随机误差的大小。
准确度反映系统误差与随机误差综合大小的程度。
准确度高是指测量结果既精密又正确,即随机误差与系统误差均小。
现以射击打靶的弹着点分布为例,形象地说明以上三个术语的意义。
如图1所示,其中图(a)
表示精密度高而正确度低,图(b)表示正确度高而精密度低,图(c)表示精密度和正确度均低,即准确度低,图(d)表示精密度和正确度均高,即准确度高。
通常所说的“精度”含义不明确,应
尽量避免使用。
标准
实用文档
精密度高,正确度低正确度高,精密度低精密度和正确度均低精密度和正确度均高
图1精密度、正确度和准确度示意图
§2误差处理
一、处理系统误差的一般知识
1.发现系统误差的方法
系统误差一般难于发现,并且不能通过多次测量来消除。
人们通过长期实践和理论研究,总结出一些发现系统误差的方法,常用的有:
理论分析法包括分析实验所依据的理论和实验方法是否有不完善的地方;检查理论公式所要求的条件是否得到了满足;量具和仪器是否存在缺陷;实验环境能否使仪器正常工作以及实验人员的心理和技术素质是否存在造成系统误差的因素等。
实验比对法对同一待测量可以采用不同的实验方法,使用不同的实验仪器,以及由不同的测量人员进行测量。
对比、研究测量值变化的情况,可以发现系统误差的存在。
数据分析法因为随机误差是遵从统计分布规律的,所以若测量结果不服从统计规律,则说明存在系统误差。
我们可以按照规律测量列的先后次序,把偏差(残差)列表或作图,观察其数值变化的规律。
比如前后偏差的大小是递增或递减的;偏差的数值和符号有规律地交替变化;在某些
测量条件下,偏差均为正号(或负号),条件变化以后偏差又都变化为负号(或正号)等情况,都可以判断存在系统误差。
2.系统误差的减小与消除
知道了系统误差的来源,也就为减小和消除系统误差提供了依据。
(1)减小与消除产生系统误差的根源
对实验可能产生误差的因素尽可能予以处理。
比如采用更符合实际的理论公式,保证仪器装置良好,满足仪器规定的使用条件等等。
(2)利用实验技巧,改进测量方法
对于定值系统误差的消除,可以采用如下一些技巧和方法。
交换法根据误差产生的原因,在一次测量之后,把某些测量条件交换一下再次测量。
例如,
用天平称质量时,把被测物和砝码交换位置进行两次测量。
设m1和m2分别为两次测得的质量,取
物体的质量为mm1m2,就可以消除由于天平不等臂而产生的系统误差。
替代法在测量条件不变的情况下,先测得未知量,然后再用一已知标准量取代被测量,而不引起指示值的改变,于是被测量就等于这个标准量。
例如,用惠斯通电桥测电阻时,先接入被测电阻,使电桥平衡,然后再用标准电阻替代被测量,使电桥仍然达到平衡,则被测电阻值等于标准电阻值。
这样可以消除桥臂电阻不准确而造成的系统误差。
异号法改变测量中的某些条件,进行两次测量,使两次测量中的误差符号相反,再取两次测量结果的平均值做为测量结果。
例如,用霍耳元件测磁场实验中,分别改变磁场和工作电流的方向,
依次为(+B,+I)、(+B,-I)、(-B,+I)、(-B,-I),在四种条件下测量电势差UH,再取其平均值,可以减小或消除不等位电势、温差电势等附加效应所产生的系统误差。
此外,用“等距对称观测法”可消除按线性规律变化的变值系统误差;用“半周期偶数测量法”可以消除按周期性变化的变值系统误差等等,这里不再详细介绍。
在采取消除系统误差的措施后,还应对其它的已定系统误差进行分析,给出修正值,用修正公式或修正曲线对测量结果进行修正。
例如,千分尺的零点读数就是一种修正值;标准电池的电动势随温度的变化可以给出修正公式;电表校准后可以给出校准曲线等等。
对于无法忽略又无法消除或修正的未定系统误差,可用估计误差极限值的方法进行估算。
标准
实用文档
以上仅就系统误差的发现及消除方法做了一般性介绍。
在实际问题中,系统误差的处理是一件复杂而困难的工作,它不仅涉及许多知识,还需要有丰富的经验,这需要在长期的实践中不断积累,不断提高。
二、随机误差及其分布
实验中随机误差不可避免,也不可能消除。
但是,可以根据随机误差的理论来估算其大小。
为了简化起见,在下面讨论随机误差的有关问题中,并假设系统误差已经减小到可以忽略的程度。
1.标准误差与标准偏差
采用算术平均值作为测量结果可以削弱随机误差。
但是,算术平均值只是真值的估计值,不能反映各次测量值的分散程度。
采用标准误差来评价测量值的分散程度是既方便又可靠的。
对物理量X进行n次测量,其标准误差(标准差)定义为
(x)
lim
1n
(xi
x0)2
(4)
n
ni1
在实际测量中,测量次数n总是有限的,而且真值也不可知。
因此标准误差只有理论上的价值。
对标准误差
(x)的实际处理只能进行估算。
估算标准误差的方法很多,最常用的是贝塞尔法,
它用
实验标准(偏)差S(x)近似代替标准误差
(x)。
实验标准差的表达式为
1
n
x)2
S(x)
(xi
(5)
n
1i1
本书中我们都是用此式来计算直接测量量的实验标准差,其含义将在下面讨论。
2.平均值的实验标准差
如上所述,在我们进行了有限次测量后,可得到算术平均值
x。
x
也是一个随机变量。
在完全相同的条件下,多次进行重复测量,每次得
到的算术平均值本身也具有离散性由误差理论可以证明,
算术平均值的
实验标准差为
S(x)
1
n
S(x)
(xix)2
(6)
n
n(n
1)i1
由此式可以看出,平均值的实验标准差比任一次测量的实验标准差
图2
测量次数对S(x)的影
小。
增加测量次数,可以减少平均值的实验标准差,
提高测量的准确度。
但是,单纯凭增加测量次数来提高准确度的作用是有限的。
如图
2所示,当n>10以后,随测量次数
n的增加,S(x)减小得很缓慢。
所以,在科学研究中测量次数一般取
10-20次,而在物理实验教学
中一般取6-10
次。
3.随机误差的正态分布规律
随机误差的分布是服从统计规律的
.首先,我们用一组测量数据来形象地说明这一点。
例如用数
字毫秒计测量单摆周期,重复
60次(n=60),将测量结果统计如下表:
时间区间/s
出现次数n
相
对
频
数
时间区间/s
出现次数n
相对频数
(频数)
n
/%
(频数)
n/%
n
n
2.146-2.150
1
2
2.166-2.170
15
25
2.151-2.155
3
5
2.171-2.175
9
15
2.156-2.160
9
15
2.176-2.180
5
8
2.161-2.165
16
27
2.181-2.185
2
3
以时间T为横坐标,相对频数
n为纵坐标,用直方图将测量结果表示如图
3.如果再进行一组测
n
量(如100次),做出相应的直方图,仍可以得到与前述图形不完全吻合但轮廓相似的图形。
随着次
数的增加,曲线的形状基本不变,但对称性越来越明显,曲线也趋向光滑。
当n时,上述曲线
变成光滑曲线。
这表示测值T与频数n的对应关系呈连续变化的函数关系。
显然,频数与T的取
n
标准
实用文档
值有关,连续分布时它们之间的关系可以表示为图3统计直方图
dn
n
f(T)dT
dn
函数fT称为概率密度函数,
ndT
其含义是在测值T附近、单位时间间隔内测值出现的概率。
当测量次数足够多时,其误差分布将服从统计规律。
许多物理测量中,当n
时随机误差
服从正态分布(或称高斯分布)规律。
可以导出正态
分布概率密度函数的表达式为:
1
2
e2
2
(7)
f()
2
,纵坐标f()为误差分布的概率密度函数。
图4是正态分布曲线。
该曲线的横坐标为误差
f()的物理含义是:
在误差值
附近,单位误差间隔内,误差出现的概率。
曲线下阴影面积元
f()d
表示误差出现在
~
+d区间内的概率。
按照概率理论,误差
出现在区间(
)
范围内是必然的,即概率为
100%。
所以,图中曲线与横轴所包围的面积应恒等于1,即
f()d
1
(8)
由概率理论可以证明
就是标准差。
在正态分布的情况下,式(7)中
的物理意义是什么呢?
首先定性分析一下:
从式(
7)可以看出,当
=0时,
1
f(0)
2
因此,
值越小,f(0)的值越大。
由于曲线与横坐标轴所包围的面积恒等于
1,所以曲线峰值高,
两侧下降就较快。
这说明测量值的离散性小,测量的精密度高。
相反,如果
值大,f(0)
就小,误
差分布的范围就较大,测量的精密度低。
这两种情况的正态分布曲线如图
5所示。
图4正态分布曲线图5的物理意义
4.置信区间与置信概率
我们还可以从另一个角度理解的物理意义。
计算一下测量结果分布在-~之间的概率,可
得
P1f()d0.68368.3%(9)
这就是说,在所测的一组数据中平均有68.3%的数据测值误差落在区间[-,]之间。
同样也可以
认为在所测的一组数据中,任一个测值的误差落在区间[-,]内的概率为68.3%.我们把P1称作
置信概率,[-,]就是68.3%的置信概率,所对应的置信区间。
显然,扩大置信区间,置信概率就会提高。
可以证明,如果置信区间分别为[-2,2]和[-3,
3],则相应的置信概率为
P2
2
f()d95.5%
(10)
2
标准
P3
3
f()d
99.7%
(11)
3
一般情况下,置信区间可用
[-k
,k
]表示,k称为包含因子,对于一个测量结果,只要给出置信
区间和相应的置信概率就表达了测量结果的精密度。
对应于[-3
,3
]这个置信区间,其置信概率为
99.7%,即在1000次的重复测量中,随机误
差超出[-3
,3
3
]的平均只有3
次。
对于一般有限次测量来说,测量值超出这一区间的可能性非常
小,因此常将
称为极限误差。
5.t
分布
根据误差理论,当测量次数很少时(例如,少于
10次),测量列的误差分布将明显偏离正态分
布,这时测量值的随机误差将遵从
t分布。
这个分布是
1908年由戈塞特首先提出来的,由于发表时
使用了笔名“Student”,故也称“学生分布”。
t分布曲线与正态分布曲线类似,两者的主要区别是
t
分布的峰值低于正态分布,而且上部较窄,下部较宽,如图
1-6。
这样,在有限次测量的情况下,就
要将随机误差的估算值取大一些,包含因子
k应转换成tp,tp值与测量次数有关,也与置信概率
P
有关,表1
给出了tp与测量次数n、置信概率P的对应关系,供查用。
表1
tp值表
n
2
3
4
5
6
7
8
9
10
20
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据处理 误差 分析 报告