7分析化学中的数据处置.docx
- 文档编号:7836018
- 上传时间:2023-01-26
- 格式:DOCX
- 页数:8
- 大小:90.27KB
7分析化学中的数据处置.docx
《7分析化学中的数据处置.docx》由会员分享,可在线阅读,更多相关《7分析化学中的数据处置.docx(8页珍藏版)》请在冰豆网上搜索。
7分析化学中的数据处置
7分析化学中的数据处置
第7章分析化学中的数据处置1.整体与样本整体:
在统计学中,关于所考察的对象的全部,称为整体(或母体)。
个体:
组成整体的每一个单元。
样本(子样):
自整体中随机抽取的一组测量值(自整体中随机抽取的一部份个体)。
样本容量:
样品中所包括个体的数量,用n表示。
例如:
分析延河水总硬度,依照取样规那么,从延河中取来供分析用2000ml样品水,这2000ml样品水是供分析用的整体,若是从样品水中掏出20个试样进行平行分析,取得20个分析结果,那么这组分析结果确实是延河样品水的一个随机样本,样本容量为20。
2.随机变量来自同一整体的无穷多个测量值都是随机显现的,叫随机变量。
设样本容量为n,那么其平均值为:
当测定次数无穷增多时,所得平均值即为整体平均值μ:
假设没有系统误差,那么整体平均值μ确实是真值现在,单次测量的平均误差δ为标准误差1整体标准误差2样本标准误差相对标准误差标准误差与平均误差平均值的标准误差整体标准误差当测定次数为无穷多次时,各测量值对整体平均值μ的偏离,用整体标准误差σ表示:
计算标准误差时,对单次测量加以平方,如此做不仅能幸免单次测量误差相加时正负抵消,更重要的是大误差能显著地反映出来,因此能够更好地说明数据的分散程度。
样本标准误差当测量值不多,整体平均值又不明白时,用样本的标准误差s来衡量该组数据的分散程度。
样本标准误差的数学表达式为:
式中(n-1)称为自由度,以f表示,是指独立误差的个数。
当测量次数超级多时,测量次数n与自由度(n-1)的区别就很小了,现在,同时相对标准误差单次测量结果的相对标准误差又称变异系数为用标准误差比用平均误差更科学更准确.例:
两组数据 1x-:
,,,,,,n8d1S12x-:
,,,,,,,n8d2S2 d1d2, S1S2标准误差与平均误差用统计学方式能够证明,当测定次数超级多(例如大于20)时,标准误差与平均误差有以下关系:
δσ≈σ,但应当指出:
当测定次数较少时,与S之间的关系就可能与此式相差颇大了。
平均值的标准误差样本平均值是超级重要的统计量,通常以它来估量整体平均值μ。
一组样本的平均值的标准误差与单次测量结果的标准误差之间有以下关系:
无穷次测量为由此可见:
平均值的标准误差与测定次数的平方根成反比。
有限次测量为随机误差的正态散布1频数散布(frequencydistribution)2正态散布(normaldistribution)3随机误差的区间概率频数散布测定某样品100次,因有偶然误差存在,故分析结果有高有低,有两头小、中间大的转变趋势,即在平均值周围的数据显现机遇最多。
正态散布:
测量数据一样符合正态散布规律,即高斯散布,正态散布曲线数学表达式为:
y:
概率密度;x:
测量值μ:
整体平均值,即无穷次测定数据的平均值,无系统误差时即为真值;反映测量值散布的集中趋势。
σ:
标准误差,反映测量值散布的分散程度;x-μ:
随机误差正态散布曲线规律:
*xμ时,y值最大,表现了测量值的集中趋势。
大多数测量值集中在算术平均值的周围,算术平均值是最可信任值,能专门好反映测量值的集中趋势。
μ反映测量值散布集中趋势。
*曲线以xμ这一直线为其对称轴,说明正误差和负误差显现的概率相等。
*当x趋于-∞或+∞时,曲线以x轴为渐近线。
即小误差显现概率大,大误差显现概率小,显现专门大误差概率极小,趋于零。
*σ越大,测量值落在μ周围的概率越小。
即周密度越差时,测量值的散布就越分散,正态散布曲线也就越平坦。
反之,σ越小,测量值的分散程度就越小,正态散布曲线也就越尖锐。
σ反映测量值散布分散程度。
标准正态散布曲线横坐标改成u,纵坐标为概率密度,现在曲线的形状与σ大小无关,不同σ的曲线合为一条。
X-μu-------------σ随机误差的区间概率正态散布曲线与横坐标-∞到+∞之间所夹的面积,代表所有数据显现概率的总和,其值应为1,即概率P为:
随机误差显现的区间测量值显现的区间概率以σ为单位u±1xμ±1σ%u±xμ±σ%u±2xμ±2σ%u±xμ±σ%u±3xμ±3σ%例1已知某试样中山质量分数的标准值为%,σ%,又已知测量时没有系统误差,求分析结果落在±%范围内的概率。
解:
例2同上例,求分析结果大于%的概率。
解:
属于单边查验问题。
阴影部份的概率为。
整个正态散布曲线右边的概率为1/2,即为,故阴影部份之外的概率为-%,即分析结果大于%的概率为%。
少量数据的统计处置1t散布曲线2平均值的置信区间3显著性查验4异样值的取舍t散布曲线正态散布是无穷次测量数据的散布规律,而对有限次测量数据那么用t散布曲线处置。
用s代替σ,纵坐标仍为概率密度,但横坐标那么为统计量t。
t概念为:
→自由度f―degreeoffreedom(fn-1)t散布曲线与正态散布曲线相似,只是t散布曲线随自由度f而改变。
当f趋近∞时,t散布就趋近正态散布。
→置信度P―confidencedegree在某一t值时,测定值落在μ+ts范围内的概率。
→置信水平α―confidencelevel在某一t值时,测定值落在μ+ts范围之外的概率l-P→ta,f:
t值与置信度P及自由度f关系。
例:
t0?
?
05,10表示置信度为95%,自由度为10时的t值。
t0?
?
01,5表示置信度为99%,自由度为5时的t值。
平均值的置信区间(confidenceinterval)→当n趋近∞时:
单次测量结果以样本平均值来估量整体平均值可能存在的区间:
→关于少量测量数据,即当n有限时,必需依照t散布进行统计处置:
它表示在必然置信度下,以平均值为中心,包括整体平均值的范围。
这就叫平均值的置信区间。
例对其未知试样中Cl-的质量分数进行测定,4次结果为%,%,%,%。
计算置信度为90%,95%和99%时,整体平均值μ的置信区间。
解:
显著性查验―Significancetest1.F查验法―Ftest比较两组数据的方差s22.t查验法―ttest*平均值与标准值的比较*两组平均值的比较1.F查验法→比较两组数据的方差s2,以确信它们的周密度是否有显著性不同的方式。
统计量F概念为两组数据的方差的比值,分子为大的方差,分母为小的方差。
→两组数据的周密度相差不大,那么F值趋近于1;假设二者之间存在显著性不同,F值就较大。
→在必然的P置信度95%及f时,F计算F表,存在显著性不同,不然,不存在显著性不同。
例1在吸光光度分析中,用一台旧仪器测定溶液的吸光度6次,得标准误差s1;再用一台性能稍好的新仪器测定4次,得标准误差s2。
试问新仪器的周密度是不是显著地优于旧仪器的周密度?
解已知新仪器的性能较好,它的周密度可不能比旧仪器的差,因此,这是属于单边查验问题。
已知n16,s1n24,s2查表,f大6-15,f小4-13,F表9?
?
01,FF表,故两种仪器的周密度之间不存在显著性不同,即不能做出新仪器显著地优于旧仪器的结论。
做出这种判定的靠得住性达95%。
例2采纳两种不同的方式分析某种试样,用第一种方式分析11次,得标准误差s1%;用第二种方式分析9次,得标准误差s2%。
试判定两种分析方式的周密度之间是不是有显著性不同?
解不论是第一种方式的周密度显著地优于或劣于第二种方式的周密度,都以为它们之间有显著性不同,因此,这是属于双边查验问题。
已知n111,s10?
?
21%n29,s20?
?
60%查表,f大9-18,f小11-110,F表,FF表,故以为两种方式的周密度之间存在显著性不同。
作出此种判定的置信度为90%。
2.t查验法→平均值与标准值的比较为了检查分析数据是不是存在较大的系统误差,可对标准试样进行假设干次分析,再利用t查验法比较分析结果的平均值与标准试样的标准值之间是不是存在显著性不同。
进行t查验时,第一按下式计算出t值假设t计算tα,f,存在显著性不同,不然不存在显著性不同。
通常以95%的置信度为查验标准,即显著性水准为5%。
例采纳某种新方式测定基准明矾中铝的质量分数,取得以下9个分析结果:
%,%,%,%,%,%,%,%,%。
已知明矾中铝含量的标准值以理论值代为%。
试问采纳该新方式后,是不是引发系统误差置信度95%?
解n9,f9-18查表,P,f8时,,8。
t,8,故x与μ之间不存在显著性不同,即采纳新方式后,没有引发明显的系统误差。
→两组平均值的比较设两组分析数据为:
n1s1x1n2s2x2在必然置信度时,查出表值总自由度fn1+n2-2,假设tt表两组平均值存在显著性不同。
tt表,那么不存在显著性不同。
例用两种方式测定合金中铝的质量分数,所得结果如下:
第一法%%%第二法%%%试问两种方式之间是不是有显著性不同置信度90%?
解n13,x1%s1%n24,x2%s2%f大2f小3F表9?
?
55FF表→说明两组数据的标准误差没有显著性不同.→当P,fn1+n2-25时,t0?
?
10,5。
tt0?
?
10,5,故两种分析方式之间存在显著性不同.异样值(cutlier)的取舍在实验中取得一组数据,个别数据离群较远,这一数据称为异样值、可疑值或极端值。
假设是过失造成的,那么这一数据必需舍去。
不然异样值不能随意取舍,专门是当测量数据较少时。
处置方式有4d法、格鲁布斯Grubbs法和Q查验法。
1.4d法依照正态散布规律,误差超过3σ的个别测定值的概率小于%,故这一测量值通常能够舍去。
而δσ,3σ≈4δ,即误差超过4δ的个别测定值能够舍去。
用4d法判定异样值的取舍时,第一求出除异样值外的其余数据的平均值和平均误差d,然后将异样值与平均值进行比较,如绝对差值大于4d,那么将可疑值舍去,不然保留。
当4d法与其他查验法矛盾时,以其他法那么为准。
例测定某药物中钴的含量如μg/g,得结果如下:
,,,。
试问那个数据是不是应保留?
解第一不计异样值,求得其余数据的平均值x和平均误差d为异样值与平均值的差的绝对值为||>4d故这一数据应舍去。
2.格鲁布斯Grubbs法有一组数据,从小到大排列为:
x1,x2,……,xn-1,xn其中x1或xn可能是异样值。
用格鲁布斯法判按时,第一计算出该组数据的平均值及标准误差,再依照统计量T进行判定。
假设TTa,n,那么异样值应舍去,不然应保留例前一例中的实验数据,用格鲁布斯法判按时,那个数据应保留否置信度95%?
解平均值x,s查表T0?
?
05,4,TT0?
?
05,4,故那个数据应该保留。
格鲁布斯法优势,引人了正态散布中的两个最重要的样本参数x及s,故方式的准确性较好。
缺点是需要计算x和s,手续稍麻烦。
3.Q查验法设一组数据,从小到大排列为:
x1,x2,……,xn-1,xn设x一、xn为异样值,那么统计量Q为:
式中分子为异样值与其相邻的一个数值的差值,分母为整组数据的极差。
Q值越大,说明xn离群越远。
Q称为“舍弃商”。
当Q计算Q表时,异样值应舍去,不然应予保留。
误差的传递分析结果一般是通过一系列测量步骤以后取得的,其中每一步骤的测量误差都会反映到分析结果中去。
设分析结果Y由测量值A、B、C计算取得,测量值的系统误不同离为A、B、C,标准偏不同离为SA、SB、SC。
ki为常数。
系统误差的传递1.加减法2.乘除法3.指数关系4.对数关系随机误差的传递1.加减法2.乘除法3.指数关系4.对数关系极值误差回归分析法一元线性回归方程linearregression式中x,y别离为x和y的平均值,a为直线的截矩,b为直线的斜率,它们的值确信以后,一元线性回归方程及回归直线就定了。
相关系数-correlationcoefficient相关系数的物理意义如下:
a.当所有的认值都在回归线上时,r1。
b.当y与x之间完全不存在线性关系时,r0。
c.当r值在0至1之间时,表例如与x之间存在相关关系。
r值愈接近1,线性关系就愈好。
例用吸光光度法测定合金钢中Mn的含量,吸光度与Mn的含量间有以下关系:
Mn的质量μg0未知样吸光度A试列出标准曲线的回归方程并计算未知试样中Mn的含量。
解此组数据中,组分浓度为零时,吸光度不为零,这可能是在试剂中含有少量Mn,或含有其它在该测量波长下有吸光的物质。
设Mn含量值为x,吸光度值为y,计算回归系数a,b值。
ab标准曲线的回归方程为y+rr99%,f标准曲线具有专门好的线性关系未知试样中含Mnμg。
提高分析结果准确度的方式1选择适合的分析方式1依照试样的中待测组分的含量选择分析方法。
高含量组分用滴定分析或重量分析法;低含量用仪器分析法。
2充分考虑试样中共存组分对测定的干扰,采纳适当的掩蔽或分离方式。
3关于痕量组分,分析方式的灵敏度不能满足分析的要求,可先定量富集后再进行测定.2减小测量误差→称量:
分析天平的称量误差为±,为了使测量时的相对误差在%以下,试样质量必需在g以上。
→滴定管读数常有±mL的误差,在一次滴定中,读数两次,可能造成±mL的误差。
为使测量时的相对误差小于%,消耗滴定剂的体积必需在20mL以上,最好使体积在25mL左右,一样在20至30mL之间。
→微量组分的光度测定中,可将称量的准确度提高约一个数量级。
3减小随机误差在排除系统误差的前提下,平行测定次数愈多,平均值愈接近真实值。
因此,增加测定次数,能够提高平均值周密度。
在化学分析中,关于同一试样,通常要求平行测定(paralleldetermination)2~4次。
4排除系统误差由于系统误差是由某种固定的缘故造成的,因此找出这一缘故,就能够够排除系统误差的来源。
有以下几种方式。
1对如实验-contrasttest2空白实验-blanktest3校准仪器-calibrationinstrument4分析结果的校正-correctionresult1对如实验→与标准试样的标准结果进行对照;标准试样、治理样、合成样、加入回收法。
→与其它成熟的分析方式进行对照;国家标准分析方式或公认的经典分析方式。
→由不同分析人员,不同实验室来进行对如实验。
内检、外检。
2空白实验空白实验:
在不加待测组分的情形下,依照试样分析一样的操作手续和条件进行实验,所测定的结果为空白值,从试样测定结果中扣除空白值,来校正分析结果。
排除由试剂、蒸馏水、实验器皿和环境带入的杂质引发的系统误差,但空白值不可太大。
3校准仪器仪器不准确引发的系统误差,通过校准仪器来减小其阻碍。
例如砝码、移液管和滴定管等,在精准的分析中,必需进行校准,并在计算结果时采纳校正值。
4分析结果的校正校正分析进程的方式误差,例用重量法测定试样中高含量的SiO2,因硅酸盐沉淀不完全而使测定结果偏低,可用光度法测定滤液中少量的硅,而后将分析结果相加。
本章作业P2682,4,7P2698,10,12P27016,20,22,24,25P27128,29**表7-3tα,f值表(双边)
f置信度,显著性水准P
αP
αP
α1
2
3
4
5
6
7
8
9
10
20
∞
9?
?
92
5?
?
84
4?
?
60
4?
?
03
3?
?
71
3?
?
50
图7-5正态散布概率积分图
|μ|面积|μ|面积|μ|面积
置信度为90%时,,3
置信度为95%时,,3
置信度为99%时,,3
置信度越高,置信区间就越大,所
估量的区间包括真值的可能性也就
越大,置信度定在95%或90%。
表7-4置信度95%时F值单边
f大
f小2345678910∞2
3
4
5
6
7
8
9
10
∞
f大:
大方差数据的自由度;f小:
小方差数据的自由度。
判定两组数据的周密度是不是有显著性不同时,一组数据的周密度可能大于,等于,或小于另一组数据的周密度,显著性水平为单侧查验时的两倍,即,现在的置信P1-90%。
1?
80?
23
表7-5Tα,n值表
n显著性水准α3
4
5
6
7
8
9
10
11
12
13
14
15
20
表7-6Q值表
测定次数,n345678910置
信
度90%()96%()99%()
例上例中的实验数据,用Q查验法判按时,那个数据应保留否置信度90%?
解
已知n4,查表7-6,,Q,故那个数据应予保留。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分析化学 中的 数据 处置
![提示](https://static.bdocx.com/images/bang_tan.gif)