23离群值的判定与处置Word文档下载推荐.docx
- 文档编号:13650889
- 上传时间:2022-10-12
- 格式:DOCX
- 页数:36
- 大小:356.19KB
23离群值的判定与处置Word文档下载推荐.docx
《23离群值的判定与处置Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《23离群值的判定与处置Word文档下载推荐.docx(36页珍藏版)》请在冰豆网上搜索。
(六)剔除水平
为检出离群值是不是高度离群而指定的统计查验的显著性水平。
(剔除水平的值应不超过检出水平的值,除非还有约定,值应为)。
二、离群值产生缘故与判定
(一)离群值产生的缘故
离群值按产生缘故分为两类:
1.第一类离群值是整体固有变异性的极端表现,这种离群值与样本中其余观测值属于同一整体;
2.第二类离群值是由于实验条件和实验方式的偶然偏离所产生的结果,或产生于观测、记录、计算中的失误,这种离群值与样本中其余观测值不属于同一整体。
如:
测量者工作责任心不强,工作过于疲劳,对仪器熟悉与把握程度不够等缘故,引发操作不妥,或在测量进程中不警惕、不耐心、不认真等,从而造成错误的读数或错误的记录;
由于测量条件的意外转变,引发仪器示值或被测对象位置的改变而产生粗大误差。
如机械冲击、外界震动、电网供电电压突变、电磁干扰等环境条件意外地改变等,引发仪器示值或被测对象位置的改变而产生粗大误差;
测量仪器内部的突然故障。
如机械部件突然破损、电子元器件突然失效等。
(二)离群值的判定
对离群值的判定通常可依照技术上或物理上的理由直接进行,例如当实验者已经明白实验偏离了规定的实验方式,或测量仪器发生问题等。
当这些理由不明确时,可利用规定的方式判定。
由于数据的散布形式不同,如正态散布、指数散布、持续型(Ⅰ型)散布等,判定离群值的方式方式也有不同,本书只就正态散布情形进行讨论。
三、离群值的情形与判定程序
(一)离群值的情形
依照GB/T4883规定,离群值有三种情形:
1.上侧情形:
依如实际情形或以往体会,离群值都为高端值;
2.下侧情形:
依如实际情形或以往体会,离群值都为低端值;
3.双侧情形:
依如实际情形或以往体会,离群值既可为高端值,也可为低端值。
上侧情形和下侧情形统称为单侧情形;
当无法确以为单侧情形的,按双侧情形处置。
(二)离群值的判定程序
1.单个离群值的判定程序
(1)依实际情形或以往的体会选定适宜的查验规那么;
(2)确信适当的显著性水平;
(3)依照显著性水平及样本量,确信查验的临界值;
(4)由观测值计算相应统计量的值,依照计算所得统计量的值与临界值的比较结果作出判定。
2.多个离群值的判定程序
当存在多个离群值时,重复利用上述程序进行查验。
假设没有发觉离群值,那么整个查验判定工作终止;
假设检出离群值,当检出的离群值总数超过上限时,应停止查验,对样本应慎重处置,不然,采纳相同的检出水平和相同的规那么,对除去已检出的离群值后余下的观测值继续查验。
四、离群值处置的方式与规那么
(一)离群值处置的方式
离群值处置的方式有:
1.保留离群值并用于后续数据处置;
2.在找到实际缘故时修正离群值,不然予以保留;
3.剔除离群值,不追加观测值;
4.剔除离群值,并追加新的观测值或用适宜的插补值代替。
(二)离群值的处置规那么
关于检出的离群值,应尽可能寻觅技术上和物理上的缘故,作为处置离群值的依据。
应依如实际问题的性质,综合衡量寻觅和判定产生离群值的缘故所付出的代价、正确判定离群值的收益和错误剔除正常观测值的风险,以确信实施下述规那么之一:
1.假设在技术上或物理上找到了产生离群值的缘故,那么应剔除或修正;
假设未找到产生离群值的技术上或物理上的缘故,那么不得剔除或进行修正。
2.假设在技术上或物理上找到产生离群值的缘故,那么应剔除或修正;
不然,保留岐离值,剔除或修正统计离群值;
在重复利用同一查验规那么查验多个离群值的情形,每次检出离群值后,都要再查验它与否为统计离群值。
假设某次检出的离群值为统计离群值,那么此离群值及在它前面检出的离群值(含岐离值)都应被剔除或修正。
3.检出的离群值(含岐离值)都应被剔除或修正。
4.备案
被剔除或修正的观测值及其理由应予以记录,以备查询。
§
2离群值判定规那么(重点)
本节要紧依据GB/T4883—2020《数据的统计处置和说明正态样本离群值的判定和处置》的规定,介绍整体标准差已知(用σ)和未知(用s)两种情形下离群值的查验判定方式。
一、已知标准差(用σ)情形离群值的判定规那么——奈尔查验法
当已知标准差时,利用奈尔查验法,奈尔查验法的样本量。
假设对某标准差为的量进行检测,检测次数为,检测值为:
。
①对样本检测数值按从小到大顺序从头排列:
,为发觉离群值,按下述规那么判定:
(一)上侧情形
如疑心最大值为离群值,那么按下述步骤进行判定:
1.计算算术平均值
2.计算统计量
(4—1)
式中:
——整体标准差;
——样本均值。
3.确信检出水平,从表4—1中查出临界值;
4.依照计算统计量和临界值的关系进行判定:
当时,判定为离群值;
不然判定未发觉是离群值;
5.关于检出的离群值,确信剔除水平,从表4—1中查出临界值。
那么:
当时,判定为统计离群值,不然判定未发觉是统计离群值,即为歧离值。
(二)下侧情形
假设疑心最小值为离群值,那么按以下步骤判定:
(4—2)
4.依照统计量与临界值的关系作出判定:
当时,判定最小值为离群值,不然判定未发觉是离群值;
(三)双侧情形
假设疑心、为离群值,按以下步骤进行判定:
1.别离计算统计量、的值;
2.确信检出水平,从表4—1中查出临界值;
3.依照、与临界值的关系作出判定:
(1)当,且时,判定最大值为离群值,不然判定未发觉是离群值;
(2)当,且时,判定最小值为离群值,不然判定未发觉是离群值;
(3)当时,同时对最大值和最小值进行查验。
当时,判定最大值为离群值,不然判定未发觉是离群值;
当时,判定最小值为离群值,不然判定未发觉是离群值;
4.关于检出的离群值或,确信剔除水平,从表4—1中查出临界值,
当时,判定为统计离群值,不然判未发觉是统计离群值,即为歧离值;
当时,判定为统计离群值,不然判定未发觉是统计离群值,即是歧离值。
表4—1奈尔查验临界值
3
32
4
33
5
34
6
35
7
36
8
37
9
38
10
39
11
40
12
41
13
42
14
43
15
44
16
45
17
46
18
47
19
48
20
49
21
50
22
51
23
52
24
53
25
54
26
55
27
56
28
57
29
58
30
59
31
60
【例4—1】对某量进行检测,其检测数据如下:
,,,,,,,,,。
假设测量中系统误差已经排除,测量服从正态散布,已知,试用奈尔查验法判定离群值的存在()。
解:
1.第一对检测数据按从小到大顺序从头排列:
那么。
2.计算算术平均值:
3.计算统计量:
4.查表4—1得临界值,。
因为,故判定不是离群值。
再判定是不是为离群值
1.计算统计量:
2.依照检出水平,查表得临界值。
二、未知标准差情形离群值的判定规那么
在标准差未知的情形下,若是检出离群值的个数不超过1时,可利用格拉布斯查验法和狄克逊查验法;
当检出离群值个数超过1时,可重复利用狄克逊查验法、偏度—峰度查验法和格拉布斯查验法。
(一)格拉布斯查验法
假设对某量进行检测,标准差未知,测量次,检测值为:
对样本检测数值按从小到大顺序排列:
,为发觉离群值,利用格拉布斯查验法按下述步骤判定:
1.上侧情形
(1)计算算术平均值和实验标准差
;
(2)计算出统计量
(4—3)
(3)确信检出水平,查表4—2,查出格拉布斯临界值;
(4)依照计算的统计量和临界值的关系进行判定。
当时,判定为离群值,不然判定未发觉是离群值;
(5)关于检出的离群值,确信剔除水平,在表4—2种查出临界值,
2.下侧情形
(1)依照算术平均值和实验标准差,计算统计量
(4—4)
(2)确信检出水平,查表4—2查出格拉布斯临界值;
(3)依照计算的统计量和临界值的关系进行判定。
(4)关于检出的离群值,确信剔除水平,在表4—2种查出临界值,
3.双侧情形
(1)依照算术平均值和实验标准差,计算统计量和
(3)依照计算统计量、和临界值的关系进行判定:
当,且时,判定为离群值,不然判定未发觉是离群值;
当时,应从头考虑限定检出离群值的个数。
(4)关于检出的离群值或,确信剔除水平,查表4—2查出临界值,并依照统计量、的值进行比较判定:
当时,判定为统计离群值,不然判定未发觉是统计离群值,即为岐离值;
当时,判定为统计离群值,不然判
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 23 离群 判定 处置