最新QC旧七大手法之六散布图.docx
- 文档编号:29785235
- 上传时间:2023-07-26
- 格式:DOCX
- 页数:16
- 大小:234.54KB
最新QC旧七大手法之六散布图.docx
《最新QC旧七大手法之六散布图.docx》由会员分享,可在线阅读,更多相关《最新QC旧七大手法之六散布图.docx(16页珍藏版)》请在冰豆网上搜索。
最新QC旧七大手法之六散布图
QC(旧)七大手法之六——散布图
QC(旧)七大手法之六——散布图(scatterdiagram)
第一小节散布图的观察分析
一.定义
散布图,也称散点图、相关图,散布图法又称为相关图法,QC要掌握的是平面散布图,是指通过分析研究两种因素的数据(成对出现)之间的关系,来控制影响产品质量的相关因素的一种有效方法(图示技术)。
散布图是研究成对出现的两组数据之间关系的图示技术。
在生产实际中,往往是一些变量共处于一个统一体中,它们相互联系、相互制约,在一定条件下又相互转化。
有些变量之间存在着确定性的关系,它们之间的关系,可以用函数关系来表达,如圆的面积S=πr2,有些变量之间却存在相关关系(即统计关系),即这些变量之间既有关系,但又不能由一个变量的数值精确地求出另一个变量的数值,如钢铁材料强度与含碳量之间的关系,车间的照明度与IPQC的测量误差之间的关系,人的身高与体重之间的关系等,这种统计关系只能用统计技术去研究,即将这两种有关的数据列出,用点子打在坐标图上,然后观察这两种因素之间的关系,这种图就是散布图或相关图,对散布图的分析称为相关分析。
散布图中所分析的两种数据之间的关系,一般有三种:
可以是特性与原因的关系,即特性——原因(结果——原因);也可以是某一特性与另一特性的关系,即特性——特性(结果——结果);还可以是同一特性的两个原因之间的关系,即原因——原因。
散布图分析法,是适用范围较广的一种数理统计方法。
只要生产或试验中,存在着一些变量共处于一个共同体中,并且它们的关系又是不能用函数表示的非确定性关系,就可以运用散布图法来分析其是否具有相关关系以及这种关系的密切程度(即相关系数大小)。
若同时存在的不只是两个变量,而是多个变量,则可以两两分别作散布图来加以分析。
当然,也可用正交试验设计方法来对多变量(因素)之间的关系进行分析,并求得它们之间的最优配合。
注:
用相关图法,可以应用相关系数r、回归分析等进行定量的分析处理,确定各种因素对产品质量的影响程度。
如果两个数据之间的相关程度很大,那么可以通过一个变量的控制来间接控制另外一个变量。
一般两组变量之间可能存在的关系有函数关系、相关关系和不相关三种情况。
相关关系是普通存在的,而函数关系仅是相关关系的特例。
质量是一种随机现象,在产品实现的过程中,存在两类因素影响产品质量的特性,其一是随机性因素(偶然性因素),其二是系统性因素(非随机性因素即确定性因素)。
在一定生产力水平下,随机性因素是不可观测和不可控无须控制的因素,在这种因素作用下产品质量特性的变化不会超出允许的界限(公差),产品质量符合要求。
而系统性因素是确定性因素,是构成生产过程的必要条件,可观测可控制,发生异常变化,产品质量特性则会超出允许的界限,产品质量将不会符合要求。
因此,在质量管理中,观测和控制这些决定产品质量特性是否符合要求的系统性因素,是一项重要的控制活动。
产品质量特性与影响因素的关系,可能没有确定的函数关系,但却具有某种关联,即原因和结果的关系。
如何确定影响产品质量特性的因素之间存在的相关关系?
能否通过控制相关因素达到控制产品质量的目的?
这就是散布图要回答的关键问题。
二.散布图的作图过程
第一步:
将需要研究是否有关系的两种数据收集30组或对(至少30对)以上,并一一对应地填入数据表:
切割机皮带速度如何影响切割长度的数据表
序号
皮带速度(cm/s)
切割长度(mm)
序号
皮带速度(cm/s)
切割长度(mm)
1
8.1
1046
26
8.0
1040
2
7.7
1030
27
5.5
1013
3
7.4
1039
28
6.9
1025
4
5.8
1027
29
7.0
1020
5
7.6
1028
30
7.5
1022
6
6.8
1025
31
6.7
1020
7
7.9
1035
32
8.1
1035
8
6.3
1015
33
9.0
1052
9
7.0
1038
34
7.1
1021
10
8.0
1036
35
7.6
1024
11
8.0
1026
36
8.5
1029
12
8.0
1041
37
7.5
1015
13
7.2
1029
38
8.0
1030
14
6.0
1010
39
5.2
1010
15
6.3
1020
40
6.5
1025
16
6.7
1024
41
8.0
1031
17
8.2
1034
42
6.9
1030
18
8.1
1036
43
7.6
1034
18
6.6
1023
44
6.5
1034
20
6.5
1011
45
5.5
1020
21
8.5
1030
46
6.0
1025
22
7.4
1014
47
5.5
1023
23
7.2
1030
48
7.6
1028
24
5.6
1016
49
8.6
1020
25
6.3
1020
50
6.3
1026
第二步:
在坐标纸上画出纵坐标轴Y和横坐标轴X,并找出X轴和Y轴的最大值和最小值,分别给予适当的标度(定);纵坐标越往上取值越大,横坐标越往右取值越大,横坐标上数据的最大值和最小值之间的宽度,应与纵坐标上数据的最大值和最小值之间的长度基本相等(不可相差太大),以便于分析相关关系。
若所分析的两种数据之间的关系是特性和原因的关系,则通常以X轴表示原因数据(或称为自变量),以Y轴表示特性数据(或称为因变量);若两种数据之间是两种特性的关系,或同一特性的两种原因之间关系,则通常以X轴表示较易测定的那种特性或原因的数据,以Y轴表示较难测定的特性或原因的数据。
第三步:
将一一对应的数据,用坐标点在图上表示出来(即描点)。
若有两组数据完全相同,则可用两重圈⊙表示;若有三组数据完全相同,可用三重圈◎表示或⊙3,依此类推。
第四步:
填入必要的项目:
图名、取样时间、取样方法、测定方法、测定仪器、观测者、环境条件、数据组数量、XY轴名称及单位等。
(以上為電腦繪圖)
三.散布图的观察分析(六种形式)注意:
研究相关关系必须包括相关性质(正相关、负相关)和相关程度(强相关、弱相关)两个方面。
(1).对照典型散布图例法(是散布图分析法中最粗略的分析法,只适用于较明显的相关关系的情况)
根据测量的两种数据作出散布图后,就可以从散布图上点子(云)的分布状况,看出这两种数据之间是否有相关关系,以及关系的密切程度。
散布图的基本形式有六种:
如果具有线性相关关系即
(1)、
(2)、(3)、(4),那就可以通过控制比较容易控制的因素,来达到控制难以控制的因素。
观察散布图时,应注意以下几种情况:
1.应观察是否有异常或离群的点出现,如图中有A点和B点就是两个异常点
2.散布图如果处理不当也会造成假像。
如上图左所示,若将X的范围只局限在中间的那一段,则在此范围内看,Y与X似乎并不相关,但从整体看,Y与X事实上相关关系还是比较密切的。
3.应注意必要的分层。
如上图右所示,从散布图上看Y与X之间的相关关系似乎很密切,但若仔细分析一下数据,发现这些数据原是来自三种不同的条件,或者说这些点子可以分成三个不同的层次A、B、C。
从每个层次中考虑,X与Y实际上并不相关。
对于这种情况,在作散布图时就应事先进行正确的分层处理。
否则可能做出错误的判断(这是因为在不分层时,有时从整体上看观察不到两因素间的相关性,但分层后却出现相关关系;反之,也可能在不正确的过细分层情况下看不出因素的相关性,而从整体上观察却存在相关关系。
4.数据太少(少于30组),易发生误判(故数据的收集,不得少于30组,50-100组最佳)。
5.要有适宜的取值范围。
作散布图时,应根据专业理论知识和实践工作经验,合理确定自变量的取值范围,否则也会导致错误的分析结论。
散布图的相关性规律的运用范围也必须限于观测值数据范围内,任意扩大相关判断范围将造成结论错误,当取值范围不同时,应再做相应的试验与分析。
6.通过散布图可以对变量间的相关趋势做出估计,但是由于缺乏客观的统一的判定标准,可靠性较差,还只能说是一种定性判断的方法。
为了提高判断的精度,在实际工作中,常采用相关系数检验法。
7.要注意坐标刻度。
在横坐标和纵坐标划分刻度时,应取恰当的比例。
可参考数据组中最大值、最小值和取值范围,让X和Y的极差长度大体相等,否则会造成对图形的视觉错误,影响分析结果的直观性。
(2).符号检验法(又称为象限判断法或简单象限法)——一种半定量的判断方法,可判定两组数据间是否是线性相关。
符号检验法是检查点子云的形态,以判断相关关系及其程度的一种定性分析方法。
(3).系数r判断法(见第二小节内容)。
四.散布图的作用:
1.可发现两组数据之间是相关或不相关的。
2.如相关可分析其相关的程度。
3.如相关可进一步用回归分析法找出两者之间的近似函数关系。
即在质量管理中,主要用于判断质量特性与某一变化因素之间,或两个因素之间存在的相关关系,进而确定改进产品质量的因素。
第二小节散布图相关系数的计算(相关系数判断法)
一.散布图与相关系数(r)
从散布图中可以大致地看出两个变量之间的关系。
为了表达两个变量之间相关关系的密切程度,即相关程度,需要用一个数量指标来表示,这个指标称为相关系数,通常用r表示。
它是一个大于或等于-1,小于或等于1的数。
即r满足:
-1≦r≦1不同的散布图有不同的相关系数;反之,不同的相关系数又有不同形式的散布图。
r值为正值时,称为正相关。
r值为负值时,称为负相关,即当两个变数中X值增大时,Y值的趋势是减小。
当∣r∣值=1时,称为完全相关,这是一种极端的情形,此时X与Y之间的相关程度最大,实际上这时X与Y之间已有确定的函数关系,散布图中的点子成一条严格的直线。
当r值为零时,这也是一种极端情况,此时X与Y之间完全无相关关系,此时称为X与Y不相关。
r值判断表
R值
两变量间的关系、判断
r=1
完全正相关
0<r≤1
正相关,越接近于1,越强
正相关,越接近于0,越弱
r=0
无线性相关,但可能有非线性相关关系,根据经验
-1≤r<0
负相关,越接近于-1,越强
负相关,越接近于0,越弱
r=-1
完全负相关
应注意:
相关系数r所表示的两个变量之间的相关是指线性相关。
因此,当r的绝对值很小甚至等于0时,并不表示X与Y之间就一定不存在任何关系。
如像图中(6)的情况,X与Y之间显然是有关系的,但是经过计算相关系数的结果却为0。
这是因为此时X与Y的关系是曲线关系,而不是线性关系造成的。
二.相关系数R的计算
相关系数的计算公式:
式中r——相关系数
=
——X变量的均值
=
——Y变量的均值
Lxy=
=
—
——x离差与y离差之积
Lxx=
=
—
——x离差的平方和
Lyy=
=
—
——y离差的平方和
在质量管理活动中,有时需要对两个变量的相关进行判断,首先根据数据进行计算相关系数,然后还要检讨计算得到的相关系数是否符合实际。
例如,数据量不足,就可能获得不符合实际的结论。
为此统计学家设计了相关系数检查表,可以轻松地把计算结果与表格进行对照,获得相应判断。
相关系数检查表的使用方法:
计算n组数据的相关系数,确定置信度α,根据n-2和α确定表格中的用以比较的系数,如果计算的相关系数的绝对值大于或等于表中数据,则可确认两个变量确实存在相关系数,否则不能说明两个变量之间确实存在相关关系。
相关系数检查表
n-2α
0.05
0.01
n-2α
0.05
0.01
1
0.997
2.000
21
0.413
0.526
2
0.950
0.990
22
0.404
0.515
3
0.878
0.959
23
0.396
0.505
4
0.811
0.917
24
0.388
0.496
5
0.754
0.874
25
0.381
0.487
6
0.707
0.834
26
0.374
0.478
7
0.666
0.798
27
0.367
0.470
8
0.632
0.765
28
0.361
0.463
9
0.602
0.735
29
0.355
0.456
10
0.576
0.708
30
0.349
0.449
11
0.553
0.684
35
0.325
0.418
12
0.532
0.661
40
0.304
0.393
13
0.514
0.641
45
0.288
0.372
14
0.497
0.623
50
0.273
0.354
15
0.482
0.606
60
0.250
0.325
16
0.468
0.590
70
0.232
0.303
17
0.458
0.575
80
0.217
0.283
18
0.444
0.561
90
0.205
0.267
19
0.433
0.549
100
0.195
0.254
20
0.423
0.537
200
0.138
0.181
思考题(作业题):
1.置物架网片在平面焊接时,龙门焊机的电流与平面网的焊接强度(或脱焊)是有关系的,龙门焊机的电流与平面网的熔接毛剌亦是有关系的,请虚心请教平面焊技术员,收集50组不同的数据,绘制散布图,找出电流与脱焊的相关关系?
电流与毛刺的相关关系?
2.下表是某种钢的碳含量X(%)与抗拉强度Y(kg/mm2)R数据:
序号
X(%)
Y(kg/mm2)
序号
X(%)
Y(kg/mm2)
序号
X(%)
Y(kg/mm2)
1
2.0
43
11
2.0
42
21
2.3
45
2
2.4
46
12
2.2
44
22
2.2
43
3
2.2
45
13
2.6
47
23
2.3
46
4
2.3
44
14
2.1
44
24
2.4
47
5
2.5
45
15
2.5
46
25
2.3
44
6
2.8
48
16
2.7
47
26
2.4
45
7
2.2
43
17
2.1
42
27
2.6
46
8
2.7
47
18
2.6
48
28
2.5
42
9
2.4
44
19
2.4
45
29
2.6
46
10
2.3
45
20
2.1
43
30
2.4
46
1绘制散布图,并判断Y与X的相关关系。
2计算相关系数r。
3有没有离群的点,若有是什么原因造成的?
又该怎么处理?
3.下表是在一群人中随机测得的人的体重与人的身高的40组数据:
序号
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
身高
152
160
160
155
160
165
165
157
156
177
172
169
169
166
155
164
164
158
161
173
体重
40
56
50
45
45
50
57
48
43
70
57
60
63
48
44
58
54
54
54
55
序号
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
身高
165
168
175
168
170
174
182
181
177
174
152
163
166
156
158
153
158
170
158
162
体重
58
63
65
55
65
64
70
73
65
62
42
53
58
53
48
42
44
62
52
98
1绘制散布图,并判断身高与体重之间的是一种什么样的相关关系。
2计算相关系数r。
3有没有离群的点,若有是什么原因造成的?
又该怎么处理?
解:
①散布图,正相关;
②
=0.6705
③有离群的点,特殊情况造成,剔除离群的点,重新绘制散布图并重新计算相关系数r。
要想了解更多有关质量管理方面的知识,请在XX输入“energies8”。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新 QC 七大 手法 散布
![提示](https://static.bdocx.com/images/bang_tan.gif)