概率统计.docx
- 文档编号:7102721
- 上传时间:2023-01-17
- 格式:DOCX
- 页数:14
- 大小:119.30KB
概率统计.docx
《概率统计.docx》由会员分享,可在线阅读,更多相关《概率统计.docx(14页珍藏版)》请在冰豆网上搜索。
概率统计
课题一
统计过程控制中的概率统计
概率
●什么叫概率?
要理解抽样,必须透彻理解概率论的基本知识:
如果事件必然发生(100%确定),我们说 概率=1.0,
如果事件有一半的可能性发生,则 概率=0.5,
如果事件不可能发生,则概率=0。
例:
我们抛硬币:
☺得到正面的概率为0.5,
☺得到反面的概率为0.5,
☺得到正面和反面的概率为1.0。
●加法原则:
✉假如我们将一批水果混合,其中
60%的是橙子,
25%的是苹果,
15%的是香蕉。
✉如果我们从中抽取一个样本:
Ø是橙子的概率为0.6(或60%)
Ø是橙子或苹果的概率为0.85(或85%)
Ø是橙子或香蕉的概率为0.75(或75%)
Ø是苹果或香蕉的概率为0.4(或40%)
Ø是橙子或苹果或香蕉的概率为1.0(或100%)
概率之和将等于1.0
●乘法原则:
假如一批产品的废品率为30%,从中抽取2个样品:
Ø第一个为废品的概率为0.3,
Ø第二个为废品的概率为0.3,
Ø二个都为废品的概率为(0.3×0.3)=0.09。
✧在有两个或多个事件可能发生的情况下要知道几个事件同时发生的概率,可将每个事件单独发生的概率相乘得出。
因此
✧对各事件分别发生的情形,可用加法原则,
✧对各事件一起发生的情形,可作乘法原则。
不连续的概率分布
●二项分布
假如从不合格率为20%的总体中抽取2个样品:
✉抽取一个不合格品后再抽取一个为不合格品的概率为
0.2×0.2=0.04
✉抽取一个合格品后再抽取一个为不合格品的概率为
0.8×0.2=0.16
✉抽取一个不合格品后再抽取一个为合格品的概率为
0.2×0.8=0.16
✉抽取一个合格品后再抽取一个为合格品的概率为
0.8×0.8=0.64
这样所有概率的总和为1
现在假设批不合格率为p、合格率为q、样本量n=2,我们得到一个普遍规律:
✉抽取一个不合格品后再抽取一个为不合格品的概率为
✉抽取一个合格品后再抽取一个为不合格品的概率为
✉抽取一个不合格品后再抽取一个为合格品的概率为
✉抽取一个合格品后再抽取一个为合格品的概率为
总概率
如果样本大小为n,相应地其总概率为
不连续的概率分布
●二项分布
⍓二项定理
在一个不合格率为p、合格率为q、样本容量为10的样本中确定不合格数为某一特定数目的概率,我们必须将
作如下展开:
按照上式如果批不合格率为20%,则p=0.2、q=0.8,上式的第一项告诉我们10个样品都合格的概率为:
对于10个样品中2个不合格、8个合格的概率为:
不连续的概率分布
●二项分布
利用二项式定理将二项式展开得到二项分布,我们可以计算不合格率为p的样本中不合格数为r的概率分布的一般表达式:
感叹号表示阶乘,其含义是一个数与比它小的数相乘,一直乘到1为止,例如5的阶乘为5!
=5×4×3×2×1=120。
假设交验批不合格率为0.2,从中抽取10个样品,不合格数刚好为2的概率为:
与前面所述相同
⍓二项分布的特点与应用:
设样本量为n、交验批不合格率为p,则不合格品数为r的概率为:
其均值为:
np
方差为:
np(1-P)
⍓适用对象:
适用于n次还原抽样的计件值型抽样检验。
不连续的概率分布
●泊松分布
当样本量n很大时,
的展开式很庞大。
只要交验批的不合格率p≤10%,样本容量n≥10,我们通常用泊松分布来替代二项分布。
按照泊松分布,容量为n的样本中不合格数为r的概率通常为:
表示e的np次方,其结果可从数学用表中查得。
“np”通常指不合格数的期望值,并用“m”表示,其方差σ2也为np。
因此,如果我们从不合格率为5%的总体中抽取一个容量n为200的样本,我们期望样本的不合格率(数)为5%(或10个):
如果我们想知道实际不合格数为8的概率,我们可用上述公式计算:
样本中不合格数
的概率为:
应用:
n较大、p≤0.1、np≤4时的计点值型抽样检验。
不连续的概率分布
●泊松分布
泊松分布表:
表一:
np
x
0.2
0.3
0.4
0.5
0.6
0.7
0
1.0000000
1.0000000
1.0000000
1.000000
1.000000
1.000000
1
0.1812692
0.2591818
0.3296800
0.393469
0.451188
0.503415
2
0.0175231
0.0369363
0.0615519
0.393469
0.121901
0.155805
3
0.0011485
0.0035995
0.0079263
0.014388
0.023115
0.03414
4
0.0000568
0.0002658
0.0007763
0.001752
0.003358
0.005753
5
0.0000023
0.0000158
0.0000612
0.00172
0.000394
0.000786
6
0.0000008
0.0000040
0.000014
0.000039
0.000090
7
0.0000002
0.000001
0.000003
0.000009
8
0.000001
表二:
np
x
0.8
0.9
1.0
1.2
1.4
1.6
1.8
0
1.000000
1.000000
1.000000
1.000000
1.000000
1.000000
1.000000
1
0.550671
0.593430
0.632121
0.698806
0.753403
0.798103
0.834701
2
0.191208
0.227518
0.264241
0.337373
0.408167
0.475069
0.537163
3
0.047423
0.062857
0.080301
0.120513
0.166502
0.216642
0.269379
4
0.009080
0.013459
0.018988
0.033769
0.053725
0.078813
0.108708
5
0.001411
0.002344
0.003660
0.007746
0.014253
0.023682
0.036407
6
0.000184
0.000343
0.000594
0.001500
0.003201
0.006040
0.010378
7
0.000021
0.000043
0.000083
0.000251
0.000622
0.001336
0.002569
8
0.000002
0.000005
0.000010
0.000037
0.000107
0.000260
0.000562
9
0.000001
0.000005
0.000016
0.000045
0.000110
10
0.000001
0.000002
0.000007
0.000019
11
0.000001
0.000003
不连续的概率分布
●泊松分布
泊松分布表:
表三:
np
x
2.5
3.0
3.5
4.0
4.5
5.0
0
1.000000
1.000000
1.000000
1.000000
1.000000
1.000000
1
0.917915
0.950213
0.969803
0.981684
0.988891
0.993262
2
0.712703
0.800852
0.864112
0.908422
0.938901
0.959572
3
0.456187
0.576810
0.679153
0.761897
0.826422
0.875348
4
0.242424
0.352768
0.463367
0.566530
0.657704
0.734974
5
0.108822
0.184737
0.274555
0.371163
0.467896
0.559507
6
0.042021
0.083918
0.142386
0.214870
0.297070
0.384039
7
0.014187
0.033509
0.065288
0.110674
0.168949
0.237817
8
0.004247
0.011905
0.026739
0.051134
0.086586
0.133372
9
0.001140
0.003803
0.009874
0.021363
0.040257
0.068094
10
0.000277
0.001102
0.003315
0.008132
0.017093
0.031828
11
0.000062
0.000292
0.001019
0.002840
0.006669
0.013695
12
0.000013
0.000071
0.000289
0.000915
0.002404
0.005453
13
0.000002
0.000016
0.000076
0.000274
0.000805
0.002019
14
0.000003
0.000019
0.000076
0.000252
0.000698
15
0.000001
0.000004
0.000020
0.000074
0.000226
16
0.000001
0.000005
0.000020
0.000069
17
0.000001
0.000005
0.000020
18
0.000001
0.000005
19
0.000001
连续分布−正态分布
统计参数
●均值
n个数的平均值是n个数的总和被n除。
X的均值的标注方法是在X上放一横杠,即
。
公式:
或:
例如:
5,3,4,3,4,5
结果:
●中值
如果你按升序排列数据,中值就是一组数的中间的值。
例如,你有21个数据按升序排列,那第11个数据是中值。
如果你有22个数据(偶数个),则应以第11和第12个的均值作为中值。
例如:
确定以下8个数的中值:
5,6,3,5,2,7,6,8
把这8个数据按升序排列得:
2,3,5,5,6,6,7,8
第4、5个数的均值是5.5,
所以中值是5.5。
正态分布
统计参数
●频数
频数是某个数在一组数据中出现的次数。
例如:
6,3,4,5,6,2,7,6,5,6
按升序排列,看哪些数据重复次数最多:
2,3,4,5,5,6,6,6,6,7
结果:
6的频数为4。
●频率直方图
直方图以图形的方式描述数据的分布。
数据被划分为几组,描成图形的方式。
数据值:
45,39,72,48,91,63,85,17,5,9,12,23,72,18,15,36,35,11,29,77,93,61,16,27,55,
分布范围 中值 频数
1–20108
21–40306
41–60503
61–80704
81–100904
8
7
6
5
4
3
2
1
0
1030507090
频率直方图
正态分布
统计参数
●方差
方差反映数据结果分布的密集程度。
对工序而言,它能反映其加工精度。
O公式:
O例如:
取一个小样本:
5,6,7,8,9
以上数据的均值是7。
5
7
-2
+4
6
7
-1
+1
7
7
0
0
8
7
+1
+1
9
7
+2
+4
n=5,因而,
O为什么我们用(n-1),而不是简单地用n呢?
✍对于样本较小时,分母用n,会使方差的计算值偏小
✍用(n-1)会弥补这一点,且能让估计值更精确。
✍随样本量的增大,(n-1)的影响会减弱。
正态分布
连续分布
直方图(小样本)直方图(大样本)
Ø左边的直方图给出了一个分布轮廓,但由于样本量太小,并不精确。
Ø当样本量增加时,其形状更为明显。
Ø我们可以进一步增加样本量,但这并不必要,因这时曲线可以画了,曲线底下的面积也可以计算了。
任何追加的数据只是保持现有曲线的连续性。
-5-4-3-2-1012345
Ø正态分布的曲线有非常独特的形状。
Ø这意味着我们并不一定非要通过直方图来得出曲线的形状—我们已经知道了(曲线的)轮廓,但并不知其具体的大小。
Ø曲线的形状由一个(我们并不需要知道的)公式来定义。
正态分布
连续分布
我们可以通过计算曲线下的面积来确定连续分布中的概率值。
例如:
数据值在0和-1之间概率的可用曲线下的阴影部分的面积来表示,即阴影部分的面积占曲线下总面积的比例值,这个值将近为34%。
因此,数据值在0和-1之间概率值近似为34%。
正态分布的值已被制为正态分布表,给出了特定曲线左边面积值。
Z-5-4-3-2-1012345
−Z
表中一些值为:
Z
-3
-2
-1
0
1
2
3
面积
0.0013
0.0228
0.1587
0.5000
0.8413
0.9772
0.9987
由于阴影部分的面积为15.87%。
则数据值在0到-1之间的概率(面积)为:
0.5000–0.1587=0.3413
或34%
正态分布
连续分布
课本中的表都非常相似,这些表都是基于均值为0、方差为1的正态分布,即标准正态分布。
我们使用以下公式:
12
18
24
30
36
42
48
56
62
68
72
上例中=42和=6,数据值不大于36的概率:
查表可知,数据值不大于36的概率即曲线下方小于-1倍的标准差的区域的面积约为15.87%,
数据值在42和36之间的概率(比例)为:
0.5000–0.1587=0.3413(34%)
例2:
数据值小于30的概率(比例)为:
2=2.28%
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率 统计