第4章 概率与概率分布.docx
- 文档编号:12055097
- 上传时间:2023-04-16
- 格式:DOCX
- 页数:13
- 大小:24.04KB
第4章 概率与概率分布.docx
《第4章 概率与概率分布.docx》由会员分享,可在线阅读,更多相关《第4章 概率与概率分布.docx(13页珍藏版)》请在冰豆网上搜索。
第4章概率与概率分布
第4章概率与概率分布
本章的主要目的:
⏹掌握随机事件的含义、事件的概率计算方法及其运算法则;
⏹掌握随机变量的含义及正态分布、二项分布、泊松分布的特性及应用。
⏹了解大数定律及中心极限定理的含义。
4.1概率基础
这节主要内容是随机事件、概率的含义、概率的运算规则等。
有人说:
如果一艘船即将沉没,一个著名的规则就是,救生艇会先载满妇女和小孩。
我们先看在1912年4月15日(星期一)沉没的泰坦尼克号上的死亡人数表,这条规则是否被遵守?
男人
妇女
男孩
女孩
总计
幸存
332
318
29
27
706
死亡
1360
104
35
18
1517
总计
1692
422
64
45
2223
从本章起,我们将用样本数据来对总体做一些推论(或结论)。
那些推论中有很多将在事件概率的基础上得到。
统计学家一般这样认为:
如果某种解释基于非常小的概率,他们就拒绝这种解释,小概率事件法。
1.随机事件
我们的现实生活中有两类不同的现象:
确定性现象和随机现象。
随机现象是指在一定条件下可能发生也可能不发生的现象。
随机现象通过大量的观察会发现其有明显的统计规律性,这个观察的过程叫试验,试验有三个条件:
试验可以在相同条件下重复进行;试验的所有可能结果是明确可知的;每次试验之前不能肯定哪一个结果会出现。
随机试验的每一个可能的结果称为随机事件,简称事件;若一个事件不可能再分解为更简单成分的结果或事件,就称之为基本事件或简单事件(样本点);基本事件的全体(全集)称为样本空间Ω;由某些基本事件组合而成的事件(子集)称为复合事件。
必然事件和不可能事件不是随机事件,但可以作为随机事件的两个极端情形来处理。
实例一:
掷骰子观察点数的试验。
掷一个骰子和两个骰子。
2.随机事件的关系和运算
随机事件之间通常有一定的联系。
⑴事件的包含与相等。
若事件A发生必然导致事件B发生,则称事件B包含事件。
⑵事件的并(和)。
事件A与事件B至少有一个发生。
A+B或A∪B。
⑶事件的交(积)。
事件A与事件B同时发生。
AB或A∩B
⑷事件的差。
事件A发生而事件B不发生。
A-B。
⑸互不相容(互斥)事件。
事件A和事件B不能同时发生。
AB=φ。
⑹补(逆、对立)事件。
样本空间中所有不属于事件A的样本点组成的事件。
实例二:
抽零件。
3.事件的概率
随机事件发生可能性大小的数值称为随机事件的概率。
我们将学习三种定义概率的方法。
⏹概率的古典定义。
假设一个已知过程包括n种不同的基本事件,那些基本事件中的某一个发生的可能性都是相同的。
如果在这n种方式中有m种是属于事件A的,那么P(A)=m/n。
这里要强调指出两个共同的特点:
有限基本事件(可能结果n);各结果出现的可能性相同。
实例三:
书中例4-1;例行4-2。
⏹概率的统计定义:
相对频数近似。
对一个过程观察许多次,计算出事件A实际发生的次数。
基于这些实际结果,P(A)可按公式“P(A)=A发生的次数/试验重复的次数”来估计。
大数法则告诉我们当观测的次数增加时,相应的估计就趋近于精确的概率。
当一个过程一次又一次地重复时,一个事件的相对频数概率就趋近于实际概率。
也就是说只有很少试验的概率估计可能与真实数值背道而驰,但如果基于很多的试验,估计就会更精确。
⏹概率的主观定义。
人们根据自己的经验和所掌握的有关信息,对事件发生的可能性大小给以主观的估计。
如教师对学生考取大学的判断;计算一个随机选择的人在今年将被闪电击中的概率。
4.概率的性质
任何事件数学上的概率都是0、1或位于0与1之间的一个数字。
建议:
当表达一个概率值时,要么给出一个确切的分数或小数,要么将最终十进制的结果四舍五入到3位有效数字。
概率有如下性质:
⏹对任一随机事件A,有0≤P(A)≤1;
⏹一个不可能事件的概率为0;
⏹一个必然事件的概率为1;
⏹对于两两个互斥的随机事件Ai(i=1,2,…),则有P(A1+A2+…)=P(A1)+P(A2)+…。
要理解,一个概率接近于0的值反映的是那些非常不可能的事件,而那些接近于1的值反映的是非常有可能发生的事。
5.概率的运算法则
⏹概率的加法公式。
对任意两个随机事件A、B,有
P(A+B)=P(A)+P(B)–P(AB)
要计算事件A发生或事件B发生的概率时,计算A能够发生的所有方式的个数和B能够发生的所有方式的个数,但没有结果被计算多次。
文氏图显示。
实例四:
书中例4-3;例4-4。
课堂练习一:
假设从2223名登上泰坦尼克号的乘客中随机地选出一人,请计算P(选出了一个男人或一个男孩);P(选出了一个男人或一个幸存者)。
⏹概率的乘法公式。
对任意两个随机事件A、B,有
P(AB)=P(A)P(B︱A)
这里P(B︱A)是条件概率,指在事件A已经发生的条件下事件B发生的概率。
两个事件A和B,如果一个的发生不影响另一个的发生概率,就称这两个事件是独立的,也就意味着P(B)=P(B︱A)或P(A)=P(A︱B);否则就是非独立的。
实例五:
书例4-5;例4-6。
一般地,独立事件的任何一种次序的概率就是其对应的概率的简单乘积。
这里注意“有放回和无放回”的区别。
但有一个一般性的指导原则:
“如果一个样本的容量没有超过总体容量的5%,就将选择看作是独立的(即使选择是没有放回的,从技术上讲选择是非独立的)。
”
课堂练习二:
如果从泰坦尼克号2223人中随机选择1人,已知是一个男人,这个人是幸存者的概率是多少?
已知是一个幸存者,这个人是男人的概率又是多少?
课堂练习三一个质量控制经理声称一种新的数字相机加工程序更好,因为次品率低于过去的次品率5%。
加工1000个数字相机,其中12个随机选出做检测,结果是没有次品。
假设新方法的次品率和过去一样,都是5%,计算这12个数字相机没有次品的概率。
基于这个结果,是否有强大的证据说明,新程序更好?
⏹全概率公式与贝叶斯公式。
对于一些复杂事件,单独用加法公式或乘法公式还不能计算其概率,为此可以反它分解为若干互斥的基本事件。
实例六:
请先看例4-8。
全概率公式:
设事件Ai(i=1,2,…,n)两两互斥,且∑Ai=Ω,则
P(B)=∑P(Ai)P(B|Ai)。
贝叶斯公式:
P(Ai|B)=P(AiB)/P(B)
实例七:
例4-9;例4-10。
4.2随机变量及离散概率分布
1.随机变量及概率分布
这一节我们讨论随机变量及其概率分布,概率分布描述的是什么将可能发生,而不是什么已经实际发生了。
一个随机变量是指这样的一个变量,对于过程中的每个结果(事件),都有一个由可能性决定的惟一的数值。
一个概率分布是指表示随机变量每个值的图、表或公式。
实例八:
一项研究的内容是,随机选择4个新生儿,看女孩有多少个。
如果我们假设男孩和女孩是等可能的,并且令x=14个孩子中女孩的个数,那么x就是一个随机变量,因为它的取值取决于可能性。
X的可能性取值有0,1,2,…,14。
下表列出了x的值以及相应的概率。
这个表也就描述了一个概率分布。
X(女孩)
P(x)
X(女孩)
P(x)
X(女孩)
P(x)
0
0.000
5
0.122
10
0.061
1
0.001
6
0.183
11
0.022
2
0.006
7
0.209
12
0.006
3
0.022
8
0.183
13
0.001
4
0.061
9
0.122
14
0.000
按取值特点不同,随机变量可分为离散随机变量和连续随机变量。
一个离散随机变量是指数量值有限,或可数的随机变量;一个连续随机变量有无限多的数值,这些数值能够和一种连续刻度的度量联系起来,这种刻度没有缝隙或间断。
每一个概率分布必须满足下面两个必要条件:
⏹ΣP(x)=1其中x表示所有可能的取值。
⏹0≤P(x)≤1对于x的每个值。
分布函数F(m)描述的是x取值不超过m的的情况上的累积概率,即
F(m)=P(x≤m)=ΣP(x)
2.数学期望和方差
常用的随机变量的数字特征有数学期望、方差和标准差。
数学期望就是随机变量的平均值,是所有随机变量所有可能取值的平均水平,E(x)或μ。
随机变量的方差是随机变量的各可能取值偏离其均值的离差平方的均值,D(x)或σ2。
E(x)=μ=∑xP(x)
D(x)=σ2=∑[(x-μ)2P(x)]
实际上,一个概率分布就是一个理论上完美的总体频数分布。
课堂练习四:
在实例八中我们描述了14个随机选择的新生儿中女孩数量的概率分布,请计算女孩数量的均值、标准差,并用这些结果来计算最大正常值和最小正常值。
?
在14个新生儿中若有13个女孩是正常的吗?
根据课堂练习四的结果,我们发现13是异常的!
我们可用另一种方法来说明,如果P(13或更多的女孩)非常小,那么14个新生儿中有13个女孩就是异常的。
P(13或更多的女孩)=P(13)+P(14)=0.001
因为0.001这个数好小,所以我们认为,在14个新生儿中有13个女孩是异常的。
也就是在14个新生儿中有13个女孩这样的结果偶然发生是非常不可能的。
一般地,使用概率来确定结果是否是异常的
⏹如果P(x或更多)很小(如小于0.05),n次试验中有x次成功就是异常的高;
⏹如果P(x或更少)很小(如小于0.05),n次试验中有x次成功就是异常的低。
3.二项概率分布
简称二项分布,它能帮助我们处理结果为两种相关类型的问题。
二项分布来自于满足下列必要条件的过程:
⏹这个过程包括一个固定次数n的试验。
⏹试验必须是独立的,即每次试验结果不受其他各次试验结果的影响。
⏹每次试验的结果都可分为两类,“成功”或“失败”。
⏹每次试验中的概率必须是常数。
“成功”概率为p,则“失败”概率为q=1-p。
实例九:
某电信公司声称,当用户给查号台打电话查询电话号码时,90%的情况下会得到正确的电话号码。
假设回答的正确率为90%,假如我们想计算在5次询问中有3次回答正确的概率。
这个过程是二项分布吗?
如果这个过程的结果是二项分布,请说明n、k、p和q的值。
二项分布也称贝努里分布,其计算我们可用三种方法:
⏹公式法。
⏹查表法。
⏹软件工具法。
E(x)=μ=np
D(x)=σ2=npq
二项分布最可能“成功”的次数(众数k),即P(k)为最大,为(n+1)p=k为整数时,最可能成功的次数有两个即k和k-1;当(n+1)p不为整数时,最可能成功的次数是k=[(n+1)p],
实例十:
书中例4-11。
4.泊松分布
泊松分布经常作为一个数学模型来描述这样一些问题:
一个队伍里到来的排队者;一个加油站到来的汽车;一个饭店里到来的就餐者;一个书店到来的学生;以及一个网站到来的因特网用户等。
泊松分布是一种离散概率分布,应用于一个区间内某一事件的发生。
随机变量x是这个事件在此区间内发生的次数。
这个区间可以是时间、距离、面积、体积或其他类似单位。
事件在一个区间内发生了k次的概率可用公式
P(λ)=λke-λ/k!
λ>0
泊松分布服从下列条件:
⏹随机变量k是一个事件在某区间内发生的次数。
⏹事件的发生必须是随机的。
⏹事件的发生必须是相互独立的。
⏹在所有的区间内,事件的发生必须是统一的分布。
泊松分布的最可能值:
当λ为整数时最可能值有两个x=λ或x=λ-1;当λ不是整数时,x=[λ]。
E(x)=μ=λ
D(x)=σ2=λ
泊松分布可以作为二项颁布的近似,一般要求n≥20,p≤0.25。
实例十一:
书中例4-12;例4-13。
课堂练习五:
在对二战期间的V-1飞弹击中地区的分析中,伦敦南部被分割为576个小区域,每个小区域的面积为0.25km2,一共有535枚炸弹击中了由这576个小区域组成的地区。
如果随机选择一个小区域,计算它恰好被击中2次的概率。
4.3正态概率分布
1.概率密度与分布函数
由于连续随机变量的取值不能一一列举,其概率分布就不能象离散随机变量那样用点的概率表示,只能用数字的函数形式来描述。
对于任意连续随机变量,任何一个精确值的概率都是0,因此也就有P(a≤x≤b)=P(a P(a≤x≤b)=P(a 这里f(x)就是概率密度函数。 密度曲线下的面积总和为1,其面积与概率之间有一种对应关系。 分布函数F(a)=P(x≤a)=∫-∞bf(x)dx 分布函数具有如下性质: P71: 1-4。 数学期望与方差计算公式。 2.标准正态分布 如果一个连续随机变量的分布的图形是对称的,并且是钟形的,我们就称之为正态分布。 正态分布之所以重要,一是因为许多随机现象服从或近似服从正态分布,其最大特点是与均值较接近的数值出现的次数较多,离均值远的数值出现的次数较少,即属于“中间大、两头小”的分布形态;二是它特有的数学特性。 正态分布的数学公式好复杂,实际上我们只需关心两个参数: μ和σ。 标准正态分布就是μ=0,σ=1的正态概率分布。 ⏹已知z值时计算概率。 我们可利用书附表3的标准正态颁布表数据来得到概率。 课堂练习六: 分别计算以下概率: ⑴P(0≤z≤1.58) ⑵P(-2.43≤z≤0) ⑶P(z≥1.27) ⑷P(1.20≤z≤2.30) ⑸P(x≤1.33) ⑹P(x≤-1.33) 注意: 要记住z=1,2,3,1.96时的对应概率值! ⏹已知概率时计算z值。 我们可利用书附表3的标准正态颁布表数据来得到。 课堂练习七: 设z的值服从标准正态分布: ⑴如果P(0≤z≤a)=0.3907,计算a。 ⑵如果P(-b≤z≤b)=0.8664,计算b。 ⑶如果P(z≥c)=0.0643,计算c。 ⑷如果P(z≥d)=0.9922,计算d。 ⑸如果P(z≤e)=0.4500,计算e。 3.正态分布 我们只需用z值公式将数值转化成标准值,则所有的正态分布的概率求法就与标准正态分布一样。 具体来说有以下步骤: ⏹画一个正态曲线,标出均值和一个特定的x值,然后用阴影表示要计算概率的区域。 ⏹对于作为一个阴影区域边界的任何一个相应的x值,求出其z值。 ⏹查标准正态分布表来计算阴影区域的面积,这个面积就是要计算的概率。 实例十二: 女性的体重服从均值为143磅、标准差为29磅的正态分布。 ⑴如果随机选择一个妇女,她的体重在143磅和201磅之间的概率是多少? ⑵有多少比例的妇女体重在100磅和130磅之间? 我们现在转向另一种情况,在女性的体重正态分布中,请计算将最高的10%和其他值分开的体重数值? 在这种已知概率(或百分比)来计算一个特定的数值问题中,一般遵循以下步骤: ⏹画一个正态分布的草图,在图中相应比例的区域上写下已知的概率值或百分比,找出想要求的x值。 ⏹使用标准正态表来计算对应于以x值和中轴线0为界线的区域的z值。 从表中查出最接近的面积,找出相应的z值,若z值位于中轴线左侧,则令其为负。 ⏹按公式x=μ+zσ求得x。 实例十三: 在上述妇女体重正态分布中,计算P10的值,即计算将最低的10%和最高的90%分开的体重值。 课堂练习八: 假设一名健康成年人的体温服从均值36.3℃,标准差为0.45℃的正态分布。 如果一位医学研究员想要研究体温最低的2.5%和体温最高的2.5%的人,求将这些界限分开的体温。 4.4中心极限定理 中心极限定理是统计学中最重要和最有用的概念之一,是总体估计和假设检验的基础。 我们的重点在概念的理解和应用上。 1.中心极限定理 一般地,任何一个统计量的抽样分布都是指这个统计量的概率分布。 均值的抽样分布是指样本均值的概率分布,其中所有的样本都有相同的样本容量n。 实例十四: 考虑由数字0,1,2,3,4,5,6,7,8,9组成的总体,从中进行有放回的随机选择。 ⑴随机变量: 如果我们做的试验是随机选择一个单独的数字,将选出的数字的数值用x表示,则x就是一个随机变量。 ⑵概率分布: 假设数字是随机选择的,每个数字被选择的概率都是1/10,这可以用公式P(x)=1/10来表示。 这是一个概率分布。 ⑶抽样分布: 现在假设我们随机选择了很多不同的样本,每个样本的容量都是4。 在每个样本中,计算样本的均值x¯(这个也是一个随机变量,它的值也依赖于取值的概率)。 样本均值x¯的概率分布就是一个抽样分布。 中心极限定理 已知: 随机变量x服从一个均值为μ、标准差为σ的分布(是否是正态分布都可以),所有具有相同容量n的样本都是从一个包含x个数值的总体中随机选出的(这样选择样本就使得所有容量为n的可能样本被选出的机会都是相同的)。 结论: 随着样本容量的增加,样本均值x¯将趋近于一个正态分布;样本均值的均值将趋近于总体均值μ;样本均值的标准差将趋于σ/n½。 通常使用的应用法则: ⏹对于容量n大于30的样本,样本均值的分布可以较好地用一个正态分布近似。 样本容量n越大,近似的效果越好。 ⏹如果原始总体自身就是正态分布的,则对于任意样本容量n(不只是大于30的n),样本均值都将是正态分布的。 统计学中令人着迷的现象: 通过从任意分布中进行抽样,我们就可以创造一个正态分布,或至少一个近似正态分布。 如果你有兴趣,你可以对实例十四进行检验。 实例十五: 妇女体重的正态分布中,计算下列概率: ⑴如果随机选择一名妇女,她的体重超过150磅的概率;⑵如果随机选择36名不同的妇女,她们的平均体重超过150磅的概率。 课堂练习九: 健康成年人体温分布中,如果随机选择一个容量n=106的样本,计算其均值为36.1℃或更低的概率。 2.正态分布作为二项分布的近似 如果np≥5并且nq≥5,则二项随机变量服从近似的正态分布,其均值和方差是μ=np和σ2=npq。 实例十六: 大约有4.4%的致命的汽车碰撞事件都是由于漏气车胎造成的。 如果在一项高速公路安全方面的研究中,随机地选择了750例致命的汽车碰撞事件,估计恰好有35例是由漏气车胎造成的概率。 要注意的是: 当我们使用正态分布作为二项分布的一个近似时,我们的最终目的并不是简单地计算概率值。 我们经常需要在概率值的基础上做一些判断,因此我们应该理解低的概率对应于非常不可能发生的事件,而高的概率则对应于很可能发生的事件。 概率值0.05经常用来作为区分不可能事件和可能事件之间的分界线。 当使用0.05作为分界线时,小概率事件法则可以表述如下: 在已知假设下,如果某一特定的观测结果的概率为0.05或更小,我们就认为这个假设可能是不正确的。 作业 ⑴P78--79页的全部习题要求自己独立完成。 ⑵预习第五章。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第4章 概率与概率分布 概率 分布