第4章 常见概率分布.docx
- 文档编号:6892680
- 上传时间:2023-01-12
- 格式:DOCX
- 页数:15
- 大小:24.59KB
第4章 常见概率分布.docx
《第4章 常见概率分布.docx》由会员分享,可在线阅读,更多相关《第4章 常见概率分布.docx(15页珍藏版)》请在冰豆网上搜索。
第4章常见概率分布
第四章常用概率分布
一、二项分布的概念和特征
概念
分布:
随机变量的取值规律分布函数:
描述分布的规律
变量类型
连续型变量
离散型变量如:
正态分布
如:
二项分布,泊松分布
思考
例1.假设有5只实验小白鼠,要求它们同种属、同性别、体重相近,且给小白鼠注射一定剂量的毒物时,他们有相同的死亡率80%,存活率为20%。
那么这5只小白鼠实验后全部死亡的概率是多少?
有一只白小鼠存活的概率是多少?
2只小白鼠存活的概率是多少?
例1.假设有5只实验小白鼠,要求它们同种属、同性别、体重相近,且给小白鼠注射一定剂量的毒物时,他们有相同的死亡率80%,存活率为20%。
那么这5只小白鼠实验后全部死亡的概率是多少?
有一只白小鼠存活的概率是多少?
2只小白鼠存活的概率是多少?
P死
=0.8P活
=0.2P1
=0.8×0.8×0.8×0.8×0.8P2=P3=15
C25
C0.2×0.84=0.0820.22×0.83=0.020=0.85=0.328
该实验有三个特点:
1.各次实验是彼此独立的;
2.每次实验只有二种可能的结果,或死亡或生存;
3.每次实验小白鼠死亡和生存的概率是固定的。
具备以上三点,即从阳性率为π的总体中随机抽取大小为n的样本,则出现“阳性”数为X的概率分布即呈现二项分布,记作B(n,p。
概率分布函数
二项分布的概率函数P(X可用公式
XnXX
n
CXP--=1((pp其中!
(!
!
XnXnCX
n-=对于任何二项分布,总有(1
=å=n
XXP
例2.临床上用针灸治疗某型头疼,有效的概率为60%,现以该疗法治疗3例,其中2例有效的概率是多大?
分析:
治疗结果为有限和无效两类,每个患者是否有效不受其他病例的影响,有效概率均为0.6,符合二项分布的条件。
XnXX
n
CXP--=1((pp((432.06.016.0!
2
3!
2!
31(2322322
32(==--=ppCP因此,2例有效的概率是0.432。
二项分布的特征
B(n,p
n=3,π=0.5n=10,π=0.5
π=0.3时,不同n值对应的二项分布
二项分布的特征
1.n,π是二项分布的两个参数,所以二项分布的形状取决于n,π。
2.当π=0.5时分布对称,近似对称分布。
3.当π≠0.5时,分布呈偏态,特别是n较小时,π偏离0.5越远,分布的对称性越差,但只要不接近1和0时,随着n的增大,分布逐渐逼近正态。
4.当π或1π不太小,而n足够大,通常nπ和n(1π均大于或等于5,我们常用正态近似的原理来处理二项分布的问题。
例3.临床上用针灸治疗某型头痛,有效的概率为60%,现以该疗法治疗3例,求有效人数的均数和方差。
二项分布的均数和标准差
分析:
n=3,p=0.6
0123
0.0640.2880.4320.216根据总体均数(又称数学期望和方差的定义,有效人数的均数为:
(80.1216.03432.02288.01064.00(=´+´+´+´=å=XXPXE方差为:
[][]22222((((
(01.800.064(11.800.288...(31.800.2160.72
VarXEXEXXEXPX=-=-=-´+-´++-´=å
对于任何一个二项分布B(n,π,如果每次试验出现“阳性”结果的概率均为π,则在n次独立重复实验中,出现X次阳性结果
总体均数为标准差为
p
mn
=
(
p
p
s-
=1
n
二项分布的均数和标准差
如果以率表示,将阳性结果的频率记做为则P的总体均数
总体标准差为式中
是频率P的标准误,反映阳性频率的抽样误差的大小。
pm=P(
n
Ppps-=1Psn
XP=
例4.已知某地钩虫感染率为6.7%,如果随机抽查150人,记样本钩虫感染率为P,求P的标准误。
本例,n=150,P=6.7%
%0.2020.0150
067.01(067.0==-=Ps
小结:
1.二项分布的条件:
1每次实验结果,只能是两个互斥的结果之一。
2相同的实验条件下,每次实验中事件A的发生具有相同的概率π。
3各次实验独立,各次的实验结果互不影响。
2.二项分布的分布特征:
1二项分布的形状取决于n,π。
2当π=0.5时分布对称,近似对称分布。
3当π≠0.5时,分布呈偏态,特别是n较小时,π偏离0.5越远,分布的对称性越差,但只要不接近1和0时,随着n的增大,分布逐渐逼近正态。
3.二项分布的均数和标准差
对于任何一个二项分布B(n,π
均数:
标准差:
对于以率表示的二项分布,
总体均数:
总体标准差小结:
pmn=(
pps-=1npm=P(n
Ppps-=1
第四章常用概率分布
二、二项分布的应用
1.二项分布的条件:
1每次实验结果,只能是两个互斥的结果之一。
2相同的实验条件下,每次实验中事件A的发生具有相同的概率π。
3各次实验独立,各次的实验结果互不影响。
2.二项分布的分布特征:
1二项分布的形状取决于n,π。
2当π=0.5时分布对称,近似对称分布。
3当π≠0.5时,分布呈偏态,特别是n较小时,π偏离0.5越远,分布的对称性越差,但只要不接近1和0时,随着n的增大,分布逐渐逼近正态。
3.二项分布的均数和标准差
对于任何一个二项分布B(n,π
均数:
标准差:
对于以率表示的二项分布
总体均数:
总体标准差:
n=mp(
1n=-sppP=mp
(
n
Ppps-=1
在生物医学研究中,我们经常要处理这样一类问题:
(1每次试验只有两种互斥的结果。
如生化检验的结果(阴性或阳性,毒性试验的结果(存活或死亡,或者每次试验我们只关心某事件是否发生,即要么事件发生,要么事件不发生。
(2为了找到这些试验结果的规律性,通常需要在相同条件下独立重复作n次,如对n个患者用完全相同的治疗方案进行治疗,对n只动物进行剂量相同的毒性试验等。
(3我们只关心的是n次试验中阳性结果的数目,如n个患者治疗后的治愈数,n只动物毒性试验的存活数等等。
1.概率估计
例1.如果某地钩虫感染率为13%,随机观察当地150人,其中恰好有10人感染钩虫的概率有多大?
分析:
(1钩虫感染只有两个互斥的结果,即感染与非感染;
(2每个人被钩虫感染的概率相同;
(3人与人之间钩虫感染可假设为相互独立的,所以感染钩虫的人
数X可认为服从n=150,π=0.13的二项分布。
1.概率估计
例1.如果某地钩虫感染率为13%,随机观察当地150人,其中恰好有10人感染钩虫的概率有多大?
10140150!
(100.130.870.005510!
(15010!
PX==´=-X
nXX
nCXP--=1((pp
二项分布出现阳性次数至少为k次的概率为2.累计概率计算
((((!
1!
!
n
nnX
XXkXknPXkPXXnX-==³==
--ååpp阳性次数至多为k次的概率为
((((00!
1!
!
k
knX
XXXnPXkP
XXnX-==£==--ååpp
2.累计概率计算
例2.如果某地钩虫感染率为13%,随机观察当地150人,其中至多有2人感染钩虫的概率有多大?
至少有2人感染钩虫的概率有多大?
至少有20人感染钩虫的概率有多大?
至多有2名感染的概率为:
((((2
200!
21!
!
nX
XXXnPXP
XXnX-==£==--ååpp((((((150149011487012150!
150!
0.1310.130.1310.130!
150!
1!
149!
150!
0.13210.132!
148!
PPP-++=
-+-+-
至少有2名感染的概率为:
至少有20名感染的概率为:
(((((1
20211011
n
XXPXP
XPXPP==³==-=-+»éùëûåå((((((19
200201101190.4879
nXXPXPXPXPPP==³=
=-=-+++éùëû=ååL
3.其它应用
1.二项分布的正态近似
根据中心极限定理,在n较大,nπ与n(1π均大于或等于5时,二项分
布接近与正态分布。
当n无穷大时,二项分布B(n,π的极限分布是总体均数为
总体标准差为的正态分布,此时可用该正态分布进行估计。
n=mp(1n=-spp((,1Nnn-ppp
3.其它应用
2.总体率的区间估计
3.样本率与总体率的比较
4.两样本率的比较
5.研究非遗传性疾病的家族聚集性
6.率的抽样调查的样本量估计
……
4.小结
1.二项分布的应用条件
1每次实验结果,只能是两个互斥的结果之一。
2相同的实验条件下,每次实验中事件A的发生具有相同的概率π。
3各次实验独立。
各次的实验结果互不影响。
2.二项分布的正态近似条件
在n较大,nπ与n(1π均大于或等于5时,可用的正态分布近似估计。
3.二项分布可以用于概率估计,统计推断等
((,1
Nnn-
ppp
第四章常用概率分布三、Poisson分布的概念与特征
一、Poisson分布的概念
Poisson分布是一种离散型分布,用于描述单位时间、空间、面积等的罕见事件发生次数的概率分布。
如:
n每毫升水中的大肠杆菌数、
n单位时间(如1分钟内放射性质点数、
n每1000个新生儿中某出生缺陷、多胞胎、染色体异常等事件出现的例数、
n……
注意:
Poisson分布要求观察结果相互独立,发生的概率p不变。
如,人群中传染性疾病首例出现后便成为传染源,会增加后续病例出现的概率,因此病例数的分布不能看作是Poisson分布;
又如,污染的牛奶中细菌成集落存在,单位容量牛奶中细菌数不能认为服从Poisson分布。
二、Poisson分布的特征
Poisson分布一般记作P(l,其概率函数为:
式中,l=nπ为Poisson分布的总体均数;
X为观察单位内某稀有事件的发生次数;e为自然对数的底,为常数,约等于2.71828。
(!
X
PXe
Xl
l
-=
例1如某地20年间共出生短肢畸形儿10名,平均每年0.5名。
试估计该地每年出生此类短肢畸形儿的人数为0,1,2,…的概率P(X。
X
0123450.6070.3030.0760.0130.0020.000
(
PX2
0.5
0.5
(20.0762!
Pe
-==1
0.5
0.5
(10.303,1!
Pe
-==0
0.5
0.5
(00.607,0!
Pe
-==
随着l的增大,Poisson分布
逐渐趋于对称分布。
当l>20时,Poisson分布可视
为近似正态分布。
图1l取不同值时的Poisson分布图
Poisson分布具有以下特性:
(1总体均数与总体方差相等:
均为l。
(2可加性:
从总体均数分别为l1和l2的两个Poisson分布总体中各自随机抽出一份样本,其中稀有事件的发生次数分别为X1和X2,则合计发生数T=X1+X2也服从Poisson分布,总体均数为l1+l2
。
水源
P(l1P(l2P(l3
P(l1+l2+l3+l4+l5
P(l4P(l5
可加性可推广到多
个Poisson分布。
正态近似
若随机变量X服从Poisson分布,Y=2X是否服从Poisson分布?
否!
n若服从Poisson分布的随机变量可能取值为0,1,2,…;但Y的可能取值为0,2,4,…,与Poisson分布随机变量的可能取值不符。
n若X的总体均数和方差为μ,则Y的总体均数为2μ,总体方差为4μ,总体均数≠总体方差。
三、Poisson分布的应用
1、概率估计:
如果某地新生儿先天性心脏病的发病概率为8‰,那么该地120名新生儿中有4人患先天性心脏病的概率有多大?
((4
1.961200.0080.96
!
0.9640.0144!
X
nPXeXPellpl--==´====
2、累积概率计算
如果稀有事件发生次数的总体均数为λ,那么该稀有事件
发生次数至多为k次的概率为
00((!
X
kkXXPXkPXeXll-==£==åå发生次数至少为k次的概率为
(1(1
PXkPXk³=-£-
6606162
22006666(3(!
0!
1!
2!
=0.062XXXeeeePXPXX----==<===++åå6061
66(11(0(110!
1!
0.983eePXPXPX-->=-=-==--=例2某100cm2的培养皿中平均菌落数为6个。
今用100cm2的培养皿进行
培养,试估计每一个培养皿中菌落数小于3个的概率,大于1个的概率。
该培养皿菌落数小于3个的概率为
菌落数大于1个的概率为
例3某放射性物质半小时内发出的脉冲数服从Poisson分布,平均为360个,试估计该放射性物质半小时内发出的脉冲数大于400个的概率。
4000.5360(4001(4001(1(2.1350.0164360
PXPX+->=-£»-F=-F=该放射性物质半小时内发出的脉冲数大于400个的概率为0.0164。
二项分布Poisson分布正态分布n很大π很小
l≥20
np≥5,
且n(1p≥5
第四章常用概率分布
四、正态分布的概念与特征
正态分布是自然界最常见的分布之一,例如测量的误差、人体许多生化指标的测量值等等都可认为近似正态分布。
此外,正态分布具有许多良好的性质,许多理论分布在一定条件下可用正态分布近似,一些重要的分布可由正态分布导出。
可以说正态分布是统计学中最重要的分布。
2
3图1频数分布逐渐接近正态分布示意图
1.2281.2341.2401.2461.2521.2581.2641.2701.2761.2821.288
图2体模“骨密度”测量值的分布接近正态分布示意图(频率密度=频率/组距
正态分布的概率密度函数(即纵向的曲线高度
(2
121
2XfXeXmsspæöç÷èø-¥+=¥
<<图3正态曲线位置、形状与μ和σ
关系示意图
正态分布的概率密度函数(即纵向的曲线高度
(2
121
2XfXeXmsspæöç÷èø-¥+=¥
<<图3正态曲线位置、形状与μ和σ关系示意图
正态分布的特征
1.关于
对称。
即正态分布以均数为中心,左右对称。
2.在处取得概率密度函数的最大值,在
处有拐点,表现为钟形曲线。
即正态曲线在横轴上方均数处最高。
xm=xm=xms=±
正态分布的特征
3.正态分布有两个参数,即均数µ和标准差σ。
µ是位置参数,σ是变异度参数(形状参数。
常用N(µ,σ2表示均数为μ,标准差为σ的正态分布;用N(0,1表示标准正态分布。
4.正态曲线下面积分布有一定规律。
横轴上正态曲线下的面积等于1(也常写作100%。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第4章 常见概率分布 常见 概率 分布