统计建模与R软件第五讲-_精品文档.ppt
- 文档编号:2571524
- 上传时间:2022-11-01
- 格式:PPT
- 页数:30
- 大小:1.41MB
统计建模与R软件第五讲-_精品文档.ppt
《统计建模与R软件第五讲-_精品文档.ppt》由会员分享,可在线阅读,更多相关《统计建模与R软件第五讲-_精品文档.ppt(30页珍藏版)》请在冰豆网上搜索。
第五讲假设检验,主要内容,5.1假设检验的基本概念5.2重要的参数检验5.3若干重要的非参数检验,定义5.1对假设检验问题,设x1xn为样本,W为样本空间中的一个子集,对于给定的(0,1),若W满足:
则称由W构成(H0的)拒绝域的检验方法为显著性水平的检验。
5.1基本概念注解,假设检验的两类错误:
第一类型错误:
否定了真实的原假设。
(拒真)犯第一类型错误的概率为显著性水平,即:
犯第一类型错误的概率可以通过显著性水平来控制。
第二类型错误:
接受了错误的原假设。
(取伪)犯第二类型错误的概率常用表示,即:
犯错误的概率的计算是比较复杂的,以正态分布为例,H0:
=0,但是实际上H0为伪,即:
!
=0,=1.在H0假设下,我们可以在总体均值为H0和H1两种情况下,分别作出两条正态分布曲线(A线和B线),见图1。
在理论上存在的若干个样本均值中,只要某个样本均值XiXB/2时,我们将误认为H0为真,也就是不拒绝H0。
由于真实情况是H1为真(H0为假),这样我们就犯了错误,即纳伪的错误。
犯错误的概率大小就是相对真实情况H1(正态曲线A)而言,图1中阴影部分的面积:
=(ZXB1-/2)-(ZXB/2)(ZXB1-/2,ZXB/2分别是H0假设下的分位点),XB1-/2,(H0),(H1)真实的情况:
关于取伪:
XB/2,4.功效和样本量:
功效就是正确地否定了错误的原假设的概率,常用表示:
功效可以告诉我们,在备择假设是真时(应该否定H0)时,我们可以否定H0的可信程度.若功效太低,即使真实的与0之间有差异,也很难被所用的检验方法发现.而不充分的样本量总是造成检验的低功效.,已知方差时正态分布均值的单样本z检验的功效:
单侧备择:
双侧备择,=,影响功效的因素:
变小,则z减小,所以功效也减小;若备择均值远离无效均值(即|0-1|增加),则功效增加;增加,功效减小;样本量n增加,功效增加;和1固定,样本量n多大才能达到希望的功效?
在单侧检验:
双侧备择下的样本量:
2.使用power.t.test()函数,power.t.test(n=NULL,delta=NULL,sd=1,sig.level=0.05,power=NULL,type=c(two.sample,one.sample,paired),alternative=c(two.sided,one.sided),strict=FALSE),Arguments,Powercalculationsforoneandtwosamplettests,Usage,例子:
power.t.test(n=20,delta=1),#已知样本量,求功效,power.t.test(power=.90,delta=1),#已知功效,求样本量,Two-samplettestpowercalculationn=20delta=1sd=1sig.level=0.05power=0.8689528alternative=two.sidedNOTE:
nisnumberin*each*group,Two-samplettestpowercalculationn=22.02110delta=1sd=1sig.level=0.05power=0.9alternative=two.sidedNOTE:
nisnumberin*each*group,5.2.1正态总体的假设检验,一个正态总体的情况,双边,单边,已知时:
未知时:
拒绝域:
拒绝域:
已知时:
未知时:
拒绝域:
拒绝域:
R实现,P_value0)1-Pelseif(P1/2)2*Pelse2*(1-P),#根据参数的个数计算,#左侧检验:
=P(下分位点),#右侧检验:
=1-P(上分位点),#双侧检验:
=2P,与比较,如果,则拒绝H0,mean.test1:
mean.test1=0)z-(xb-mu)/(sigma/sqrt(n)P-P_value(pnorm,z,side=side)data.frame(mean=xb,df=n,Z=z,P_value=P)elset-(xb-mu)/(sd(x)/sqrt(n)P-P_value(pt,t,paramet=n-1,side=side)data.frame(mean=xb,df=n-1,T=t,P_value=P),#,#观察到的(实例的)显著性水平,表示对原假设的支持程度。
计算出P值后,将给定的显著性水平与P值比较,就可作出检验的结论:
如果P值,则在显著性水平下拒绝原假设.如果P值,则在显著性水平下接受原假设.,例5.2:
某种元件的寿命X(以h计)服从正态分布N(,2),其中,2未知,现测得16只元件的寿命如下:
159280101212224379179264222362168250149260485170问是否有理由认为元件的平均寿命大于225?
x=c(159,280,101,212,224,379,179,264,222,362,168,250,149,260,485,170)source(mean.test1.R)mean.test1(x,mu=225,side=1),meandfTP_value1241.5150.66851770.2569801,t.test(x,alternative=greater,mu=225)OneSamplet-testdata:
xt=0.6685,df=15,p-value=0.257alternativehypothesis:
truemeanisgreaterthan22595percentconfidenceinterval:
198.2321Infsampleestimates:
meanofx241.5,side=-1,0.05,平均寿命不大于(小于)225,p-value=0.743020.05,平均寿命不小于(大于)225,是否有理由认为元件的平均寿命小于225?
平均寿命小于225是小概率事件拒绝域比显著性水平小,问题重点:
二个正态总体的情况,已知时:
拒绝域:
单边II:
双边:
单边I:
未知时:
未知时:
单边II:
双边:
单边I:
拒绝域:
单边II:
双边:
单边I:
拒绝域:
R实现:
mean.test2=0)z-(xb-yb)/sqrt(sigma12/n1+sigma22/n2)P-P_value(pnorm,z,side=side)data.frame(mean=xb-yb,df=n1+n2,Z=z,P_value=P)elseif(var.equal=TRUE)Sw-sqrt(n1-1)*var(x)+(n2-1)*var(y)/(n1+n2-2)t-(xb-yb)/(Sw*sqrt(1/n1+1/n2)nu-n1+n2-2elseS1-var(x);S2-var(y)nu-(S1/n1+S2/n2)2/(S12/n12/(n1-1)+S22/n22/(n2-1)t-(xb-yb)/sqrt(S1/n1+S2/n2)P-P_value(pt,t,paramet=nu,side=side)data.frame(mean=xb-yb,df=nu,T=t,P_value=P),已知时,未知时,未知时,#P-value,#P-value,例5.3,在平炉上进行一项实验以确定改变操作方法的建议是否会增加钢的得率,试验是在同一个平炉上进行的,每练一炉钢时除操作方法外,其他条件都尽可能做到相同。
先用标准方法练一炉,然后用新方法练一炉,以后交替进行,各练了10炉,其得率分别为:
设这两样本相互独立,且分别来自正态总体N(12)和N(22),其中1、2和2未知,问新的操作能否提高得率?
(=0.05),x=c(78.1,72.4,76.2,74.3,77.4,78.4,76.0,75.5,76.7,77.3)y=c(79.1,81.0,77.3,79.1,80.0,79.1,79.1,77.3,80.2,82.1)mean.test2(x,y,var.equal=TRUE,side=-1),meandfTP_value-3.218-4.2957430.0002175927,0.05,落在拒绝域内,所以拒绝原假设,接受12,单边II:
单边I:
0.99978240.05,不能拒绝H0,即接受H0:
12,改变样本顺序:
x=c(78.1,72.4,76.2,74.3,77.4,78.4,76.0,75.5,76.7,77.3)y=c(79.1,81.0,77.3,79.1,80.0,79.1,79.1,77.3,80.2,82.1)mean.test2(y,x,var.equal=TRUE,side=-1),meandfTP_value3.2184.295743,单边I:
单边II:
0.99978240.05,不能拒绝H0,即接受H0:
12,mean.test2(y,x,var.equal=TRUE,side=1),meandfTP_value13.2184.2957430.0002175927,单边I:
单边II:
1,新的操作对提高得率是否具有显著性?
成立,说明H0小概率事件发生了,忽略H0,接受H1,也即,新操作不如旧操作是否是小概率偶然事件,,H0是不是小概率事件?
问题重点:
5.2.2正态总体方差的假设检验,1.单个总体的情况:
已知时:
未知时:
R实现:
var.test1-function(x,sigma2=1,mu=Inf,side=0)n-length(x)if(muInf)S2-sum(x-mu)2)/n;df=nelseS2-var(x);df=n-1chi2-df*S2/sigma2;P-P_value(pchisq,chi2,paramet=df,side=side)data.frame(var=S2,df=df,chisq2=chi2,P_value=P),例5.4,从小学五年级学生中抽取20名,测量其身高(单位:
cm),其数据如下:
136,144,143,157,137,159,135,158,147,165,158,142,159,150,156,152,140,149,148,155以=0.05作假设检验:
1)H0:
=149,H1:
149;2)H0:
2=75,H1:
275;,x=c(136,144,143,157,137,159,135,158,147,165,158,142,159,150,156,152,140,149,148,155)mean.test1(x,mu=149),meandfTP_value1149.5190.25361300.8025186,0.05,不能拒绝H0,接受H0,=149,var.test1(x,sigma2=75),vardfchisqzP_value177.731919.6930.826,0.05,不能拒绝H0,接受H0,2=75,5.2.3二项分布总体的假设检验,2)单侧检验I:
H0:
pp0;H1:
pp0,3)单侧检验II:
H0:
pp0;H1:
pp0,1)双侧检验:
H0:
p=p0;H1:
pp0,n已知,对p检验:
拒绝域:
拒绝域:
拒绝域:
例5.6,例5.6有一批蔬菜种子的平均发芽率p0=0.85,现随机抽取500粒,用种衣剂进行处理,结果有445粒发芽,试检验种衣剂对种子发芽率有无效果.,H0:
p=p0=0.85;H1:
pp0,DescriptionPerformsanexacttestofasimplenullhypothesisabouttheprobabilityofsuccessinaBernoulliexperi
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 建模 软件 第五 精品 文档