假设检验与样本数量分析②——双样本Z、双样本T、配对T检验.pptx
- 文档编号:26277019
- 上传时间:2023-06-17
- 格式:PPTX
- 页数:92
- 大小:3.52MB
假设检验与样本数量分析②——双样本Z、双样本T、配对T检验.pptx
《假设检验与样本数量分析②——双样本Z、双样本T、配对T检验.pptx》由会员分享,可在线阅读,更多相关《假设检验与样本数量分析②——双样本Z、双样本T、配对T检验.pptx(92页珍藏版)》请在冰豆网上搜索。
假设检验及功效和样本数量分析,双样本Z检验双样本T检验配对T检验,功效和样本数量,(PowerandSampleSizeAnalysis),预备知识,总体研究的一类对象的全体组成的集合。
个体总体中的每一个考察的对象。
样本从总体中抽出的一部分个体的集合。
样本数量样本中包含的个体的数量。
总体与样本,噢!
这么多健身球,都应该不会被压爆吧,不能都做破坏性强度试验,从中抽出几个,这就叫抽样吧。
?
我们通过样本来了解总体由样本信息作为总体信息估计值,统计推断是由样本的信息来推测总体性能的一种方法。
在通过样本获得一批数据后,要对总体的某一参数进行估计和检验。
建立检验假设,H0:
断裂韧性为(原假设=0)H1:
断裂韧性不是(备择假设0),单样本,H0:
断裂韧性(原假设0)H1:
断裂韧性(备择假设0),例如,我们想了解健身球的断裂韧性,通过对样本的测量获得一批数据,然后对健身球断裂韧性的平均值进行推断(或推断健身球的断裂韧性的单侧下限值),这是单样本检验的问题。
或,预备知识,总体与样本,不能将2种产品都做破坏性强度试验吧,,?
我们通过2组样本来了解2个总体由样本信息推断2个总体相比是否有差异,统计推断是由2个样本的信息来推测2个总体性能,推断性能相比是否有显著差异。
建立检验假设,H0:
1#产品和2#产品断裂韧性一致(原假设1=2)H1:
1#产品和2#产品断裂韧性不同(备择假设12),双样本,H0:
1#断裂韧性2#断裂韧性(原假设12)H1:
1#断裂韧性2#断裂韧性(备择假设12),例如,新研制出健身球2#,想判断2#的的断裂韧性是否与原来的1#产品一致;通过对2个样本的测量获得两部分数据,然后对两种健身球(1#产品和2#产品)的断裂韧性平均值进行是否存在差异进行推断(或推断1#产品的断裂韧性是否大于2#产品的断裂韧性),这是双样本检验的问题。
或,健身球1#,健身球2#,样本间的差异是由抽样误差引起的,样本与样本间存在显著差异,假设检验的两类错误,预备知识,第I类错误当H0为真时我们拒绝H0,假设检验是基于样本信息做出的结论,而样本只是代表了总体的一部份信息,因此必须考虑发生错误的概率。
假设检验会不会犯错误呢?
作出结论的依据是小概率原理,小概率原理:
小概率事件在一次实验中是几乎不可能发生,需要考虑发生误差的概率,不是绝对不发生,犯这种错误的概率用来表示,也称为错误或弃真错误。
第II类错误当H0为伪时我们接受H0,犯这种错误的概率用来表示,也称为错误或取伪错误。
双样本Z检验、双样本T检验,用来检查两个总体的平均值之间的差异是否存在统计显著性。
预备知识,接上页,四种可能结果的概率,检验功效
(1):
在原假设不成立时正确否定原假设的概率。
是第II类错误(取伪错误)的概率;而1(正确决策)的意思是:
当存在显著效应或差异时找到这些效应或差异的可能性。
检验功效1可用小数(或百分数)表示,一般取0.95、0.90、0.80。
一般认为检验功效不能小于0.7。
假设检验的两类错误,预备知识,假设检验的两类错误的关系,单侧右检验示意图(拒绝还是不拒绝都有可能错),以单侧右侧检验为例,H0:
12H:
12,(设:
=0.05、=0.10),=0.10,临界值,1=90%,=0.05,临界值,1-20,拒绝H0,1-=95%,H0,H0为真:
12时的抽样分布,(弃真错误:
5%),H0为假:
12时的抽样分布,H,(取伪错误10%),临界值向右移即若减小错误,就会增大犯错误的机会;临界值左移即若减小错误,也会增大犯错误的机会。
接上页,检查两个总体的平均值之间的差异是否存在统计显著性,1-20,预备知识,双样本均值检验基础知识,双样本均值检验(本篇内容),双样本z检验2-SampleZ-test,两个总体独立样本,双样本T检验2-SampleT-test,配对T检验PairedT-test,独立样本T检验与配对样本T检验的区别:
前者要求两样本相互独立,后者要求两样本相互配对。
前者需要考虑两总体方差相等和不等情况,后者则不需要考虑方差是否相等。
继上篇文章功效和样本数量分析单样本Z检验和单样本T检验之后,本次重要是讲双样本Z检验、双样本T检验和配对T检验及对它们的功效和样本数量分析。
小样本正态分布1、2已知,条件,两个样本相关,大样本n1和n250(至少大于30),小样本正态分布1、2未知但1=2,小样本正态分布1、2未知且12,两个样本内个体之间存在一一对应关系,样本来自两配对总体两个总体配对差值构成的总体服从正态分布,双样本Z检验,双样本z检验2-SampleZ-test,小样本正态分布1、2已知,大样本n1和n250(至少大于30),=0.05,统计量,1、2已知,1、2未知,双样本Z检验及功效和样本数量分析,双样本Z检验,大样本为何就可以用z检验?
正态分布,t态分布,t分布自由度=1,t分布自由度=15,t分布自由度=30,正态分布,正态分布,正态分布,补充阅读,样本自由度,大样本n1和n250(至少大于30),宗序平数理统计学及其应用,“n较大时(n45),可用标准正态分布代替t分布查t(n)的值,即t(n)Za其中Za为标准正态分布的分位点。
”,双样本Z检验,假设检验的例子(4),我们有一种陶瓷PTC热敏电阻产品,烧结工序中我们想了解烧结温度为1330和解烧结温度为1350时,产品阻值是否有差异?
两种温度设定下的产品各分别随机抽取55个样本,测量得到电阻值数据如下:
大样本n1=n2=55,1330:
1#样本电阻值(),1350:
2#样本电阻值(),双样本Z检验,建立检验假设,H0:
1=2两种温度设定下的产品电阻值一致H1:
12两种温度设定下的产品电阻值不同,给定显著水平=0.05,1,2,计算样本均值,2#样本均值:
=50.77,假设检验类别双样本Z检验,3,4,双侧检验,大样本n1=n2=55总体标准差1、2未知,1#样本均值:
=49.49,5,计算样本标准差,=6.18,1#:
S1,2#:
S2,=4.58,计算Z值,6,=1.23,查正态分布表Z临界值为:
Z1-/2=Z1-0.025=Z0.975=1.96,Z0.975=1.96,用算得的统计量与相应的临界值作比较|Z|=1.23Z0.975=1.96,7,双样本Z检验,双侧检验,接上页,此处Z的绝对值=1.234小于临界值1.96样本观测值落在“不拒绝零假设”范围内,Z=1.96,Z=-1.96,=0.025,=0.025,不拒绝零假设,拒绝零假设,拒绝零假设,临界值,临界值,双侧检验示意图(显著水平与拒绝域),H0,1=0.95,Z=1.23,作出不拒绝零假设的统计结论即两种温度设定下的产品电阻值一致,8,Z=-1.23,!
P|Z|=1.23=PZ1.23+PZ-1.23=1(Z1.23)+(-Z1.23)=1(Z1.23)2=10.89072=0.10932=0.2186,也可以查正态分布表(样本数据的概率P),P值无法拒绝H0,即两种温度设定下的产品电阻值一致,P值=0.2186=0.05,双样本Z检验,双侧检验,检验功效分析,评价检验功效,例子中,各抽取55个样本,用算得的统计量与相应的临界值作比较|Z|=1.23Z0.025=1.96作出了不拒绝H0的统计结论,即认为差别无统计学意义作出这样结论有两种可能:
(1-)较大,被比较的2个总体电阻值很可能无差别。
(1-)较小,所比较的2个总体电阻值很可能有差别(H0为假),但未能发现。
双侧检验,Power=1(1.96-1.09)+(-1.96-1.09)=0.1921+0.0011=0.193,Power=1(Z/2-)+(-Z/2-),检验功效Power=0.193可见该研究的检验功效不够,客观差异越小,两总体的估计值S越大,Power越小。
Za/2=Z0.025=1.96,=1.09,对总体的估计值,取样本S两者中大的:
S=6.18,=5.244,两样本实际均值差|=1.28,解出:
=1.09,Za/2=two-sidedcriticalvalue(upper/2pointofthestandardnormaldistribution)其中Za/2为标准正态分布/2的上分位点(右尾概率)。
后面查正态分布表均为上分位点即右尾概率,双样本检验,=0.05n1=n2=n,n=6,n=30,n=80,n功效60.06300.11800.24,n功效60.120.47800.88,n功效60.340.96800.99,n功效60.87301.00801.00,/=0.2,/=0.5,/=1,/=2,大样本检验功效为何有时也不高?
补充阅读,样本检验功效,/,灵敏系数:
为容许差值、为标准差,用功效曲线感觉一下/:
(/)(1-),样本数量分析,双侧检验,上页中,样本实际均值差=1.28,检验功效Power=0.193。
如果我们希望功效Power=0.9(即=0.1),需要抽取产品样本多少个?
=0.05,=0.10,两样本含量相等时(n1=n2=n),Z=Z0.1=1.28,Z/2=Z0.025=1.96,检验功效Power=0.9,需要抽取两组产品样本各490个,双样本Z检验,对总体的估计值:
S=6.18,两样本实际均值差:
=1.28,=489.4,双样本Z检验,双样本z检验2-SampleZ-test,小样本正态分布1、2已知,大样本n1和n250(至少大于30),=0.05,统计量,1、2已知,Thevalueinthetableistherighttailprobability.查正态分布表均为上分位点,即右尾概率。
双样本Z检验,假设检验的例子(5),我们有一个提升PCBA生产效率的项目,改进中关系到波峰焊工艺流程,有一种因素浸锡时间(S)需要研究。
以确定浸锡时间由4(S)减少到3(S)焊点的拉拔力是否不会降低,估计为1=0.15、2=0.15。
两种时间设定下的产品各分别随机抽取20个样本,根据得到焊点的拉力值计算均值如下:
1、2已知n1=n2=20,1#样本4(S):
拉力值(G),2#样本3(S):
拉力值(G),建立检验假设,浸锡3(S),焊点的拉拔力不大于浸锡4(S)的拉拔力,左单侧检验,=3.95,=4.15,H0:
12H1:
12(希望被证明),浸锡3(S),焊点的拉拔力大于浸锡4(S)的拉拔力,计算Z值,=-3.373,查正态分布表(右尾概率)Z临界值为:
Z=Z0.05=1.64,用算得的Z值与相应的临界值作比较|Z|=3.373Z0.05=1.64,拒绝H0浸锡3(S)焊点的拉拔力大于浸锡4(S)的拉拔力,双样本Z检验,检验功效分析,评价检验功效,Power=(1.64-3.37)=(-1.73)=1(1.73)=10.042=0.958,检验功效Power=0.958,Za=Z0.05=-1.64,=3.373,对总体的估计值,,=5.244,两样本实际均值差=0.16,解出:
=3.373,1=2=0.15,n1=n2=20,Power=(-Z-),在原假设不成立时正确否定原假设的概率=95.8%,左单侧检验,左单侧检验,样本数量分析,如果上页中,我们希望功效Power=0.9(即=0.1),需要抽取产品样本多少个?
=0.05,=0.10,两样本含量相等时(n1=n2=n),Z=Z0.1=1.28,Z=Z0.05=1.64,检验功效Power=0.9,需要抽取产品样本各15个,双样本Z检验,对总体的估计值:
=14.987,单侧检验,两样本实际均值差:
=0.16,1=2=0.15,双样本t检验功效和样本数量分析,双样本t检验,1、2未知,如果假定标准差2=1,使用合并样本标准差Sw进行计算统计量T。
双样本t检验进行独立的双样本检验当双样本具有相关(非独立)性质时,使用配对t检验使用双样本t检验可在2总体标准差1、2未知时进行双样本检验,方差一致性具有合并标准差的双样本t检验要略胜于具有不等标准差的双样本t检验,但如果标准差不等,则会出现严重错误。
因此,合并标准差仅在假设检验认为标准差相等时使用。
使用方差一致性检验可以检验等方差假设。
双样本t检验及功效和样本数量分析,双样本t检验,双样本T检验2-SampleT-test,小样本1、2未知且12,小样本1、2未知但1=2,统计量,1、2未知但估计:
1=2,df.=n1+n2-2,式中合并样本标准差:
自由度:
注意:
是1=2而不是S1=S2,假设检验的例子(6),双样本t检验,我们有两台相同的注塑机加工相同的电缆附件产品,六西格玛项目组在1#机的加工参数和操作方法方面进行了改进,已确定改进会增加生产效率。
现在需要确定1#机改进后加工的产品的外径尺寸与2#机按原有方式加工的产品的外径尺寸值是否一致?
现两台机各分别随机抽取产品20个样本。
测量得到外径尺寸数据如下:
外径尺寸标准差未知估计,标准差1=2,建立检验假设,H0:
1#和2#机加工产品外径一致(H0:
1=2)H1:
1#和2#机加工产品外径不同(H1:
12),给定显著水平=0.05,1,2,计算样本均值,=31.970,假设检验类别双样本t检验,3,4,双侧检验,1#机:
=32.0115,2#机:
双样本t检验,计算t值,6,=1.26187,5,计算样本合并样本标准差,=0.0957,1#机:
=0.104,2#机:
Sw,S1,S2,=0.1115,查t分布分位数表:
用算得的统计量|T值|=1.26187与相应自由度的临界值t/2(n1+n2-2)=2.024作比较,7,t/2(n1+n2-2)=t0.025(38)=2.024,|T值|t/2(n1+n2-2),双样本t检验,结论,8,|T值|t/2(n1+n2-2),=0.025,=0.025,临界值,临界值,1=95%,=0.05,无法拒绝H0,t/2(n1+n2-2),-t/2(n1+n2-2),(对应自由度n1+n2-2),拒绝零假设,拒绝零假设,不拒绝H0范围,-2.024,2.024,|T值|1.26187,|T值|临界值t/2(n1+n2-2)在不拒绝H0范围内无法拒绝零假设,即以95%的置信度认为:
1#和2#机加工产品外径一致,补充阅读,用Excel查t分布分位数,比如查t0.025(38),任选一单元格,Probability为对应于双尾t分布的概率(/2=0.025,本例中=0.05)。
Degrees_freedom为分布的自由度(本例中:
38)。
单元格输入=INV(0.05,38)回车,看临界值t/2,用Excel的INV(probability,degrees_freedom)计算t分布的分位数,与上页查表(t0.025(38)=2.024)结果相同,注*Excel的INV(probability,degrees_freedom)是双侧检验即,输入计算用的是/2。
双样本t检验,补充阅读,用Excel计算双样本t检验P-值,我们用Excel的TDIST(x,degrees_freedom,tails)计算t分布的概率,任选一单元格,单元格输入=TDIST(1.26187,38,2)回车,看看P-值=0.214686201,t=1.26187,自由度=38,2:
双侧检验,即:
认为:
“1#和2#机加工产品外径一致”,P-值=0.2147=0.05无法拒绝零假设H0,1.26187,2.024,=0.025,自由度df=38,功效分析,双样本t检验,双侧检验,评价检验功效,前面假设检验的例子中,各抽取产品20个样本,用算得的统计量与相应的临界值作比较t=1.26187t/2(n1+n2-2)=2.024;或(P值=0.2147=0.05)出了不拒绝零假设的统计结论。
当H0为假时正确否定它的概率(p=1),双侧检验,Power=1t(2.024-1.26187)+t(-2.024-1.26187)=1t(0.76213)+t(-3.28587)=0.226+0.001=0.227,t:
t分布的累积分布函数,将标准差SW=0.104、=3.162278和ta/2(2n-2)=2.024及,样本实际均值的差=32.0115-31.970=0.0415代入,解出:
检验功效Power=0.227可见该研究的检验功效不够,这里,犯第II类错误(当H0为伪时我们接受零假设,取伪错误)的概率=77.3%,Power=1t(ta/2(2n-2),)+t(-ta/2(2n-2),),=1.26187,功效分析,双样本t检验,双侧检验,当H0为假时正确否定它的概率(p=1),双侧检验,Power=1t(2.024-3.0407)+t(-2.024-3.0407)=1t(-1.0167)+t(-5.0647)=10.157863014+0.0000054=0.842,t:
t分布的累积分布函数,假定标准差SW=0.104=3.162278均值的差=0.1,检验功效Power=0.842,可见在规定容许差值=0.1的情况下,该研究的检验功效较高。
这里,犯第II类错误(当H0为伪时我们接受零假设,取伪错误)的概率=15.8%,Power=1t(ta/2(2n-2),)+t(-ta/2(2n-2),),=3.0407,规定容许差值评价检验功效,上页中,检验功效Power=0.227、检验功效不够;然而检测的差值是我们关注的并且有意义的吗?
例子4中,如果希望确定2#机改进后加工的产品的外径尺寸与1#机按原有方式加工的产品的外径尺寸值是否相差在0.1mm之内;否则,就被检测出来(检验功效要高),那么就主观规定容许误值=0.1,ta/2(2n-2)=2.024,=3.0407,样本数量分析,双样本t检验,双侧检验,双侧检验,规定容许差值估算样本数量,上页中,主观规定容许误值=0.1,检验功效Power=0.842。
如果我们希望功效Power=0.9(即=0.1),需要抽取产品样本多少个?
再作检验之前,为确定2#机改进后加工的产品的外径尺寸与1#机按原有方式加工的产品的外径尺寸值是否相差在0.1mm之内;并且希望检验功效Power=0.9,需要的样本数量估计是多少?
设:
=0.05,=0.10,两样本含量相等时(n1=n2=n),注意:
公式计算样本数量n时等式右侧也包含和n相关的自由度,我们也是需要多次试算(迭代);才能找到需要的样本数量。
我们通常用正态分布代替t分布得到估的样本数量n,得到的n做为自由度参数放到等式右侧来估算样本数量。
有时我们会把它再带回功效Power公式试算一下功效,再做些适当调整。
标准差=0.104均值的差=0.1,Z=Z0.1=1.28,Z/2=Z0.025=1.96,=20.9952,假定:
估计需要抽取产品样本各21个,用正态分布代替t分布得到的样本数量是近似值,后面我们用n=22计算一下Power,双样本t检验,双侧检验,Power=1t(2.02-3.19)+t(-2.02-3.19)=1t(-1.17)+t(-5.21)=10.1243+0.0000027=0.876,SW=0.104=3.317=0.1,Power=1t(ta/2(2n-2),)+t(-ta/2(2n-2),),ta/2(2n-2)=t0.025(46)=2.013,接上页,在上页例子中,查正态分布表得到Z0.05/2=1.96、Z=Z0.1=1.28以此为基础估计出:
需要样本数量n=22。
=3.19,也可以用Excel计算分位数:
查t分布分位数表(见下表):
t0.025(42)t0.025(40)=2.02,TINV(probability,degrees_freedom),双尾值,概率为0.05,自由度为42,t0.025(42)=2.018,公式中,样本数量各22个,功效Power=0.876,距希望功效0.9还差那么一点。
下面我们把样本数量再增加那么一点,比如,用n=24,再试算一下功效Power。
ta/2(2n-2)=t0.025(46)=2.02,=3.331,Power=1t(2.013-3.331)+t(-2.013-3.331)=1t(-1.313)+t(-5.344)=10.0978+0.0000014=0.9022,检验功效Power=0.9,需要的样本数量估计是n1=n2=24,两样本含量相等时,SW=0.104=0.1,假设检验的例子(7),双样本t检验,标准差未知。
估计,标准差1=2。
方差一致性检验后面讨论,建立检验假设,H0:
212#配方比1#配方产品断裂伸长率”方面无增加H1:
212#配方比1#配方产品断裂伸长率”方面有增大,给定显著水平=0.05,1,2,计算样本均值,=623.73,假设检验类别双样本t检验,3,4,右单侧检验,1#配方:
=516.09,2#配方:
单侧检验,我们生产的一种低密度聚乙烯产品;市场需求一种新产品在“断裂伸长率”方面再增加10%。
项目小组改进了配方。
希望“断裂伸长率”平均值能增加10%(增加数值为100)。
确定:
改进后加工的产品1#按原有配方加工常规产品为2#。
我们先回顾双样本t检验的单侧检验,接上页,双样本t检验,单侧检验,计算t值,6,=39.355,5,计算样本合并样本标准差,=9.765,=9.0714,Sw,S1,S2,=8.32,1#配方:
2#配方:
查t分布分位数表:
用算得的统计量|T值|=39.355与相应自由度的临界值t(n1+n2-2)=1.68比较,7,t(n1+n2-2)=t0.05(42)=1.68,如果觉得表中查不到自由度=42的t值,也可以用Excel计算分位数:
TINV(probability,degrees_freedom),Excel计算双尾值,概率为=0.05要输入0.1,t0.05(42)=1.68,拒绝H0,结论,8,|T|t(n1+n2-2)在拒绝域,2#配方比1#配方产品断裂伸长率”方面有增大,双样本t检验,补充阅读,用Excel计算双样本t检验P-值,我们用Excel的TDIST(x,degrees_freedom,tails)计算t分布的概率,任选一单元格,单元格输入=TDIST(39.355,42,1)回车,看看P值=0(4.4*10-35),t=39.355,自由度=42,1:
单侧检验,即,认为:
P-值=0=0.05拒绝零假设H0,t=39.355概率P值(t,42)=?
t=1.68概率P(t,42)=0.05,自由度df=42,单侧检验(右),临界值,1=95%,=0.05,(对应自由度n1+n2-2),拒绝零假设,t=1.68,不拒绝零假设,t=39.355,2#配方产品断裂伸长率比1#配方产品断裂伸长率大,在假设检验的例子(7)中我们关心的是:
项目小组改进了配方后,“断裂伸长率”平均值能否增加10%以上(增加数值100)的希望能否达到。
双样本t检验,建立检验假设,H0:
2-11002#配方比1#配方产品断裂伸长率增加不超过100H1:
2-11002#配方比1#配方产品断裂伸长率增加值超过100,1,2,3,4,单侧检验,我们重新做双样本t检验的单侧检验(右),规定最小差值,第步同前,5,计算t值,6,=2.79,查t分布
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 假设检验 样本 数量 分析 配对 检验