书签分享收藏举报版权申诉 / 92

立即下载加入VIP,免费下载

当前位置：首页 > 幼儿教育 > 家庭教育 > 假设检验与样本数量分析②——双样本Z、双样本T、配对T检验.pptx

假设检验与样本数量分析②——双样本Z、双样本T、配对T检验.pptx

文档编号：26277019
上传时间：2023-06-17
格式：PPTX
页数：92
大小：3.52MB

《假设检验与样本数量分析②——双样本Z、双样本T、配对T检验.pptx》由会员分享，可在线阅读，更多相关《假设检验与样本数量分析②——双样本Z、双样本T、配对T检验.pptx（92页珍藏版）》请在冰豆网上搜索。

假设检验与样本数量分析②——双样本Z、双样本T、配对T检验.pptx

假设检验及功效和样本数量分析,双样本Z检验双样本T检验配对T检验,功效和样本数量,（PowerandSampleSizeAnalysis）,预备知识,总体研究的一类对象的全体组成的集合。

个体总体中的每一个考察的对象。

样本从总体中抽出的一部分个体的集合。

样本数量样本中包含的个体的数量。

总体与样本,噢！

这么多健身球，都应该不会被压爆吧,不能都做破坏性强度试验，从中抽出几个，这就叫抽样吧。

？

我们通过样本来了解总体由样本信息作为总体信息估计值,统计推断是由样本的信息来推测总体性能的一种方法。

在通过样本获得一批数据后，要对总体的某一参数进行估计和检验。

建立检验假设,H0：

断裂韧性为（原假设=0）H1：

断裂韧性不是（备择假设0）,单样本,H0：

断裂韧性（原假设0）H1：

断裂韧性（备择假设0）,例如，我们想了解健身球的断裂韧性，通过对样本的测量获得一批数据，然后对健身球断裂韧性的平均值进行推断（或推断健身球的断裂韧性的单侧下限值），这是单样本检验的问题。

或,预备知识,总体与样本,不能将2种产品都做破坏性强度试验吧，,？

我们通过2组样本来了解2个总体由样本信息推断2个总体相比是否有差异,统计推断是由2个样本的信息来推测2个总体性能，推断性能相比是否有显著差异。

建立检验假设,H0：

1#产品和2#产品断裂韧性一致（原假设1=2）H1：

1#产品和2#产品断裂韧性不同（备择假设12）,双样本,H0：

1#断裂韧性2#断裂韧性（原假设12）H1：

1#断裂韧性2#断裂韧性（备择假设12）,例如，新研制出健身球2#，想判断2#的的断裂韧性是否与原来的1#产品一致；通过对2个样本的测量获得两部分数据，然后对两种健身球（1#产品和2#产品）的断裂韧性平均值进行是否存在差异进行推断（或推断1#产品的断裂韧性是否大于2#产品的断裂韧性），这是双样本检验的问题。

或,健身球1#,健身球2#,样本间的差异是由抽样误差引起的,样本与样本间存在显著差异,假设检验的两类错误,预备知识,第I类错误当H0为真时我们拒绝H0,假设检验是基于样本信息做出的结论，而样本只是代表了总体的一部份信息，因此必须考虑发生错误的概率。

假设检验会不会犯错误呢？

作出结论的依据是小概率原理,小概率原理：

小概率事件在一次实验中是几乎不可能发生,需要考虑发生误差的概率,不是绝对不发生,犯这种错误的概率用来表示，也称为错误或弃真错误。

第II类错误当H0为伪时我们接受H0,犯这种错误的概率用来表示，也称为错误或取伪错误。

双样本Z检验、双样本T检验，用来检查两个总体的平均值之间的差异是否存在统计显著性。

预备知识,接上页,四种可能结果的概率,检验功效

（1）：

在原假设不成立时正确否定原假设的概率。

是第II类错误（取伪错误）的概率；而1（正确决策）的意思是：

当存在显著效应或差异时找到这些效应或差异的可能性。

检验功效1可用小数（或百分数）表示，一般取0.95、0.90、0.80。

一般认为检验功效不能小于0.7。

假设检验的两类错误,预备知识,假设检验的两类错误的关系,单侧右检验示意图（拒绝还是不拒绝都有可能错）,以单侧右侧检验为例,H0：

12H：

12,（设：

=0.05、=0.10）,=0.10,临界值,1=90%,=0.05,临界值,1-20,拒绝H0,1-=95%,H0,H0为真：

12时的抽样分布,（弃真错误：

5%）,H0为假：

12时的抽样分布,H,（取伪错误10%）,临界值向右移即若减小错误，就会增大犯错误的机会；临界值左移即若减小错误，也会增大犯错误的机会。

接上页,检查两个总体的平均值之间的差异是否存在统计显著性,1-20,预备知识,双样本均值检验基础知识,双样本均值检验（本篇内容）,双样本z检验2-SampleZ-test,两个总体独立样本,双样本T检验2-SampleT-test,配对T检验PairedT-test,独立样本T检验与配对样本T检验的区别：

前者要求两样本相互独立，后者要求两样本相互配对。

前者需要考虑两总体方差相等和不等情况，后者则不需要考虑方差是否相等。

继上篇文章功效和样本数量分析单样本Z检验和单样本T检验之后，本次重要是讲双样本Z检验、双样本T检验和配对T检验及对它们的功效和样本数量分析。

小样本正态分布1、2已知,条件,两个样本相关,大样本n1和n250（至少大于30）,小样本正态分布1、2未知但1=2,小样本正态分布1、2未知且12,两个样本内个体之间存在一一对应关系,样本来自两配对总体两个总体配对差值构成的总体服从正态分布,双样本Z检验,双样本z检验2-SampleZ-test,小样本正态分布1、2已知,大样本n1和n250（至少大于30）,=0.05,统计量,1、2已知,1、2未知,双样本Z检验及功效和样本数量分析,双样本Z检验,大样本为何就可以用z检验？

正态分布,t态分布,t分布自由度=1,t分布自由度=15,t分布自由度=30,正态分布,正态分布,正态分布,补充阅读,样本自由度,大样本n1和n250（至少大于30）,宗序平数理统计学及其应用,“n较大时（n45），可用标准正态分布代替t分布查t（n）的值，即t（n）Za其中Za为标准正态分布的分位点。

”,双样本Z检验,假设检验的例子（4）,我们有一种陶瓷PTC热敏电阻产品，烧结工序中我们想了解烧结温度为1330和解烧结温度为1350时，产品阻值是否有差异？

两种温度设定下的产品各分别随机抽取55个样本，测量得到电阻值数据如下：

大样本n1=n2=55,1330：

1#样本电阻值（）,1350：

2#样本电阻值（）,双样本Z检验,建立检验假设,H0：

1=2两种温度设定下的产品电阻值一致H1：

12两种温度设定下的产品电阻值不同,给定显著水平=0.05,1,2,计算样本均值,2#样本均值：

=50.77,假设检验类别双样本Z检验,3,4,双侧检验,大样本n1=n2=55总体标准差1、2未知,1#样本均值：

=49.49,5,计算样本标准差,=6.18,1#：

S1,2#：

S2,=4.58,计算Z值,6,=1.23,查正态分布表Z临界值为：

Z1-/2=Z1-0.025=Z0.975=1.96,Z0.975=1.96,用算得的统计量与相应的临界值作比较|Z|=1.23Z0.975=1.96,7,双样本Z检验,双侧检验,接上页,此处Z的绝对值=1.234小于临界值1.96样本观测值落在“不拒绝零假设”范围内,Z=1.96,Z=-1.96,=0.025,=0.025,不拒绝零假设,拒绝零假设,拒绝零假设,临界值,临界值,双侧检验示意图（显著水平与拒绝域）,H0,1=0.95,Z=1.23,作出不拒绝零假设的统计结论即两种温度设定下的产品电阻值一致,8,Z=-1.23,！

P|Z|=1.23=PZ1.23+PZ-1.23=1（Z1.23）+（-Z1.23）=1（Z1.23）2=10.89072=0.10932=0.2186,也可以查正态分布表（样本数据的概率P）,P值无法拒绝H0,即两种温度设定下的产品电阻值一致,P值=0.2186=0.05,双样本Z检验,双侧检验,检验功效分析,评价检验功效,例子中,各抽取55个样本,用算得的统计量与相应的临界值作比较|Z|=1.23Z0.025=1.96作出了不拒绝H0的统计结论，即认为差别无统计学意义作出这样结论有两种可能：

（1-）较大，被比较的2个总体电阻值很可能无差别。

（1-）较小，所比较的2个总体电阻值很可能有差别（H0为假），但未能发现。

双侧检验,Power=1（1.96-1.09）+（-1.96-1.09）=0.1921+0.0011=0.193,Power=1（Z/2-）+（-Z/2-）,检验功效Power=0.193可见该研究的检验功效不够,客观差异越小，两总体的估计值S越大，Power越小。

Za/2=Z0.025=1.96,=1.09,对总体的估计值，取样本S两者中大的：

S=6.18,=5.244,两样本实际均值差|=1.28,解出：

=1.09,Za/2=two-sidedcriticalvalue（upper/2pointofthestandardnormaldistribution）其中Za/2为标准正态分布/2的上分位点（右尾概率）。

后面查正态分布表均为上分位点即右尾概率,双样本检验,=0.05n1=n2=n,n=6,n=30,n=80,n功效60.06300.11800.24,n功效60.120.47800.88,n功效60.340.96800.99,n功效60.87301.00801.00,/=0.2,/=0.5,/=1,/=2,大样本检验功效为何有时也不高？

补充阅读,样本检验功效,/,灵敏系数:

为容许差值、为标准差,用功效曲线感觉一下/:

（/）（1-）,样本数量分析,双侧检验,上页中,样本实际均值差=1.28，检验功效Power=0.193。

如果我们希望功效Power=0.9（即=0.1），需要抽取产品样本多少个？

=0.05，=0.10,两样本含量相等时（n1=n2=n）,Z=Z0.1=1.28,Z/2=Z0.025=1.96,检验功效Power=0.9，需要抽取两组产品样本各490个,双样本Z检验,对总体的估计值：

S=6.18,两样本实际均值差：

=1.28,=489.4,双样本Z检验,双样本z检验2-SampleZ-test,小样本正态分布1、2已知,大样本n1和n250（至少大于30）,=0.05,统计量,1、2已知,Thevalueinthetableistherighttailprobability.查正态分布表均为上分位点，即右尾概率。

双样本Z检验,假设检验的例子（5）,我们有一个提升PCBA生产效率的项目，改进中关系到波峰焊工艺流程，有一种因素浸锡时间（S）需要研究。

以确定浸锡时间由4（S）减少到3（S）焊点的拉拔力是否不会降低，估计为1=0.15、2=0.15。

两种时间设定下的产品各分别随机抽取20个样本，根据得到焊点的拉力值计算均值如下：

1、2已知n1=n2=20,1#样本4（S）：

拉力值（G）,2#样本3（S）：

拉力值（G）,建立检验假设,浸锡3（S），焊点的拉拔力不大于浸锡4（S）的拉拔力,左单侧检验,=3.95,=4.15,H0：

12H1：

12（希望被证明）,浸锡3（S），焊点的拉拔力大于浸锡4（S）的拉拔力,计算Z值,=-3.373,查正态分布表（右尾概率）Z临界值为：

Z=Z0.05=1.64,用算得的Z值与相应的临界值作比较|Z|=3.373Z0.05=1.64,拒绝H0浸锡3（S）焊点的拉拔力大于浸锡4（S）的拉拔力,双样本Z检验,检验功效分析,评价检验功效,Power=（1.64-3.37）=（-1.73）=1（1.73）=10.042=0.958,检验功效Power=0.958,Za=Z0.05=-1.64,=3.373,对总体的估计值，,=5.244,两样本实际均值差=0.16,解出：

=3.373,1=2=0.15,n1=n2=20,Power=（-Z-）,在原假设不成立时正确否定原假设的概率=95.8%,左单侧检验,左单侧检验,样本数量分析,如果上页中,我们希望功效Power=0.9（即=0.1），需要抽取产品样本多少个？

=0.05，=0.10,两样本含量相等时（n1=n2=n）,Z=Z0.1=1.28,Z=Z0.05=1.64,检验功效Power=0.9，需要抽取产品样本各15个,双样本Z检验,对总体的估计值：

=14.987,单侧检验,两样本实际均值差：

=0.16,1=2=0.15,双样本t检验功效和样本数量分析,双样本t检验,1、2未知，如果假定标准差2=1，使用合并样本标准差Sw进行计算统计量T。

双样本t检验进行独立的双样本检验当双样本具有相关（非独立）性质时，使用配对t检验使用双样本t检验可在2总体标准差1、2未知时进行双样本检验,方差一致性具有合并标准差的双样本t检验要略胜于具有不等标准差的双样本t检验，但如果标准差不等，则会出现严重错误。

因此，合并标准差仅在假设检验认为标准差相等时使用。

使用方差一致性检验可以检验等方差假设。

双样本t检验及功效和样本数量分析,双样本t检验,双样本T检验2-SampleT-test,小样本1、2未知且12,小样本1、2未知但1=2,统计量,1、2未知但估计：

1=2,df.=n1+n2-2,式中合并样本标准差：

自由度：

注意：

是1=2而不是S1=S2,假设检验的例子（6）,双样本t检验,我们有两台相同的注塑机加工相同的电缆附件产品，六西格玛项目组在1#机的加工参数和操作方法方面进行了改进，已确定改进会增加生产效率。

现在需要确定1#机改进后加工的产品的外径尺寸与2#机按原有方式加工的产品的外径尺寸值是否一致？

现两台机各分别随机抽取产品20个样本。

测量得到外径尺寸数据如下：

外径尺寸标准差未知估计，标准差1=2,建立检验假设,H0：

1#和2#机加工产品外径一致（H0：

1=2）H1：

1#和2#机加工产品外径不同（H1：

12）,给定显著水平=0.05,1,2,计算样本均值,=31.970,假设检验类别双样本t检验,3,4,双侧检验,1#机：

=32.0115,2#机：

双样本t检验,计算t值,6,=1.26187,5,计算样本合并样本标准差,=0.0957,1#机：

=0.104,2#机：

Sw,S1,S2,=0.1115,查t分布分位数表：

用算得的统计量|T值|=1.26187与相应自由度的临界值t/2（n1+n2-2）=2.024作比较,7,t/2（n1+n2-2）=t0.025（38）=2.024,|T值|t/2（n1+n2-2）,双样本t检验,结论,8,|T值|t/2（n1+n2-2）,=0.025,=0.025,临界值,临界值,1=95%,=0.05,无法拒绝H0,t/2（n1+n2-2）,-t/2（n1+n2-2）,（对应自由度n1+n2-2）,拒绝零假设,拒绝零假设,不拒绝H0范围,-2.024,2.024,|T值|1.26187,|T值|临界值t/2（n1+n2-2）在不拒绝H0范围内无法拒绝零假设，即以95%的置信度认为：

1#和2#机加工产品外径一致,补充阅读,用Excel查t分布分位数,比如查t0.025（38）,任选一单元格,Probability为对应于双尾t分布的概率（/2=0.025，本例中=0.05）。

Degrees_freedom为分布的自由度（本例中：

38）。

单元格输入=INV（0.05,38）回车,看临界值t/2,用Excel的INV（probability,degrees_freedom）计算t分布的分位数,与上页查表（t0.025（38）=2.024）结果相同,注*Excel的INV（probability,degrees_freedom）是双侧检验即，输入计算用的是/2。

双样本t检验,补充阅读,用Excel计算双样本t检验P-值,我们用Excel的TDIST（x,degrees_freedom,tails）计算t分布的概率,任选一单元格,单元格输入=TDIST（1.26187,38,2）回车,看看P-值=0.214686201,t=1.26187,自由度=38,2:

双侧检验,即：

认为：

“1#和2#机加工产品外径一致”,P-值=0.2147=0.05无法拒绝零假设H0,1.26187,2.024,=0.025,自由度df=38,功效分析,双样本t检验,双侧检验,评价检验功效,前面假设检验的例子中,各抽取产品20个样本,用算得的统计量与相应的临界值作比较t=1.26187t/2（n1+n2-2）=2.024；或（P值=0.2147=0.05）出了不拒绝零假设的统计结论。

当H0为假时正确否定它的概率（p=1）,双侧检验,Power=1t（2.024-1.26187）+t（-2.024-1.26187）=1t（0.76213）+t（-3.28587）=0.226+0.001=0.227,t:

t分布的累积分布函数,将标准差SW=0.104、=3.162278和ta/2（2n-2）=2.024及,样本实际均值的差=32.0115-31.970=0.0415代入，解出：

检验功效Power=0.227可见该研究的检验功效不够,这里，犯第II类错误（当H0为伪时我们接受零假设，取伪错误）的概率=77.3%,Power=1t（ta/2（2n-2）,）+t（-ta/2（2n-2）,）,=1.26187,功效分析,双样本t检验,双侧检验,当H0为假时正确否定它的概率（p=1）,双侧检验,Power=1t（2.024-3.0407）+t（-2.024-3.0407）=1t（-1.0167）+t（-5.0647）=10.157863014+0.0000054=0.842,t:

t分布的累积分布函数,假定标准差SW=0.104=3.162278均值的差=0.1,检验功效Power=0.842，可见在规定容许差值=0.1的情况下，该研究的检验功效较高。

这里，犯第II类错误（当H0为伪时我们接受零假设，取伪错误）的概率=15.8%,Power=1t（ta/2（2n-2）,）+t（-ta/2（2n-2）,）,=3.0407,规定容许差值评价检验功效,上页中,检验功效Power=0.227、检验功效不够；然而检测的差值是我们关注的并且有意义的吗？

例子4中，如果希望确定2#机改进后加工的产品的外径尺寸与1#机按原有方式加工的产品的外径尺寸值是否相差在0.1mm之内；否则，就被检测出来（检验功效要高），那么就主观规定容许误值=0.1,ta/2（2n-2）=2.024,=3.0407,样本数量分析,双样本t检验,双侧检验,双侧检验,规定容许差值估算样本数量,上页中,主观规定容许误值=0.1，检验功效Power=0.842。

如果我们希望功效Power=0.9（即=0.1），需要抽取产品样本多少个？

再作检验之前，为确定2#机改进后加工的产品的外径尺寸与1#机按原有方式加工的产品的外径尺寸值是否相差在0.1mm之内；并且希望检验功效Power=0.9，需要的样本数量估计是多少？

设：

=0.05，=0.10,两样本含量相等时（n1=n2=n）,注意：

公式计算样本数量n时等式右侧也包含和n相关的自由度，我们也是需要多次试算（迭代）；才能找到需要的样本数量。

我们通常用正态分布代替t分布得到估的样本数量n，得到的n做为自由度参数放到等式右侧来估算样本数量。

有时我们会把它再带回功效Power公式试算一下功效，再做些适当调整。

标准差=0.104均值的差=0.1,Z=Z0.1=1.28,Z/2=Z0.025=1.96,=20.9952,假定：

估计需要抽取产品样本各21个,用正态分布代替t分布得到的样本数量是近似值，后面我们用n=22计算一下Power,双样本t检验,双侧检验,Power=1t（2.02-3.19）+t（-2.02-3.19）=1t（-1.17）+t（-5.21）=10.1243+0.0000027=0.876,SW=0.104=3.317=0.1,Power=1t（ta/2（2n-2）,）+t（-ta/2（2n-2）,）,ta/2（2n-2）=t0.025（46）=2.013,接上页,在上页例子中,查正态分布表得到Z0.05/2=1.96、Z=Z0.1=1.28以此为基础估计出：

需要样本数量n=22。

=3.19,也可以用Excel计算分位数：

查t分布分位数表（见下表）：

t0.025（42）t0.025（40）=2.02,TINV（probability,degrees_freedom）,双尾值，概率为0.05，自由度为42,t0.025（42）=2.018,公式中,样本数量各22个，功效Power=0.876，距希望功效0.9还差那么一点。

下面我们把样本数量再增加那么一点，比如，用n=24，再试算一下功效Power。

ta/2（2n-2）=t0.025（46）=2.02,=3.331,Power=1t（2.013-3.331）+t（-2.013-3.331）=1t（-1.313）+t（-5.344）=10.0978+0.0000014=0.9022,检验功效Power=0.9，需要的样本数量估计是n1=n2=24,两样本含量相等时,SW=0.104=0.1,假设检验的例子（7）,双样本t检验,标准差未知。

估计，标准差1=2。

方差一致性检验后面讨论,建立检验假设,H0：

212#配方比1#配方产品断裂伸长率”方面无增加H1：

212#配方比1#配方产品断裂伸长率”方面有增大,给定显著水平=0.05,1,2,计算样本均值,=623.73,假设检验类别双样本t检验,3,4,右单侧检验,1#配方：

=516.09,2#配方：

单侧检验,我们生产的一种低密度聚乙烯产品；市场需求一种新产品在“断裂伸长率”方面再增加10%。

项目小组改进了配方。

希望“断裂伸长率”平均值能增加10%（增加数值为100）。

确定：

改进后加工的产品1#按原有配方加工常规产品为2#。

我们先回顾双样本t检验的单侧检验,接上页,双样本t检验,单侧检验,计算t值,6,=39.355,5,计算样本合并样本标准差,=9.765,=9.0714,Sw,S1,S2,=8.32,1#配方：

2#配方：

查t分布分位数表：

用算得的统计量|T值|=39.355与相应自由度的临界值t（n1+n2-2）=1.68比较,7,t（n1+n2-2）=t0.05（42）=1.68,如果觉得表中查不到自由度=42的t值，也可以用Excel计算分位数：

TINV（probability,degrees_freedom）,Excel计算双尾值，概率为=0.05要输入0.1,t0.05（42）=1.68,拒绝H0,结论,8,|T|t（n1+n2-2）在拒绝域,2#配方比1#配方产品断裂伸长率”方面有增大,双样本t检验,补充阅读,用Excel计算双样本t检验P-值,我们用Excel的TDIST（x,degrees_freedom,tails）计算t分布的概率,任选一单元格,单元格输入=TDIST（39.355,42,1）回车,看看P值=0（4.4*10-35）,t=39.355,自由度=42,1:

单侧检验,即，认为：

P-值=0=0.05拒绝零假设H0,t=39.355概率P值（t，42）=?

t=1.68概率P（t，42）=0.05,自由度df=42,单侧检验（右）,临界值,1=95%,=0.05,（对应自由度n1+n2-2）,拒绝零假设,t=1.68,不拒绝零假设,t=39.355,2#配方产品断裂伸长率比1#配方产品断裂伸长率大,在假设检验的例子（7）中我们关心的是：

项目小组改进了配方后，“断裂伸长率”平均值能否增加10%以上（增加数值100）的希望能否达到。

双样本t检验,建立检验假设,H0：

2-11002#配方比1#配方产品断裂伸长率增加不超过100H1：

2-11002#配方比1#配方产品断裂伸长率增加值超过100,1,2,3,4,单侧检验,我们重新做双样本t检验的单侧检验（右）,规定最小差值,第步同前,5,计算t值,6,=2.79,查t分布