检验假设Word文档下载推荐.docx
- 文档编号:21300088
- 上传时间:2023-01-29
- 格式:DOCX
- 页数:13
- 大小:95.66KB
检验假设Word文档下载推荐.docx
《检验假设Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《检验假设Word文档下载推荐.docx(13页珍藏版)》请在冰豆网上搜索。
③若知道少年大学生总体的均值,则可以直接比较孰高孰低。
但不知道它的确切值,只知道其中一个70人随机样本的均值为103.3。
根据之前的分析,我们无法利用上述(*)式所表达的抽样分布知识来判断103.3的相对位置。
因此这种顺推的办法行不通。
④采用反证法,如果假设“少年大学生群体的智商和一般同龄人没有显著差异”会是怎样的情况呢?
要是这样,则μ=100,σ=15。
根据抽样分布理论,这是我们可以判断样本均值103.3所处的该总体中的位置(也即103.3所代表的样本相当于从一般同龄人中抽取):
⑤查正态分布表可知,Z=1.645以上的概率是5%,Z=1.84以上的概率更小。
所以在前面的假设下(未知总体均值为100),一次抽样就抽到均值为103.3的样本是一个“小概率事件”,是几乎不可能发生的。
因此我们所做的假设及其基础上的推导与实际抽样结果之间就产生了矛盾,从而判断最初的假设不成立,103.3所来源的样本不可能来自于假设的一般同龄人总体,而是来自于另一个总体。
即得到结论:
少年大学生智商不同于一般同龄人;
进一步103.3处在已知常模总体最右端的5%的范围内,因此其所在样本也不可能来自于比该已知总体更小的总体(否则其发生概率更小),所以证实少年大学生智商比一般同龄人更高。
以上就是假设检验的基本思想,实际上在日常生活中我们时常使用这种思想。
看下面的例子:
购买商品
做正误题
智力测验
假设及其推论
若商家保证99%的正品即只有1%的次品
若完全不会做题,做对10题中的8题的概率是4.4%
若总体均值等于常模均值100则由70人组成的样本平均数为103.3的概率小于5%。
实际情况
买了一件,结果是次品
某同学做对了8题
70人的样本平均数为103.3,Z分数为1.84。
结论
商家可能有欺骗行为
确实会做,而不是完全凭猜测做题
总体均值高于常模均值
二、假设检验中的主要概念
1、两类假设:
研究者所要关注,需要加以验证的假设称研究假设,它是根据已知理论或事实对现象所作的假定性说明;
而且往往以“差异”、“有效”、“显著”的形式表达。
这是科学研究的一般规律,是产生新发现的必然需要。
例如“少年大学生智力高于一般水平”、“某种抑郁治疗药物有效”、“三种不同的教学方法效果间存在显著差异”、“学业成绩和学习动机强度之间存在显著的相关”等,研究假设通常记为H1。
研究假设往往不能直接加以验证而必须借助于反证法,即取其对立面,即首先假设两者无差异,把这种包含等式的假设称无差假设、零假设或虚无假设(nullhypothesis),记为H0。
例如:
H1:
μ>μo;
H0:
μ≤μo。
由上述假设检验基本思想可知,零假设为统计推导提供了一个桥梁,它将未知参数的总体之样本均值和已知的总体参数两者联系起来,从而我们可利用抽样分布知识对样本均值的情况进行判断。
零假设非常重要;
研究假设则站在零假设的对立面,因而也称为对立假设或备择假设。
2、小概率事件原理和显著性水平:
小概率事件原理是假设检验做出统计决策的主要依据,它决定了推导结果是否和抽样事实发生矛盾从而零假设是否正确。
而判断零假设是否正确的那个小概率标准就称为显著性水平,记作α,通常取α=0.05或0.01。
显著性水平在零假设下样本均值的抽样分布右侧截出一段区域,如下图所示,在H0为真条件下,图中左边实线即为
的抽样分布,其右侧尾端截出5%的面积(图中浅灰色)。
3、接受域和拒绝域:
上图中,若均值的Z值落入该区域(计算得到的Z统计量值对应的尾端概率小于0.05)或者Z分数超过检验临界值(尾端概率0.05对应的Z值),则拒绝H0而接受H1,称该区域为H0的拒绝域(regionofrejection);
反之若落在临界值左侧区域则接受H0而拒绝H1,称H0的接受域(regionofacceptance)。
若拒绝了H0则说明该样本均值来自于H0拒绝域中的另一个不同的总体μ(虚线)。
4、两类错误:
根据样本均值落入接受域或拒绝域得出接受或拒绝H0的结论是基于小概率事件原理。
但这种结论可能会犯两种错误:
一是H0实际成立却否定了它(落入图中浅灰色区域),称弃真错误或第Ⅰ型错误、α型错误——即“错误地丢弃了真实的H0”,统计量Z值不论多大其尾端仍有概率,只是推断时将其作为小概率事件忽略不计了,做出正确结论的概率只有95%,而不是100%。
二是H0实际不成立却接受了它(落入图中深灰色区域),称取伪错误或第Ⅱ型错误、β型错误——即“错误地择取了虚假的H0”。
注意,β区域是在H1成立(虚线的总体μ存在)前提下真实抽样分布尾端被α概率临界值截出的区域(图中总体μ中α临界值左侧部分);
原本来自于总体μ,却因落入了H0的接受域而被误认为来自于μ0。
下表给出了各种不同条件下做出不同统计结论所对应的概率:
真实情况
H0为真
H1为真
决策结果
拒绝Ho
错误拒绝:
P(拒绝Ho)=α
正确拒绝:
P(拒绝Ho)=1-β
接受Ho
正确接受:
P(接受Ho)=1-α
错误接受:
P(接受Ho)=β
例如,对于法官的判案,法官也必须面对Ho(被告无罪)与H1(被告有罪)的决择,如果被告确实是无辜,却判为有罪,就是法官犯了α错误,如果被告确实有犯罪事实却宣判无罪,则法官犯了β错误。
但一般来说,法官们的信条应该是“宁可误判无罪,也不应累及无辜”,而不应“宁可错杀一千,不可漏掉一个”。
因此,控制α错误显得更为重要。
①α,β是在两个不同前提下的概率,是一次假设检验的两个可信度指标,但一次实际的检验决策中只可能犯其中的一种错误,因为真实情况要么是H0为真,要么是H1为真。
②在其它条件不变时,α,β不能同时减小或增大,一般在假设检验中主要关心的是能否有理由拒绝Ho,从而证实H1,所以在统计中规定得较严,这是因为我们要求的是H0为真时统计量落入的区域越小(小概率越小),我们拒绝就越理直气壮,理由越充分。
③1-β反映的是正确辩认真实差异的能力,在统计中称1-β为统计检验力,统计功效(power)。
5、两种检验:
上述检验主要关心未知总体均值是否显著大于已知参数,即样本均值比正常水平(100)多出的3.3是代表了真实的差异还是因为随机误差所致,称为单侧检验(one-tailedtest),即将拒绝域置于抽样分布一端(例中放在右侧),换句话说,只需判断该样本均值是否大于(超过)此时的右侧临界值即可得出结论。
类似例子还有采用某种新的教学方法时抽样得学生的平均成绩比原来提高5分,要判断新方法是否有效(新方法下的总体均值是否显著大于旧方法)。
但有时无法事先断定两个参数的相对位置,只能笼统地判断两个参数是否有显著差异,这时检验的拒绝域(概率为α)被分配在抽样分布的两侧(每侧α/2),称双侧检验(two-tailedtest)。
注意这两种检验时假设的写法。
双侧检验要求查双侧概率值,单侧检验要求查单侧概率值。
双侧检验,判定等于关系,如:
Ho:
μ=μoH1:
μ≠μo
单侧检验,判定大小关系,如:
μ≤μoH1:
μ>μo
或:
Ho:
μ≥μoH1:
μ<μo
采用单侧或是双侧检验,主要看研究者的检验目的以及问题是否提供了关于参数相对大小的信息。
注意,单侧检验零假设虽然是“≤”,但检验时只利用了相等的条件,只要统计量Z值大于右侧临界值(Zα)即可否定零假设中的所有情形而接受备择假设;
而双侧检验中,Z值大于右侧大的临界值(Zα/2)或小于左侧小的临界值(-Zα/2)都可拒绝零假设。
三、假设检验的一般步骤
1、提出假设(Ho和H1);
通常可以先写出H1再写出H0;
可以用符号表示,也可以用语言描述(非参数检验中)。
2、选择适当的统计量U(如Z、t、χ2、F等),要求U必须有精确分布,并包含被检验的总体参数,且无未知量;
非参数检验未必有精确分布,但都有类似的统计检验表。
3、根据样本值计算统计量U的值u;
4、根据给定的小概率(显著性水平)α,和U的概率分布,查表找出U1α和U2α(双侧检验的情况),使得P(U1α<
U<
U2α)=1-α,U1α和U2α为临界值。
5、统计决策,若u∈(-∞,U1α)或u∈(U2α,+∞)则拒绝Ho,接受H1,否则接受H1,拒绝Ho。
通常,α越小,U1α和U2α越极端,拒绝Ho越不容易。
第二节总体均值的假设检验
总体均值的假设检验包括显著性检验和差异显著性检验两部分。
一、均值显著性检验
显著性检验是指通过从某一总体中抽取出的样本来判断这一总体的均值与某一已知值的大小关系。
根据抽样分布理论,样本平均数服从以总体均值为均值,以总体方差的n分之一为方差的正态分布,在总体方差已知时,可转化为标准正态分布;
若总体方差未知,则可用T分布。
因此总体均值的显著性检验的计算公式一般根据总体的方差是否已知分成两种情况:
方差已知时:
方差未知时:
上面两式中的分母一般都称为标准误,用SE表示。
一般情况下,实际当中是不知道总体的方差的,因此方差未知时的计算公式用得更多。
【例1】
(教材P127例5-1)某校高一年纪试用一种新的教学法,原教学法下数学考试平均成绩为79(μo),标准差为11(σo)。
新教学法下,随机抽取一个30人样本,其数学考试平均成绩为84分。
问能否在总体上说新的教学法与原教学法有差异。
解:
教材中的解法有些类似参数估计,这是解释假设检验过程的另一种思路。
这里我们采用上述的思路:
⑴用μ代表新教学法下的成绩。
根据题意,这里可看成是一个双侧检验,因此提出如下假设,Ho:
μ=μo=79H1:
μ≠μo=79
⑵根据已知条件,选用方差已知时的公式,在μ=μo=79的条件下有:
⑶在标准正态分布中,双侧概率为0.05时所对应的Z值为1.96,显然Z>
1.96,正好样本均值落入Ho的拒绝域(1.96,∞)中,所以应该拒绝零假设,接受备择假设,即认为新旧教学法教学效果确实存在显著差异。
【例2】某心理学家认为一般汽车司机的视反应时平均185毫秒,有人随机抽取36名汽车司机作为研究样本进行了测定,结果平均值为180毫秒,样本标准差25毫秒。
能否根据测试结果否定该心理学家的结论(假定人的视反应时符合正态分布)。
⑴用μ代表汽车司机的视反应时的平均水平,根据题意,这是一个双侧检验,因此提出如下假设,Ho:
μ=μo=185H1:
μ≠μo=185
⑵由于这里并不知道总体的方差,因此采用方差未知时的公式,在Ho:
μ=μo=185的条件下有:
⑶查T分布表得,t0.05/2(35)≈2.031,而-2.031<
-1.2<
2.031,所以没有超过临界值,因此接受零假设,认为该心理学家的结论基本上是正确的。
二、均值差异显著性检验
总体均值的差异显著性检验是指通过从两总体中抽取出的样本来判断这两总体的均值的大小关系。
其原理仍然主要是依据抽样分布理论,不过还应稍作推导。
总体均值的差异显著性检验所对应的假设是,Ho:
μ1=μ2H1:
μ1≠μ2,由于这些假设的两端都是未知量,不便于进行检验,可以将它们变换成:
μD=0
H1:
μD≠0,其中μD=μ1-μ2
这样,差异检验的问题就变成显著性检验问题了。
我们再去构造一个统计量,它与μD=μ1-μ2以及两样本平均数有关。
我们知道两服从正态分布的随机变量的和或差仍然服从正态分布,即有:
又根据抽样分布理论知道,样本平均数服从正态分布,代入上式即有:
这里标准误
的计算分两种情形:
两总体独立时:
两总体相关时:
现在就和均值的显著性检验的情况相似了,根据样本信息去判断总体均值μD是否等于0。
根据不同的条件,均值的差异显著性检验可以分出很多种情况,同学们学习时一定要注意各种公式使用的条目,最主要的是要区分独立样本和相关样本,以及总体方差是否已知,实际中方差未知且不相等时的公式使用较少;
而相关样本的两个公式只是计算方法不同而已,一个是用原始数据,一个是用中间数据。
下表中的公式时最常用的,其中的方差都表示样本方差。
独立(r=0)
相关(r≠0)
小
样
本
R
未
知
大
已
【例3】将20名小朋友随机分成两组进行走迷宫实验,一组让它们在实验之前在迷宫里先玩耍半小时(称为探索时间),这一组称为实验组;
另一组作为控制组不给予事先的探索时间。
正式实验时,记录下小朋友记住迷宫以达到一次走完而不出错的标准所需的时间,结果如后,假设实验结果服从正态分布,试检验有无事先探索时间对小朋友走迷宫是否有显著的影响。
实验组
6
2
4
3
5
6
4
控制组
4
7
5
利用第三节中的方差的差异显著性检验可以检验两总体的方差是相等的。
因此本题是正态分布、两总体相互独立和总体方差未知但相等的条件下求解:
查T分布表得t0.05/2(10+10-2)=t0.05/2(18)=2.101,因此在0.05的显著性水平下,或有95%的把握说,两总体均值的差异不显著,即有无事先的探索时间对小朋友走迷宫无显著的影响。
【例4】从某地区的六岁儿童中随机抽取男童46人,测量身高,平均数为114cm,标准差为5cm,抽取女童36人,平均身高为112.5cm,标准差为6.5cm,问该地区六岁男女儿童身高是否有显著差异?
假设儿童的身高不服从正态分布。
由于总体不服从正态分布,但样本容量比较大,可以采用近似正态检验进行计算。
显然1.145<
1.96=Z0.05/2,因此在0.05的显著性水平下,或者说有95%的把握,该地区六岁男女儿童身高无显著差异。
【例5】某研究者认为哥哥比弟弟更具创造性,故随机抽取10对兄弟进行创造性测验,结果如下,假设测验成绩符合正态分布。
问应如何评价该研究者的看法?
哥哥:
65 48 63 52 61 53 63 70 65 66 合计
弟弟:
61 42 66 52 47 58 65 62 64 69
D
6 -3
0
14 -5 -2
8
1 -3
20
D2
16 36
9
0 196 25
4 64
1
9 360
显然这是相关总体,而且假设服从正态分布,根据所给的数据,采用相关系数未知的公式:
查表得:
t0.05(10-1)=t0.05(9)=1.833(因为比较的是好不好,所以用单侧),t=1.06<t0.05(9)=1.833,所以在0.05的显著性水平下,或有95%的把握说,哥哥并不比弟弟更具创造性。
第一节其他假设检验
总体均值的假设检验是需要重点掌握的,关于方差、相关系数以及比例的假设检验不做掌握的要求。
这里只作为一个介绍,以让大家了解假设检验的基本原理及其全貌。
一、方差的假设检验
1、方差的显著性检验:
现在我们知道,显著性检验都是关于单个总体参数的推断统计。
总体方差的显著性检验是指通过从某一总体中抽取出的样本来判断这一总体的方差与某一已知值的大小关系,因此零假设表示Ho:
σ2=σ2o,根据抽样分布理论,(n-1)倍的样本方差与总体方差之比服从自由度为(n-1)卡方分布,检验公式为:
其Ho的拒绝域是χ2>
χ2(α/2)或χ2>
χ2(1-α/2),用图形表示如下:
(教材P154例5-16)一次全市统考中,全体学生的总方差是182,从某校随机抽取的51名学生的方差为122,问该校学生成绩的方差与全市方差是否有显著差异?
σ2o=182=324,S2n-1=122=144,n=51
查自由度为51-1=50的卡方表,得
χ2(0.05/2)=χ2(0.025)=71.4,χ2(1-0.05/2)=χ2(0.975)=32.4
22.22<
32.4=χ2(1-0.05/2)则认为该校学生成绩的方差与全市方差之间存在显著差异。
2、方差的差异显著性检验:
总体方差的差异显著性检验是指通过从两总体中抽取出的样本来判断这两总体的方差的大小关系,因此零假设为表示为Ho:
σ21=σ22,为了便于利用抽样分布理论,可将该假设变为Ho:
σ21/σ22=1,在抽样理论中曾讲到,总体服从正态分布的两样本方差之比服从F分布,即:
通常可以用较大的方差作分子,较小的方差作分母,所以在实际中查表时,只用单侧F分布表。
具体请参照教材的例题。
二、相关系数的假设检验
主要指相关系数的显著性检验,即在进行相关分析(参见第二章有关解释)时,对基于样本数据计算得来的样本相关系数进行检验,以判断样本数据的相关是否能代表总体真实的相关。
根据相关系数的抽样分布,相关系数的显著性检验可能用到如下公式,其中第一种情况最常见,第二种情况相当于相关系数的单侧检验。
【例2】某幼儿园在儿童入园时对49名儿童进行比奈智力测验,一年后再对同组被试施测,结果两次测验结果的相关系数为0.74,问两次测验的相关是否显著?
所以,有95%的把握说,两次测验的相关显著。
【例3】某研究者认为哥哥比弟弟更具创造性,故随机抽取10对兄弟进行创造性测验,结果如下,假设测验成绩符合正态分布。
问应兄弟之间的创造性相关系数是否高于0.5?
65486352615363706566
61426652475865626469
有95%的把握说,兄弟之间的创造性相关系数不高于0.5。
极少的情况,也可能用到相关系数的差异显著性检验,其抽样分布也是利用FisherZ分布。
请参见教材。
最后,关于比例的假设检验也不再赘述,有兴趣的同学可以参照教材学习;
实际上,有关比例的假设检验所要解决的问题在第八章中都能找到替代办法。
阅读材料
理解假设检验的原理,不妨结合法官判案的例子。
法官判案也是一个利用已知信息在“有罪”和“无罪”两种假设之间做出判定和选择的决策过程。
H0是无罪,H1是有罪,我们的立论出发点是H0,我们只能说有充分的证据证明(P<
a)被告有罪(H1成立),但通常不能说有充分的证据(P>
a)证明被告无罪(H0成立),因为不可能将所有的证据都收齐呀。
说某人无罪(H0成立)只是因为没有找到其有罪(H1成立)的证据。
你能够根据假设检验的有关原理列出法官断案过程中可能碰到的四种情况吗?
这四种情况的含义分别是什么?
第六章方差分析
为研究三种不同教材的教学效果,抽取三个班分别实验其中的一种教材,而对其他因素加以控制,以一段时间后测试的学习成绩来比较三种教材的效果。
对于这样的“多总体”比较问题如何解决呢?
一个很自然的想法是利用前面所学的“两总体”比较法,将多个总体进行两两组合,分别进行差异显著性检验,然后汇总出三个总体均值的差异情况。
比如说要对三个总体均值进行检验,分别用μ1,μ2,μ3表示,则需要检验如下假设:
H0:
μ1=μ2=μ3;
?
H1:
μ1≠μ2或μ1≠μ3或μ2≠μ3
用t检验则必须分别检验:
H01:
μ1=μ2H11:
μ1≠μ2;
H02:
μ1=μ3H12:
μ1≠μ3;
H03:
μ2=μ3H12:
μ1≠μ3
但这种办法存在以下几个弊端:
①进行两两t检验的次数较多,而且是随着要比较的均值个数的增长呈几何级数的增长,根据排列知识,一共是C2n次。
②两两检验无统一的实验误差,误差估计的精确性和检验的灵敏性低。
由于每次检验(如t检验)的标准误不同(因为合成的两个样本标准差不同);
自由度未充分利用。
如5个实验条件,每个条件下有6个观测值,共有30个观测值。
进行t检验时,每次只能利用两个处理共12个观测值估计误差,误差自由度为2(6-1)=10;
若能利用所有30个观测值估计误差,显然估计的精确性高,且误差自由度为5(6-1)=25。
用t检法进行检验时,误差自由度小,容易掩盖差异的显著性。
③最重要的,犯第一类错误的概率随着要比较的均值个数(总体个数)的增加而增大。
根据计算,要接受H0则必须同时
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 检验 假设