t检验与F检验.docx
- 文档编号:27347484
- 上传时间:2023-06-29
- 格式:DOCX
- 页数:20
- 大小:29.36KB
t检验与F检验.docx
《t检验与F检验.docx》由会员分享,可在线阅读,更多相关《t检验与F检验.docx(20页珍藏版)》请在冰豆网上搜索。
t检验与F检验
1,T检验和F检验的由来
一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计
学家所开发的一些统计方法,进行统计检定。
通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布(probability
distribution)进行比较,我们可以知道在多少%的机会下会得到目前的结果。
倘若经比较后
发现,出现这结果的机率很少,亦即是说,是在机会很少、很罕有的情况下才出现;那我们便可以有信心的说,这不是巧合,是具有统计学上的意义的(用统计学的话讲,就是能够拒
绝虚无假设nullhypothesis,Ho)。
相反,若比较后发现,出现的机率很高,并不罕见;那我们便不能很有信心的直指这不是巧合,也许是巧合,也许不是,但我们没能确定。
F值和t值就是这些统计检定值,与它们相对应的概率分布,就是F分布和t分布。
统计显
著性(sig)就是出现目前样本这结果的机率。
2,统计学意义(P值或sig值)
结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。
专业上,p值为结果
可信程度的一个递减指标,p值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。
p值是将观察结果认为有效即具有总体代表性的犯错概率。
如p=0.05提示
样本中变量关联有5%的可能是由于偶然性造成的。
即假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个实验中有一个实验,我们所研究的变量关联将等于或强于
我们的实验结果。
(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结
果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。
)在许多研究领域,0.05的p值通常被认为是可接受错误的边界水平。
3,T检验和F检验
至於具体要检定的内容,须看你是在做哪一个统计程序。
举一个例子,比如,你要检验两独立样本均数差异是否能推论至总体,而行的t检验。
两样本(如某班男生和女生)某变量(如身高)的均数并不相同,但这差别是否能推论至总体,代表总体的情况也是存在著差异呢?
会不会总体中男女生根本没有差别,只不过是你那麼巧抽到这2样本的数值不同?
为此,我们进行t检定,算出一个t检定值。
与统计学家建立的以「总体中没差别」作基础的随机变量t分布进行比较,看看在多少%的
机会(亦即显著性sig值)下会得到目前的结果。
若显著性sig值很少,比如<0.05(少於5%机率),亦即是说,「如果」总体「真的」没有差
别,那麼就只有在机会很少(5%)、很罕有的情况下,才会出现目前这样本的情况。
虽然还
是有5%机会出错(1-0.05=5%),但我们还是可以「比较有信心」的说:
目前样本中这情况(男女生出现差异的情况)不是巧合,是具统计学意义的,「总体中男女生不存差异」的虚无假设应予拒绝,简言之,总体应该存在著差异。
每一种统计方法的检定的内容都不相同,同样是t-检定,可能是上述的检定总体中是否存在
差异,也同能是检定总体中的单一值是否等於0或者等於某一个数值。
至於F-检定,方差分析(或译变异数分析,AnalysisofVarianee),它的原理大致也是上面说的,但它是透过检视变量的方差而进行的。
它主要用于:
均数差别的显著性检验、分离各有
关因素并估计其对总变异的作用、分析因素间的交互作用、方差齐性(EqualityofVariances)
检验等情况。
4,T检验和F检验的关系
t检验过程,是对两样本均数(mean)差别的显著性进行检验。
惟t检验须知道两个总体的方
差(Variances)是否相等;t检验值的计算会因方差是否相等而有所不同。
也就是说,t检验
须视乎方差齐性(EqualityofVariances)结果。
所以,SPSS在进行t-testforEqualityof
Means的同时,也要做Levene'sTestforEqualityofVariances。
1.
在Levene'sTestforEqualityofVariances—栏中F值为2.36,Sig.为.128,表示方差齐性
检验「没有显著差异」,即两方差齐(EqualVariances),故下面t检验的结果表中要看第一排的数据,亦即方差齐的情况下的t检验的结果。
2.
在t-testforEqualityofMeans中,第一排(Variances=Equal)的情况:
t=8.892,df=84,2-Tail
Sig=.000,MeanDifference=22.99
既然Sig=.000,亦即,两样本均数差别有显著性意义!
3.
至U底看哪个Levene'sTestforEqualityofVariances—栏中sig,还是看t-testforEqualityof
Means中那个Sig.(2-tailed)啊?
答案是:
两个都要看。
先看Levene'sTestforEqualityofVariances,如果方差齐性检验「没有显著差异」,即两
方差齐(EqualVariances),故接著的t检验的结果表中要看第一排的数据,亦即方差齐的情
况下的t检验的结果。
反之,如果方差齐性检验「有显著差异」,即两方差不齐(UnequalVariances),故接著的t
检验的结果表中要看第二排的数据,亦即方差不齐的情况下的t检验的结果。
4.
你做的是T检验,为什么会有F值呢?
就是因为要评估两个总体的方差(Variances)是否相等,要做Levene'sTestforEqualityof
Variances,要检验方差,故所以就有F值。
另一种解释:
t检验有单样本t检验,配对t检验和两样本t检验。
单样本t检验:
是用样本均数代表的未知总体均数和已知总体均数进行比较,来观察此组样
本与总体的差异性。
配对t检验:
是采用配对设计方法观察以下几种情形,1,两个同质受试对象分别接受两种
不同的处理;2,同一受试对象接受两种不同的处理;3,同一受试对象处理前后。
F检验又叫方差齐性检验。
在两样本t检验中要用到F检验。
从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是
否相同,即方差齐性。
若两总体方差相等,则直接用t检验,若不等,可采用t'检验或变量
变换或秩和检验等方法。
其中要判断两总体方差是否相等,就可以用F检验。
若是单组设计,必须给出一个标准值或总体均值,同时,提供一组定量的观测结果,应用t
检验的前提条件就是该组资料必须服从正态分布;若是配对设计,每对数据的差值必须服从
正态分布;若是成组设计,个体之间相互独立,两组资料均取自正态分布的总体,并满足方
差齐性。
之所以需要这些前提条件,是因为必须在这样的前提下所计算出的t统计量才服从
t分布,而t检验正是以t分布作为其理论依据的检验方法。
简单来说就是实用T检验是有条件的,其中之一就是要符合方差齐次性,这点需要F检验
来验证。
1、问:
自由度是什么?
怎样确定?
答:
(定义)构成样本统计量的独立的样本观测值的数目或自由变动的样本观测值的数目。
用df表示。
自由度的设定是出于这样一个理由:
在总体平均数未知时,用样本平均数去计算离差(常用
小s)会受到一个限制一一要计算标准差(小s)就必须先知道样本平均数,而样本平均数和n都知道的情况下,数据的总和就是一个常数了。
所以,最后一个”样本数据就不可以变
了,因为它要是变,总和就变了,而这是不允许的。
至于有的自由度是n—2什么的,都是
同样道理。
在计算作为估计量的统计量时,引进一个统计量就会失去一个自由度。
通俗点说,一个班上有50个人,我们知道他们语文成绩平均分为80,现在只需要知道
49个人的成绩就能推断出剩下那个人的成绩。
你可以随便报出49个人的成绩,但是最后一
个人的你不能瞎说,因为平均分已经固定下来了,自由度少一个了。
简单点就好比你有一百块,这是固定的,已知的,假设你打算买五件东西,那么前四件你可以随便买你想买的东西,只要还有钱的话,比如说你可以吃KFC可以买笔,可以买衣
服,这些花去的钱数目不等,当你只剩2块钱时,或许你最多只能买一瓶可乐了,当然也
可以买一个肉松蛋卷,但无论怎么花,你都只有两块钱,而这在你花去98块那时就已经定
下来了。
(这个例子举的真不错!
!
)
2、问:
X方检验中自由度问题
答:
在正态分布检验中,这里的M(三个统计量)为N(总数)、平均数和标准差。
因为我们在做正态检验时,要使用到平均数和标准差以确定该正态分布形态,此外,要计算出各个区间的理论次数,我们还需要使用到N。
所以在正态分布检验中,自由度为K—3。
(这一条比较特别,要记住!
)
在总体分布的配合度检验中,自由度为K—1。
在交叉表的独立性检验和同质性检验中,自由度为(r—1)X(c—1)。
3、问:
t检验和方差分析有何区别
答:
t检验适用于两个变量均数间的差异检验,多于两个变量间的均数比较要用方差分析。
用于比较均值的t检验可以分成三类,第一类是针对单组设计定量资料的;第二类是针对配对设计定量资料的;第三类则是针对成组设计定量资料的。
后两种设计类型的区别在
于事先是否将两组研究对象按照某一个或几个方面的特征相似配成对子。
无论哪种类型的t
检验,都必须在满足特定的前提条件下应用才是合理的。
若是单组设计,必须给出一个标准值或总体均值,同时,提供一组定量的观测结果,应用t
检验的前提条件就是该组资料必须服从正态分布;若是配对设计,每对数据的差值必须服从
正态分布;若是成组设计,个体之间相互独立,两组资料均取自正态分布的总体,并满足方
差齐性。
之所以需要这些前提条件,是因为必须在这样的前提下所计算出的t统计量才服从
t分布,而t检验正是以t分布作为其理论依据的检验方法。
值得注意的是,方差分析与成组设计t检验的前提条件是相同的,即正态性和方差齐性。
t检验是目前医学研究中使用频率最高,医学论文中最常见到的处理定量资料的假设检验方法。
t检验得到如此广泛的应用,究其原因,不外乎以下几点:
现有的医学期刊多在统计学方面作出了要求,研究结论需要统计学支持;传统的医学统计教学都把t检验作为假设检验
的入门方法进行介绍,使之成为广大医学研究人员最熟悉的方法;t检验方法简单,其结果
便于解释。
简单、熟悉加上外界的要求,促成了t检验的流行。
但是,由于某些人对该方法
理解得不全面,导致在应用过程中出现不少问题,有些甚至是非常严重的错误,直接影响到
结论的可靠性。
将这些问题归类,可大致概括为以下两种情况:
不考虑t检验的应用前提,
对两组的比较一律用t检验;将各种实验设计类型一律视为多个单因素两水平设计,多次用t检验进行均值之间的两两比较。
以上两种情况,均不同程度地增加了得出错误结论的风险。
而且,在实验因素的个数大于等于2时,无法研究实验因素之间的交互作用的大小。
问:
统计学意义(P值)
答:
结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。
专业上,P值为
结果可信程度的一个递减指标,P值越大,我们越不能认为样本中变量的关联是总体中各变
量关联的可靠指标。
P值是将观察结果认为有效即具有总体代表性的犯错概率。
如P=0.05
提示样本中变量关联有5%的可能是由于偶然性造成的。
即假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个实验中有一个实验,我们所研究的变量关联将等于或强
于我们的实验结果。
(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同
结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。
)
在许多研究领域,0.05的P值通常被认为是可接受错误的边界水平。
4、问:
如何判定结果具有真实的显著性
答:
在最后结论中判断什么样的显著性水平具有统计学意义,不可避免地带有武断性。
换句
话说,认为结果无效而被拒绝接受的水平的选择具有武断性。
实践中,最后的决定通常依赖
于数据集比较和分析过程中结果是先验性还是仅仅为均数之间的两两>比较,依赖于总体数
据集里结论一致的支持性证据的数量,依赖于以往该研究领域的惯例。
通常,许多的科学领
域中产生P值的结果W0.05被认为是统计学意义的边界线,但是这显著性水平还包含了相当
高的犯错可能性。
结果0.05>P>0.01被认为是具有统计学意义,而0.01>P>0.001被认为
具有高度统计学意义。
但要注意这种分类仅仅是研究基础上非正规的判断常规。
5、问:
所有的检验统计都是正态分布的吗?
答:
并不完全如此,但大多数检验都直接或间接与之有关,可以从正态分布中推导出来,如
t检验、F检验或卡方检验。
这些检验一般都要求:
所分析变量在总体中呈正态分布,即满足所谓的正态假设。
许多观察变量的确是呈正态分布的,这也是正态分布是现实世界的基本
特征的原因。
当人们用在正态分布基础上建立的检验分析非正态分布变量的数据时问题就产生了,(参阅非参数和方差分析的正态性检验)。
这种条件下有两种方法:
一是用替代的非参数检验(即无分布性检验),但这种方法不方便,因为从它所提供的结论形式看,这种方法统计效率低下、不灵活。
另一种方法是:
当确定样本量足够大的情况下,通常还是可以使
用基于正态分布前提下的检验。
后一种方法是基于一个相当重要的原则产生的,该原则对正
态方程基础上的总体检验有极其重要的作用。
即,随着样本量的增加,样本分布形状趋于正
态,即使所研究的变量分布并不呈正态。
6、问:
假设检验的内涵及步骤
答:
在假设检验中,由于随机性我们可能在决策上犯两类错误,一类是假设正确,但我们拒
绝了假设,这类错误是弃真”错误,被称为第一类错误;一类是假设不正确,但我们没拒绝假设,这类错误是取伪”错误,被称为第二类错误。
一般来说,在样本确定的情况下,任何决策无法同时避免两类错误的发生,即在避免第一类错误发生机率的同时,会增大第二类错
误发生的机率;或者在避免第二类错误发生机率的同时,会增大第一类错误发生的机率。
人
们往往根据需要选择对那类错误进行控制,以减少发生这类错误的机率。
大多数情况下,人
们会控制第一类错误发生的概率。
发生第一类错误的概率被称作显著性水平,一般用a
表示,在进行假设检验时,是通过事先给定显著性水平a的值而来控制第一类错误发生的
概率。
在这个前提下,假设检验按下列步骤进行:
1)、确定假设;
2)、进行抽样,得到一定的数据;
3)、根据假设条件下,构造检验统计量,并根据抽样得到的数据计算检验统计量在这次抽样中的具体值;
4)、依据所构造的检验统计量的抽样分布,和给定的显著性水平,确定拒绝域及其临界
值;
5)、比较这次抽样中检验统计量的值与临界值的大小,如果检验统计量的值在拒绝域内,则拒绝假设;
到这一步,假设检验已经基本完成,但是由于检验是利用事先给定显著性水平的方法来控制犯错概率的,所以对于两个数据比较相近的假设检验,我们无法知道那一个假设更容易犯错,
即我们通过这种方法只能知道根据这次抽样而犯第一类错误的最大概率(即给定的显著性水
平),而无法知道具体在多大概率水平上犯错。
计算P值有效的解决了这个问题,P值其
实就是按照抽样分布计算的一个概率值,这个值是根据检验统计量计算出来的。
通过直接比
较P值与给定的显著性水平a的大小就可以知道是否拒绝假设,显然这就代替了比较检验统计量的值与临界值的大小的方法。
而且通过这种方法,我们还可以知道在p值小于a的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 检验