张文彤SPSS第10节初中高课程假设检验.docx
- 文档编号:29411664
- 上传时间:2023-07-23
- 格式:DOCX
- 页数:13
- 大小:316.77KB
张文彤SPSS第10节初中高课程假设检验.docx
《张文彤SPSS第10节初中高课程假设检验.docx》由会员分享,可在线阅读,更多相关《张文彤SPSS第10节初中高课程假设检验.docx(13页珍藏版)》请在冰豆网上搜索。
张文彤SPSS第10节初中高课程假设检验
假设检验
为什么要做检验?
因为取得的样本的信息
样本背后的总体是怎样的。
总体参数
参数估计:
推估样本所在的总体体征。
假设检验:
对提出的一些总体假设进行分析判断,做出统计决策。
假设检验基本原理
例如:
现有样本均数和已知总体均数不同,其差别可能有两个方面的原因造成。
其一,样本来自,已知总体,现有差别是抽样误差
其二,样本来自,其他总体,两个总体存在本质上的差异。
选择哪种解释呢?
需要借用假设检验。
基础:
小概率原理,即一般认为小概率事件在一次随机抽样中不会发生。
基本思想:
先建立一个关于样本所属总体的假设,考察在假设条件下随机样本的特征信息是否属小概率事件,若为小概率事件,则怀疑假设成立有悖于该样本所提供特征信息,因此拒绝假设。
事实上,小概率事件在随机抽样中还是可能发生的,只是发生的概率很小。
若正好碰上了,则假设检验的结论就是错误的。
当然,犯这种错误的概率很小。
一、建立假设
根据统计推断的目的而提出的对总体特征的假设。
统计学中的假设有两方面的内容:
一是检验假设(hypothesistobetested),亦称原假设或无效假设(nullhypothesis),记为H0;
二是与H0相对立的备择假设(alternativehypothesis),记为H1。
后者的意义在于当H0被拒绝时供采用。
两者是互斥的,非此即彼。
H0:
m=m0,H1:
m≠m0;
例H0:
m=7.4,H1:
m≠7.4。
二、确定检验水准
实际上就是确定拒绝H0时的最大允许误差的概率。
检验水准(sizeoftest),常用a表示,是指检验假设H0本来是成立的,而根据样本信息拒绝H0的可能性大小的度量,换言之,a是拒绝了实际上成立的H0的概率。
常用的检验水准为a=0.05,其意义是:
在所设H0的总体中随机抽得一个样本,其均数比手头样本均数更偏离总体均数的概率不超过5%
3、进行试验收集数据
所需的样本数据即从此得来
4、计算检验统计量和P值
统计量只是工具,概率值才是目的,它可以客观衡量样本对假设总体偏离程度,从H0假设的总体中抽出现有样本(及更极端情况)的概率,即P值
例如600次赢100次是H0假设的情况,只赢1次就是现有样本情况,更极端的情况就是连一次也没有赢。
检验统计量的特点
该统计量应当服从某种已知分布,从而可以计算出P值
各种检验方法所利用的分布及计算原理不同,从而检验统计量也不同
初学者往往本末倒置,很认真地在学工具,却忘记了统计学的本质是思维方式
五、得出推断结论
按照事先确定的检验水准a界定上面得到的P值,并按小概率原理认定对H0的取舍,作出推断结论
若P≤α
基于H0假设的总体情况出现了小概率事件
则拒绝H0,接受H1,可以认为样本与总体的差别不仅仅是抽样误差造成的,可能存在本质上的差别,属“非偶然的(significant)”,因此,可以认为两者的差别有统计学意义。
进一步根据样本信息引申,得出实用性的结论。
若P>αa
基于H0出现了很常见的事件
则样本与总体间的差别尚不能排除纯粹由抽样误差造成,可能的确属“偶然的(non-significant)”,故尚不能拒绝H0
因此,认为两者的差别无统计学意义,但这并不意味着可以接受H0。
例子:
关于掷筛子的假设检验
建立假设
H0:
筛子均匀,pi=1/6H1:
筛子不均匀
确定检验水准
aα=0.05
进行试验,计算检验统计量和P值
相应的试验结果在H0下对应的概率为1/600略多一点
得出推断结论
基于H0出现了小概率事件,结果有非常非常显著的统计学意义,你出老千!
假设检验应注意的问题
结论不能绝对化
本身就保留了犯错误的可能性
样本量导致的检验效能问题
样本量太小,导致检验效能不足,从而无法检出可能存在的差异
样本量太大,得出的有统计学意义的结论可能根本就没有实际意义
统计学的意义和实际价值的意义要分清。
单样本t检验
推断样本是否来自某已知总体,即要检验样本所在总体的均数是否等于已知的总体均数
为了回答该问题,统计学上采用了小概率反证法的原理:
我们有如下两种假设:
H0:
样本均数与总体均数的差异完全是抽样误差造成
H1:
样本均数与总体均数的差异除由抽样误差造成外,也反映了两个总体均数确实存在的差异
t=x-u/s(分子为均差)/(分母为标准误差)
标准误越小代表性越好。
单样本t检验在spss中的实现
选择个案——分析——单样本t检验
(显示P值,连续双击sig.)
例:
消费者信心指数以100作为基准值,现希望比较2007年12月的总消费者信心指数是否与基准值有差异
解释:
样本均值为94.1391与比较值100之间相差5.86088,p值为.000
平均差为5.86088
如果说,背后总体均数为100的话,那么在这样一个总体中抽样,得到现在极端的样本,平均差为5.86088,更极端的情况是再抽出的样本均数与100之间的差值绝对值还要大±,所有这些极端情况,在100次抽样里,连一次也没有。
我们设定的α值为0.05,而P值实际大概为10-5我们有理由认为,在原假设成立的条件下,做1次研究,得到现有极端样本的可能性是很小的。
拒绝原假设,接受备择假设。
就是该样本背后的总体均值不等于我们假设的100。
问题:
那该总体均值到底是大于100还是小于100呢?
根据样本均值估计,总体均值小于100(统计之外的推断,基于应用考虑)
方法的适用条件
因为有中心极限定理,一般均数的抽样分布都不会有问题,真正会限制该方法使用的是均数是否能够代表相应数据的集中趋势。
也就是说,只要数据分布不是强烈的偏态,一般而言单样本t检验都是适用的。
不符合t检验的条件时方法(样本不符合正态分布等)
引申:
基于计算统计学的新工具:
Boostrap抽样(高精尖方法)
基于现有样本里进行反复抽样反复计算,默认计算1000次,得出更委托的结果。
默认执行就行。
解释:
平均值的偏差很小说明,均值具有代表性,符合算数平均数的使用条件,均数可以代表样本。
标准差的偏差很小,说明该样本可以代表总体的离散程度
解释:
之前算得的平均差为-5.86088,偏差很小,P值为0.001说明结果同样支持拒绝原假设。
完全随机的两样本t检验
目的:
推断两个样本是否来自相同的总体,更具体地说,是要检验两样本所代表的总体均数是否相等。
检验假设
无效假设H0:
u1=u2
备择假设H1:
u1≠u2
检验水准α=0.05
统计理论复习
和上面单样本的t检验的原理相同,我们也采用了小概率反证法。
首先假设H0:
两样本来自同一总体。
当该总体服从正态分布时,我们就可以采用两样本t检验来计算从该总体中抽得这样两个样本(及更加极端情况)的概率为多少,从而做出统计推断。
样本均差/离散程度=标准化
由于H0假设的是两样本来自同一总体,分析目的只涉及到均值,因此两样本t检验在推导过程中除了要求总体服从正态分布外,还要求两样本各自所在总体方差相同。
应用条件不被满足
情况较轻时可以采用校正t检验的结果
否则应使用变量变换使之满足条件
或采用非参数检验过程
例:
现希望评价2007年4月第一次调查时不同收入人群的消费者信心指数是否存在差异
分析:
数据为定量资料,设计为成组设计,目的是两样本均数的比较。
正态性:
可作直方图等。
方差齐性:
系统在t检验结果中自动给出。
操作:
检验变量和分组变量分别选入,输入定义组——确定。
解释:
分析:
两组均值分别为90.7和104.4,这两个数存在差值,到底是由于抽样误差造成的还是它们背后的总体差值不同呢?
进一步看下列检验
3个检验结论,
第1个检验——方差齐性检验(列文检验)适用条件检验该检验的原假设如下
H0:
方差无区别或者方差相等。
H1:
两样本方差是有区别的不相等的。
根据sig.值来判断
例中
P值为.001,说明2个样本均值分别为90.7和104.4背后所代表的总体的方差是不相等的。
当,方差齐性被拒绝说明,t检验的适用条件已经出问题了。
怎么办呢?
再回看上表——假设方差不相等(校正)后的结果,即上图表中的第2行。
校正后的t值和df和sig.值
根据sig.值进行判断:
两样本的总体均值是有显著差异的
谁高谁低,就由平均值来判断。
往往在写统计结果的时候,出现显著性差异时要将差异值报告出来。
t检验适用条件
独立性:
对结果的影响较大,但一般没问题(从文献资料中进行判断)
正态性:
有一定的耐受能力,可以通过直方图等进行观察,偏的不厉害就行
注意应当要分组考察
方差齐性:
相对而言对结论的影响较大,需要进行方差齐性检验(t检验时最重要的,首先要考虑的,spss中t检验表首先出来的是方差齐性检验)
配对样本t检验
配对设计的两种情况
对同一个受试对象处理前后的比较
将受试对象按情况相近者配对(或者自身进行配对),分别给予两种处理,以观察两种处理效果有无差别。
配对设计的特点
在配对设计得到的样本数据中,每对数据之间都有一定的相关,如果采用成组的t检验就无法利用这种关系,浪费了大量统计信息
对于这种情况,统计学上的解决办法是求出每对的差值,通过检验该差值总体均数是否为0,就可以得知两种处理有无差异。
基本思路
H0:
两总体均值无显著差异,差值序列均值u0=0
构造统计量:
同单样本均值检验
D=X-u0S为差值序列的标准差
实质是先求出每对测量值的差值;然后检验差值序列的均值是否与0有显著差异.
如果差值的均值与0有显著差异,则认为两总体均值存在显著差异;否则,与0无显著差异,则认为两总体均值不存在显著差异
功能实际上和单样本t检验重复,但数据输入格式不同
和方差分析结果等价
例子:
用某药治疗10名高血压病人,对每一病人治疗前、后的舒张压(mmHg)进行了测量,结果如下,问该药有无降压作用?
计算变量——目标变量(命名)——输出新的一列数据——根据这列数据进行单样本t检验
解释:
分析:
表2,按照h0等于0的假设进行检验,得到P值为0.027,说明,原假设要成立的话在均值为0的总体中抽样,抽得均值相差10甚至比10更大的数的,在100次当中只能抽到2.7次。
这个概率值是小于检验水平的,因此拒绝H0接受H1,认为均值的差值不等于0。
又因为样本均值差值大于0,所以总体的均值差值也大于0,意味着药物是有降压作用的。
配对样本t检验
不用相减,直接用配对样本t检验
研究设计——样本量确定(根据文献来)
配对设计10-20个样本量的数据基本足够。
样本量的确定要考虑
第一:
研究设计
第二:
样本流失量
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 张文彤 SPSS 10 初中 课程 假设检验