书签分享收藏举报版权申诉 / 13

立即下载加入VIP,免费下载

当前位置：首页 > 高中教育 > 语文 > 张文彤SPSS第10节初中高课程假设检验.docx

张文彤SPSS第10节初中高课程假设检验.docx

文档编号：29411664
上传时间：2023-07-23
格式：DOCX
页数：13
大小：316.77KB

《张文彤SPSS第10节初中高课程假设检验.docx》由会员分享，可在线阅读，更多相关《张文彤SPSS第10节初中高课程假设检验.docx（13页珍藏版）》请在冰豆网上搜索。

张文彤SPSS第10节初中高课程假设检验.docx

张文彤SPSS第10节初中高课程假设检验

假设检验

为什么要做检验？

因为取得的样本的信息

样本背后的总体是怎样的。

总体参数

参数估计：

推估样本所在的总体体征。

假设检验：

对提出的一些总体假设进行分析判断，做出统计决策。

假设检验基本原理

例如：

现有样本均数和已知总体均数不同，其差别可能有两个方面的原因造成。

其一，样本来自，已知总体，现有差别是抽样误差

其二，样本来自，其他总体，两个总体存在本质上的差异。

选择哪种解释呢？

需要借用假设检验。

基础：

小概率原理，即一般认为小概率事件在一次随机抽样中不会发生。

基本思想：

先建立一个关于样本所属总体的假设，考察在假设条件下随机样本的特征信息是否属小概率事件，若为小概率事件，则怀疑假设成立有悖于该样本所提供特征信息，因此拒绝假设。

事实上，小概率事件在随机抽样中还是可能发生的，只是发生的概率很小。

若正好碰上了，则假设检验的结论就是错误的。

当然，犯这种错误的概率很小。

一、建立假设

根据统计推断的目的而提出的对总体特征的假设。

统计学中的假设有两方面的内容：

一是检验假设（hypothesistobetested）,亦称原假设或无效假设（nullhypothesis），记为H0；

二是与H0相对立的备择假设（alternativehypothesis），记为H1。

后者的意义在于当H0被拒绝时供采用。

两者是互斥的，非此即彼。

H0：

m=m0，H1：

m≠m0；

例H0：

m=7.4，H1：

m≠7.4。

二、确定检验水准

实际上就是确定拒绝H0时的最大允许误差的概率。

检验水准（sizeoftest），常用a表示，是指检验假设H0本来是成立的，而根据样本信息拒绝H0的可能性大小的度量，换言之，a是拒绝了实际上成立的H0的概率。

常用的检验水准为a=0.05，其意义是：

在所设H0的总体中随机抽得一个样本，其均数比手头样本均数更偏离总体均数的概率不超过5%

3、进行试验收集数据

所需的样本数据即从此得来

4、计算检验统计量和P值

统计量只是工具，概率值才是目的，它可以客观衡量样本对假设总体偏离程度，从H0假设的总体中抽出现有样本（及更极端情况）的概率，即P值

例如600次赢100次是H0假设的情况，只赢1次就是现有样本情况，更极端的情况就是连一次也没有赢。

检验统计量的特点

该统计量应当服从某种已知分布，从而可以计算出P值

各种检验方法所利用的分布及计算原理不同，从而检验统计量也不同

初学者往往本末倒置，很认真地在学工具，却忘记了统计学的本质是思维方式

五、得出推断结论

按照事先确定的检验水准a界定上面得到的P值，并按小概率原理认定对H0的取舍，作出推断结论

若P≤α

基于H0假设的总体情况出现了小概率事件

则拒绝H0，接受H1，可以认为样本与总体的差别不仅仅是抽样误差造成的，可能存在本质上的差别，属“非偶然的（significant）”，因此，可以认为两者的差别有统计学意义。

进一步根据样本信息引申，得出实用性的结论。

若P＞αa

基于H0出现了很常见的事件

则样本与总体间的差别尚不能排除纯粹由抽样误差造成，可能的确属“偶然的（non-significant）”，故尚不能拒绝H0

因此，认为两者的差别无统计学意义，但这并不意味着可以接受H0。

例子：

关于掷筛子的假设检验

建立假设

H0：

筛子均匀，pi=1/6H1：

筛子不均匀

确定检验水准

aα=0.05

进行试验，计算检验统计量和P值

相应的试验结果在H0下对应的概率为1/600略多一点

得出推断结论

基于H0出现了小概率事件，结果有非常非常显著的统计学意义，你出老千！

假设检验应注意的问题

结论不能绝对化

本身就保留了犯错误的可能性

样本量导致的检验效能问题

样本量太小，导致检验效能不足，从而无法检出可能存在的差异

样本量太大，得出的有统计学意义的结论可能根本就没有实际意义

统计学的意义和实际价值的意义要分清。

单样本t检验

推断样本是否来自某已知总体，即要检验样本所在总体的均数是否等于已知的总体均数

为了回答该问题，统计学上采用了小概率反证法的原理：

我们有如下两种假设：

H0：

样本均数与总体均数的差异完全是抽样误差造成

H1：

样本均数与总体均数的差异除由抽样误差造成外，也反映了两个总体均数确实存在的差异

t=x-u/s（分子为均差）/（分母为标准误差）

标准误越小代表性越好。

单样本t检验在spss中的实现

选择个案——分析——单样本t检验

（显示P值，连续双击sig.）

例：

消费者信心指数以100作为基准值，现希望比较2007年12月的总消费者信心指数是否与基准值有差异

解释：

样本均值为94.1391与比较值100之间相差5.86088,p值为.000

平均差为5.86088

如果说，背后总体均数为100的话，那么在这样一个总体中抽样，得到现在极端的样本，平均差为5.86088，更极端的情况是再抽出的样本均数与100之间的差值绝对值还要大±，所有这些极端情况，在100次抽样里，连一次也没有。

我们设定的α值为0.05，而P值实际大概为10-5我们有理由认为，在原假设成立的条件下，做1次研究，得到现有极端样本的可能性是很小的。

拒绝原假设，接受备择假设。

就是该样本背后的总体均值不等于我们假设的100。

问题：

那该总体均值到底是大于100还是小于100呢？

根据样本均值估计，总体均值小于100（统计之外的推断，基于应用考虑）

方法的适用条件

因为有中心极限定理，一般均数的抽样分布都不会有问题，真正会限制该方法使用的是均数是否能够代表相应数据的集中趋势。

也就是说，只要数据分布不是强烈的偏态，一般而言单样本t检验都是适用的。

不符合t检验的条件时方法（样本不符合正态分布等）

引申：

基于计算统计学的新工具：

Boostrap抽样（高精尖方法）

基于现有样本里进行反复抽样反复计算，默认计算1000次，得出更委托的结果。

默认执行就行。

解释：

平均值的偏差很小说明，均值具有代表性，符合算数平均数的使用条件，均数可以代表样本。

标准差的偏差很小，说明该样本可以代表总体的离散程度

解释：

之前算得的平均差为-5.86088，偏差很小，P值为0.001说明结果同样支持拒绝原假设。

完全随机的两样本t检验

目的：

推断两个样本是否来自相同的总体，更具体地说，是要检验两样本所代表的总体均数是否相等。

检验假设

无效假设H0：

u1=u2

备择假设H1：

u1≠u2

检验水准α=0.05

统计理论复习

和上面单样本的t检验的原理相同，我们也采用了小概率反证法。

首先假设H0：

两样本来自同一总体。

当该总体服从正态分布时，我们就可以采用两样本t检验来计算从该总体中抽得这样两个样本（及更加极端情况）的概率为多少，从而做出统计推断。

样本均差/离散程度=标准化

由于H0假设的是两样本来自同一总体，分析目的只涉及到均值，因此两样本t检验在推导过程中除了要求总体服从正态分布外，还要求两样本各自所在总体方差相同。

应用条件不被满足

情况较轻时可以采用校正t检验的结果

否则应使用变量变换使之满足条件

或采用非参数检验过程

例：

现希望评价2007年4月第一次调查时不同收入人群的消费者信心指数是否存在差异

分析：

数据为定量资料，设计为成组设计，目的是两样本均数的比较。

正态性：

可作直方图等。

方差齐性：

系统在t检验结果中自动给出。

操作：

检验变量和分组变量分别选入，输入定义组——确定。

解释：

分析：

两组均值分别为90.7和104.4，这两个数存在差值，到底是由于抽样误差造成的还是它们背后的总体差值不同呢？

进一步看下列检验

3个检验结论，

第1个检验——方差齐性检验（列文检验）适用条件检验该检验的原假设如下

H0：

方差无区别或者方差相等。

H1：

两样本方差是有区别的不相等的。

根据sig.值来判断

例中

P值为.001，说明2个样本均值分别为90.7和104.4背后所代表的总体的方差是不相等的。

当，方差齐性被拒绝说明，t检验的适用条件已经出问题了。

怎么办呢？

再回看上表——假设方差不相等（校正）后的结果，即上图表中的第2行。

校正后的t值和df和sig.值

根据sig.值进行判断：

两样本的总体均值是有显著差异的

谁高谁低，就由平均值来判断。

往往在写统计结果的时候，出现显著性差异时要将差异值报告出来。

t检验适用条件

独立性：

对结果的影响较大，但一般没问题（从文献资料中进行判断）

正态性：

有一定的耐受能力，可以通过直方图等进行观察，偏的不厉害就行

注意应当要分组考察

方差齐性：

相对而言对结论的影响较大，需要进行方差齐性检验（t检验时最重要的，首先要考虑的，spss中t检验表首先出来的是方差齐性检验）

配对样本t检验

配对设计的两种情况

对同一个受试对象处理前后的比较

将受试对象按情况相近者配对（或者自身进行配对），分别给予两种处理，以观察两种处理效果有无差别。

配对设计的特点

在配对设计得到的样本数据中，每对数据之间都有一定的相关，如果采用成组的t检验就无法利用这种关系，浪费了大量统计信息

对于这种情况，统计学上的解决办法是求出每对的差值，通过检验该差值总体均数是否为0，就可以得知两种处理有无差异。

基本思路

H0:

两总体均值无显著差异，差值序列均值u0=0

构造统计量：

同单样本均值检验

D=X-u0S为差值序列的标准差

实质是先求出每对测量值的差值;然后检验差值序列的均值是否与0有显著差异.

如果差值的均值与0有显著差异,则认为两总体均值存在显著差异；否则，与0无显著差异,则认为两总体均值不存在显著差异

功能实际上和单样本t检验重复，但数据输入格式不同

和方差分析结果等价

例子：

用某药治疗10名高血压病人，对每一病人治疗前、后的舒张压（mmHg）进行了测量，结果如下，问该药有无降压作用？

计算变量——目标变量（命名）——输出新的一列数据——根据这列数据进行单样本t检验

解释：

分析：

表2，按照h0等于0的假设进行检验，得到P值为0.027，说明，原假设要成立的话在均值为0的总体中抽样，抽得均值相差10甚至比10更大的数的，在100次当中只能抽到2.7次。

这个概率值是小于检验水平的，因此拒绝H0接受H1，认为均值的差值不等于0。

又因为样本均值差值大于0，所以总体的均值差值也大于0，意味着药物是有降压作用的。

配对样本t检验

不用相减，直接用配对样本t检验

研究设计——样本量确定（根据文献来）

配对设计10-20个样本量的数据基本足够。

样本量的确定要考虑

第一：

研究设计

第二：

样本流失量

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 张文彤 SPSS 10 初中课程假设检验

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：张文彤SPSS第10节初中高课程假设检验.docx
链接地址：https://www.bdocx.com/doc/29411664.html

张文彤SPSS第10节初中高课程假设检验.docx

热门标签