Mean过程和T检验过程.docx
- 文档编号:1084228
- 上传时间:2022-10-16
- 格式:DOCX
- 页数:18
- 大小:130.33KB
Mean过程和T检验过程.docx
《Mean过程和T检验过程.docx》由会员分享,可在线阅读,更多相关《Mean过程和T检验过程.docx(18页珍藏版)》请在冰豆网上搜索。
Mean过程和T检验过程
一、Means过程
1.简单介绍
Means过程计算指定变量的综合描述计量,包括均值、标准差、总和、观测量数、方差等一系列单变量描述统计。
当观测量按一个分类变量分组时,Means过程可以进行分组计算。
例如,要计算某地区高考的数学成绩,Sex变量把考生分为男生和女生两组,Means过程可以分别计算男女生的数学成绩。
Means过程还可以给出方差分析表和线性检验结果。
使用Means过程求若干组的描述统计量的目的在于比较,因此必须求均值。
这是与Descriptive过程不同之处。
2.完全窗口分析
Means过程的大部分功能可以完全由窗口实现,这给用户带来了很大的方便。
(1)Means主对话框
按Analyze→CompareMeans→Means的顺序单击,即可打开“Means”主对话框,如图1所示。
图1Means主对话框
(2)Dependent框
该框中的变量作为因变量,通常认为受自变量影响或决定,因此被用来预测或建模。
要从源变量框中选取变量进入该框,只需选中所要选取的变量,然后按向右的箭头即可。
(3)Independent框
该框中的变量是自变量,又被称为预测变量或解释变量。
要运行Means过程,该框中必须至少有一个变量。
要从源变量框中选取变量进入该框,同样只需激活所要选取的变量,然后按向右的箭头即可。
选中变量进入该框后,可以看到上方的【Next】按钮有效,单击该按钮进入下一层,在下一层的自变量将再细分样本。
要回到上一层,单击【Previous】按钮即可。
(4)Options对话框
单击Options按钮,即可打开“Options”对话框,如图2所示。
图2Options对话框
①CellStatistics框
从左边框中选择要输出的统计量进入该框,该框中的统计量是输出时显示的统计量,其排列顺序即是输出时显示的顺序。
可供选择的统计量的意义如下:
Sum(总和)、Numberofcases(观测量数目)、Mean(均值)、Median(中位数)、Groupedmedian(分组中位数)、Standarderrorofthemean(均值标准误差)、Minimum(最小值)、Maximum(最大值)、Range(范围)、Standarddeviation(标准差)、Variance(方差)、Kurtosis(峰度)、Standarderrorofkurtosis(峰度的标准差)、Skewness(偏度)、StandarderrorofSkewness(偏度的标准差)、First(首值)、Last(尾值)、Percentageoftotalsum(占总和的百分比)、PercentageoftotalN(占观测量总数的百分比)、Geometricmean(几何均数)、Harmonicmean(调和均数)。
②StatisticsforFirstLayer
该栏中有两个复选框,决定对第一层自变量的有关分析。
●ANOVAtableandeta复选框
选中该复选项对第一层自变量给出方差分析表和eta统计量η和η2。
方差分析的零假设是,第一层自变量各水平上的因素量均值都相等。
η统计量表明因变量和自变量之间联系的强度。
η2是因变量中不同组中差异所解释的方差比,是组间平方和与总平方和之比。
●Testsforlinearity复选框
选中该复选框产生R和R2。
只有早控制变量有基本的数量级(例如自变量表示年龄或人种,不能是房子颜色或居住城市等),且自变量有三个水平以上。
其检验的假设是因变量均值是第一层自变量值的线性函数。
R和R2测度线性拟合的良好度。
R是观测值与预测值之间的相关系数。
3.例题分析
某医师测得如下血红蛋白值(g%),用Means过程对其做基本的描述性统计分析。
表1血红蛋白值
编号
性别
年龄
血红蛋白
编号
性别
年龄
血红蛋白
1
1
18
13.66
21
2
16
11.36
2
1
18
10.57
22
1
16
12.78
3
1
16
12.56
23
1
18
15.09
4
2
17
9.87
24
2
18
8.67
5
2
17
8.99
25
2
17
8.56
6
2
17
11.35
26
2
18
12.56
7
1
17
14.56
27
2
17
11.56
8
1
16
12.40
28
1
16
14.67
9
2
16
8.05
29
1
16
7.88
10
1
18
14.03
30
1
18
12.35
11
2
18
12.83
31
1
16
13.65
12
1
16
15.50
32
2
16
9.87
13
2
18
12.25
33
2
18
10.09
14
2
17
10.06
34
2
18
12.55
15
1
16
10.88
35
1
18
16.04
16
1
18
9.65
36
1
18
13.78
17
2
16
8.36
37
1
17
11.67
18
1
18
11.66
38
1
17
10.98
19
2
18
8.54
39
2
16
8.78
20
2
17
7.78
40
1
16
11.35
(1)操作步骤
①激活数据管理窗口,输入数据文件,定义变量名:
性别为sex,年龄为age,血红蛋白值hb。
按顺序输入数据(sex变量中,男为1,女为2)。
②按Analyze→CompareMeans→Means的顺序单击,即可打开“means”主对话框。
③在对话框左侧的变量中选hb,单击向右按钮使之进入DependentList框,选sex单击向右按钮使之进入IndependentList框。
④单击败【Options】按钮打开“Options”对话框,从中选择统计项目:
在CellDisplays项中,选中Mean、Standarddeviation、Variance、NumberofCases和Sum五个复选框。
⑤在StatisticsforFirstLayer项中,将为第一层的分组选择计算方差分析(ANOVAtableandeta)和线性检验(Testoflinearity)。
单击【Continue】按钮返回“Means”主对话框。
⑥选age单击向右按钮使之进入IndependentList框。
重复④和⑤步骤,返回“Means”主对话框。
⑦在主对话框中单击【OK】钮完成。
(2)输出结果及分析
表2是我们造已熟悉的观测量摘要表,说明了观测量总个数为40,其中有效值为40个,无效值有0。
表2观测量摘要表
CaseProcessingSummary
Cases
Included
Excluded
Total
N
Percent
N
Percent
N
Percent
血红蛋白值*性别*年龄
40
100.0%
0
.0%
40
100.0%
表3分为三部分,第一、第二部分先按性别分组(分男性和女性),再按年龄分组(16,17,18岁三组)计算观测值合计、均值、标准差、方差和个数;第三部分是之按年龄分组,最后一行表示40个观测值合计为457.79,均数为11.4448,标准差为2.2690,方差为5.1484,个数为40。
若在IndependentList中未分层次,即sex和age一起在Layer1of1中,则结果是分别计算男性与女性(不作年龄分组)。
16、17、18岁三组(不作性别分组)的观测值合计、均值、标准差、方差和个数,如表4、5所示。
表3分组描述统计量
Report
血红蛋白值
性别
年龄
Mean
N
Std.Deviation
Variance
Sum
男
16
12.4078
9
2.2455
5.042
111.67
17
12.4033
3
1.8993
3.607
37.21
18
12.9811
9
2.0933
4.382
116.83
Total
12.6529
21
2.0531
4.215
265.71
女
16
9.2840
5
1.3494
1.821
46.42
17
9.7386
7
1.4036
1.970
68.17
18
11.0700
7
1.9158
3.670
77.49
Total
10.1095
19
1.6989
2.886
192.08
Total
16
11.2921
14
2.4649
6.076
158.09
17
10.5380
10
1.9421
3.772
105.38
18
12.1450
16
2.1827
4.764
194.32
Total
11.4448
40
2.2690
5.148
457.79
表4按性别分组的描述统计量
Report
血红蛋白值
性别
Mean
N
Std.Deviation
Variance
Sum
男
12.6529
21
2.0531
4.215
265.71
女
10.1095
19
1.6989
2.886
192.08
Total
11.4448
40
2.2690
5.148
457.79
表5按年龄分组的描述统计量
Report
血红蛋白值
年龄
Mean
N
Std.Deviation
Variance
Sum
16
11.2921
14
2.4649
6.076
158.09
17
10.5380
10
1.9421
3.772
105.38
18
12.1450
16
2.1827
4.764
194.32
Total
11.4448
40
2.2690
5.148
457.79
表6是方差分析表,共有六列,第一列说明方差的来源,BetweenGroups是组间的,WithinGroups是组内的,Total是总的。
第二列为平方和,其大小说明了各方差来源作用的大小。
第三列为自由度。
第四列为均方,即平方除以自由度。
第五列F值只F统计量的值,其计算公式为模型均方除以误差均方,用来检验模型的显著性,如果不显著说明模型对指标的变化没有解释能力。
第六列是F值统计量的显著值,由于这里显著性小于0.05(我们的检验水平),所以模型是显著的,性别对血红蛋白有显著影响。
由于性别分组只有两个水平,所以没有设计计算线性检验。
表6方差分析表
ANOVATable
SumofSquares
df
MeanSquare
F
Sig.
血红蛋白值*性别
BetweenGroups
(Combined)
64.526
1
64.526
17.995
.000
WithinGroups
136.261
38
3.586
Total
200.7
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Mean 过程 检验