SPSS实验报告Word格式文档下载.docx
- 文档编号:22092944
- 上传时间:2023-02-02
- 格式:DOCX
- 页数:25
- 大小:1.10MB
SPSS实验报告Word格式文档下载.docx
《SPSS实验报告Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《SPSS实验报告Word格式文档下载.docx(25页珍藏版)》请在冰豆网上搜索。
由于方差分析的前提是各个水平下(这里是不同品种的小麦产量)的总体服从方差相等的正态分布。
其中正态分布的要求并不是很严格,但对于方差相等的要求是比较严格的。
因此必须对方差相等的前提进行检验。
从SPSS的数据管理窗口中选择analyze—comparemeans—One-WayANOVA,将小麦产量(output)选入dependentlist框中,将品种(breed)选
1
入factor框中,点开Options,选中Homogeneityofvariancetest(方差齐性检验),点开posthocmultiplecomparisons,将significancelevel的值在两次实验时分别设置为0.01和0.05。
如下图所示:
实验结果及分析:
在0.05的显著性水平下不同小麦的等齐性检验:
方差齐性检验的H0假设是方差相等,从上表可看出Sig.=0.046>
0.05,说明应该接受H0假设。
几种小麦的方差检验结果(如下):
组间平方和为2263.482,自由度(df)为3,均方为754.494;
组内平方和为744.715,自由度为12,均方为62.060,;
F统计量为12.518。
由于组间比较的
2
相伴概率Sig(P值)=0.001<
0.05,故应拒绝H0假设(四种小麦的产量无显著性差异),说明四种小麦的产量有显著性差异。
在0.01的显著水平下:
在等齐性检验中Sig.=0.46>
0.01,所以接受H0假设(四种小麦产量无显著性差异),组间比较的相伴概率Sig(P值)=0.001<
0.01,故应拒绝H0假设(四种小麦的产量无显著性差异),说明四种小麦的产量有显著性差异。
因此,在显著性水平0.05和0.01下,四种不同小麦的产量有显著性差异
2.某公司希望检测四种类型的轮胎A,B,C,D的寿命(由行驶的里程数决定),见表6.18(单位:
千英里)(数据文件为data6-5.sav),其中每种轮胎应用在随机选择的6辆汽车上。
在显著性水平0.05下判断不同类型轮胎的寿命间是否存在显著性差异?
《统计学(第三版)》,M.R.斯皮格尔,科学出版社)
表6.18四种轮胎的寿命数据
A
33
38
36
40
31
35
B
32
42
30
34
C
37
D
29
由于有一个因素(轮胎),而且是4种饲料。
故不能用独立样本T检验(仅适用两组数据),这里可用单因素方差分析;
分成两列,一列是轮胎(tyre),另一列是里程(mileage);
第3步:
方差相等的齐性检验:
由于方差分析的前提是各个水平下(这里是不同类型轮胎的寿命)的总体服从方差相等的正态分布。
从SPSS的数据管理窗口中选择analyze—comparemeans—One-Way
3
ANOVA,将轮胎(tyre)选入dependentlist框中,将里程(mileage)选入factor框中,点开Options,选中Homogeneityofvariancetest(方差齐性检验),点开posthocmultiplecomparisons,将significancelevel的值设置为0.05。
从上面两个表可以看出:
方差齐性检验的H
假设是方差相等,从上表可看出
Sig.=0.50>
0.05,说明应该接受H
假设。
组间平方和为77.500,自由度(df)
为3,均方为25.833;
组内平方和为216.333,自由度为20,均方为
10.817;
2.388。
由于组间比较的相伴概率Sig(P值)=0.99>
0.05,故应接受H
假设(四种轮胎的寿命无显著性差异),说明四种轮胎的寿命无显著性差异。
如果想进一步了解空间是哪种和其他组有显著性的均值差别(即哪种轮胎更好),就需要在多个样本均值间进行两两比较。
单击PostHoc按钮,打开击PostHoc按钮,打开One-WayANOVA:
PostHocMultipleComparisions对话框,如图所示。
在其中可以选择一种或几种比较分析的方法。
输出结果为:
4
从上面分析我们可以看出,B型轮胎相比于A、C、D、要好,D型轮胎的寿命最短。
3.某超市将同一种商品做3种不同的包装(A)并摆放在3个不同的货架区(B)进行销售试验,随机抽取3天的销售量作为样本,具体资料见表6.20。
要求检验:
在显著性水平0.05下商品包装、摆放位置及其搭配对销售情况是否有显著性影响。
《应用统计学》耿修林,科学出版社;
数据文件:
data6-7.sav)
表6.20销售样本资料
B1
B2
B3
5,6,4
6,8,7
4,3,5
7,8,8
5,5,6
3,6,4
3,2,4
6,6,5
8,9,6
需要研究不同教学方法和不同性别对数学成绩的影响。
这是一个多因素(双因素)方差分析问题。
第2步按Analyze|GeneralLinearModel|Univariate的步骤打开Univariate对话框。
并将“销量”
变量移入DependentVariable框中,将“包装”和“摆放位置”移入FixedFactor(s)中,如图:
5
第3步单击Options,由于方差分析的前提上方差相等,故应进行方差齐性检验,选中
“Homogeneitytests”;
第4步。
打开Univariate:
PostHocMultipleComparisonsforObservedMeans对话框,在其中选出需要进行比较分析的对话框,这里选“组别”,再选择一种方差相等时的检验模型和不相等时的检验模型;
第5步选择建立多因素方差分析的模型种类。
打开Model对话框,本例用默认的Fullfactorial模型。
这种模型将观察变量总的变异平方和分解为多个控制变量对观察变量的独立部分、多个控制变量交互作用部分以及随机变量影响部分。
第6步以图形方式展示交互效果。
如果各因素间无交互效果,则各个水平对应的图形应近于平行,否则相交。
点开Plots,选择两个变量之交互作用,如图:
第7步对控制变量各个水平上的观察变量的差异进行对比检验。
选择Contrasts对话框,对两种因素均进行对比分析,方法用Simple方法,并以最后一个水平的观察变量均值为标准。
(选择Contrasts方式后需单击Change进行确认)
第8步运行结果及分析。
分组描述:
6
方差齐性检验结果:
是对销量进行方差齐性检验的结果,可以看出方差无显著差异,应用前面的LSD方法的结果如下:
多因素方差分析及交互检验:
该表是进行多因素方差分析的主要部分,由于指定建立饱和模型,因此总的离差平方和分为3个部分:
多个控制变量对观察量的独立作用、交互作用及随机变量的影响。
关于多个控制变量的独立作用部分。
不同包装贡献离差平方和为0.963,均方0.481不同
摆放位置贡献离差平方和为3.185,均方为1.593,这说明摆放位置比包装影响大。
从相伴概率来看,都小于0.05,说明两者均有影响。
关于多个控制变量的交互作用部分,这里组别与性别的交互作用的离差平方和为
61.259,均方为15.315,F值与相伴概率为14.259和0.000。
表明它们的交互作用对观察结果造成了显著影响。
Error部分是随机变量影响部分。
7
上图是包装变量的均值比较结果,可以看第1,2组与第3组比较的均值差异均显著。
下图是摆放位置变量的均值比较结果,可以看第1,2组与第3组比较的均值差异均显著。
4.研究杨树一年生长量与施用氮肥和钾肥的关系。
为了研究这种关系,一共进行了18个样地的栽培实验,测定杨树苗的一年生长量、初始高度、全部实验条件(包括氮肥量和钾肥量)及实验结果(杨树苗的生长量)数据如表6.21,请在显著水平0.05下检验氮肥量、钾肥量及树苗初始高度中哪些对杨树的生长有显著性影响。
《生物数学模型的统计学基础》李勇,科学出版社;
数据文件:
data6-8.sav)
表6.21杨树栽培试验数据
序号
氮肥
量
钾肥
树苗初
高
生长
序
号
生长量
少
4.5
1.85
10
多
6.5
2.15
11
1.99
1.6
12
2.06
12.5
13
1.93
2.04
14
2.1
8
25
4.2
16
2.4
2.3
17
4.25
9
18
5.5
少12.551.9115
多12.55.52.15
第1步分析:
入学成绩肯定会对最后成绩有所影响,这里着重分析不同教学方法的影响,就应该将生长量的影响去除。
就应该用到协方差分析。
第2步按以下步骤analyze|generallinearmodel|univariate,将树苗初高为协变量,并按以下设置:
第3步其它设置与多因素方差分析大同小异。
实验结果及分析:
可以看出氮肥量和初始高度的影响是不显著的,而钾肥量的影响是显著的。
第八章相关分析
1.
2.
3.
4.
理解相关分析的概念、原理及在统计中的作用;
掌握用SPSS进行两个变量间的相关分析;
掌握用SPSS进行偏相关分析;
掌握用SPSS进行距离分析。
二相关分析的基本概念及原理
1、基本概念
人们在实践中发现,变量之间关系分为两种类型:
函数关系和相关关系。
函数关系是变量间的一咱确定性关系。
但是,在实际问题中,变量间的关系往往并不是那么简单,也就是说,变量之间有着密切关系,但又不能由一个(或几个)变量的值确定另一个变量的值,这种变量之间的关系是不确定性关系,称为相关关系。
其特点是:
一个变量的取值不能由另一个变量唯一确定,即当自变量x取某个值时,因变量y的值可能会有多个。
这种关系不确定的变量显然不能用函数形式予以描述,但也不是杂乱无章、无规律可循的。
2基本数学原理
为了准确度量两个变量之间关系的密切程度,用相关系数来度量。
对两个变量之间线性相关程度的度量称为简单相关系数。
若相关系数是根据总体全部数据
计算的,称为总体相关系数,记为ρ;
若根据样本数据计算的,称为样本相关系数,记为r。
r>
0,正相关,表明自变量和因变量呈相同方向变化;
r<
0,负相关;
r的绝对值愈接近1,表示x,y愈接近线性相关。
当|r|=1时,y的取值完全依赖于x,两者为函数关系,是完全的线性关系;
r的绝对值愈接近0,表示x,y愈没有线性相关关系。
当r=0,表示两个变量之间不存在线性相关系。
当0<
1,表示x,y有相关关系,但是非线性关系。
|r|>
=0.8,视为高度相关;
0.5<
=|r|<
0.8,视为中度相关;
|r|<
0.3视为不相关。
偏相关系数的检验:
在利用本研究总体的特性时,由于抽样误差的存在,样本中控制了其他变量的影响,两个变量间偏相关系数不为0,不能说明总体中这两个变量间的偏相关系数不是0,因此必须进行检验。
检验的零假设:
总体中两个变量间的偏相关系数为0。
3.K.K.Smith在烟草杂交繁殖的花上收集到如表8.16所示的数据,要求对以上3组数据两两之间进行相关分析,以0.05的显著性水平检验相关系数的显著性。
《统计软件SPSS系列应用实践篇》苏金明,电子工业出版社;
data8-5.sav)
表8.16K.K.Smith所调查的长度资料
花瓣长
49
44
53
39
45
41
48
花枝长
27
24
22
20
21
23
15
花萼长
19
分析三组数据的两两之间的相关性,而且给出的是具体的数值,这是一个二元相关性问题;
第2步数据组织:
将三个变量分别定义为花瓣、花枝和花萼;
第3步按Analyze|Correlate|Bivariate顺序打开二元变量的分析主对话框BivariateCorrelations并作如下图所作的设置:
运行结果中给出了3个变量两两之间的Pearson相关系数(PearsonCorrelation)、双侧显著情况检验概率(Sig.(2-tailed))和数据组数(N)。
脚注内容显示相关分析结果在0.01的水平上显著。
另外,从表中可以看出,花瓣长和花枝长的数据具有很强的相关性。
而双侧检验的显著性概率均小于0.05,因此否定零假设(零假设是变量之间不具有相关性),认为相关系数不为零,变量之间具有相关性。
4.试确定1962-1988年安徽省国民收入与城乡居民储蓄存款余额两个变量间的线性相关性,数据如表8.17所示。
《数据统计与管理》1990年第5期,中国商场统计研究会主办;
data8-6.sav)
表8.171962-1988年安徽省国民收入数据表
年份
196
197
国民收入
(亿元)
34.
61
35.
67
39.
52
47.
54.
50.
86
49.
69
51.
65.
06
72.
57
77.
72
83.
82
87.
存款余额
0.5
0.7
0.8
1.2
1.1
1.3
1.8
2.5
2.6
198
95.
63
97.
103
.81
116
.29
127
.87
150
161
.47
180
.2
221
.17
310
.53
357
.86
444
.78
2.7
3.1
3.9
5.7
8.7
12.
16.
20.
95
28.
38.
43
55.
74.
89.
83
由于对不同年份的国民收入和存款余额均是定序数据,故考虑二元定序变量的相关性进行分析;
将三个变量分别定义为年份、国民收入、存款余额;
第3步按Analyze|Correlate|Bivariate顺序打开二元变量的分析主对话框BivariateCorrelations并作如下图所作的设置;
运行即可。
从实验结果的上半部分可以看出两个变量的Kendall相关系数为0.972>
0,双尾检验的相伴概率为0.000<
0.05,应拒绝两变量不相关的原假设,说明两变量具有显著的正相关性;
从下半部分可以看出,两变量的Spearman相关系数为0.995>
0,同时双尾检测的相伴概率值Sig.=0.000<
0.05,也说明了两变量呈显著的正相关。
从表的脚注也可以看出双尾检测下两变量在0.01水平上具有显著的正相关性。
5.某高校抽样得到10名短跑运动员,测出100米的名次和跳高的名次如表8.18,问这两个名次是否在0.05的显著性水平下具有相关性。
《应用统计学:
数据统计方法、数据获取与SPSS应用》马庆国,科学出版社;
data8-7.sav)
表8.1810名运动员的100米及跳高名次
百米名次
跳高名次
考虑是百米名次和跳高名次的相关性问题,应用二元变量的相关性进行分析;
将两个变量分成两列,分别定义为百米名次、跳高名次;
第3步按Analyze|Correlate|Bivariate顺序打开二元变量的分析主对话BivariateCorrelations,将“百米名次”和“跳高名次”两变量移入variables框中,选择person相关系数;
在testofsignificance中选择单尾检验;
单击再单击Options按钮,打开BivaiateCorrelations:
Option对话框,选择Statistics方框内的两个复选框,如下图:
描述性统计表:
上表是对两种名次的描述性结果,百米名次的均值为5.50,标准差为3.028;
跳高名次的均值为5.50,标准差为3.028,;
记录数共10条。
相关分析结果表:
从表中可以看出,相关系数为0.697>
0,说明呈正相关,而相伴概率值Sig.=0.13>
0.05,因此应接受零假设(H0:
两个变量之间不具相关性),即说明百米名次不受跳高名称的显著性影响。
6.某公司太阳镜销售情况如表8.19所示,请分析销售量与平均价格、广告费用和日照时间之间的关系,并说明此题用偏相关分析是否有实际意义(显著性水平为0.05)。
《SPSSforWindows统计分析(第3版)》卢纹岱,电子工业出版社;
data8-8.sav)
表8.19某公司销售太阳镜的数据
月份
销量
75
90
148
183
242
263
278
318
256
200
140
80
价格
6.8
3.5
2.9
3.6
广告费用
28
日照时间
8.4
10.4
11.5
9.6
6.1
3.4
这3个因素彼此均有影响,分析时应对销售量与另外三个因素分别求偏相关,
在销售量与一个因素的相关时控制其他因素的影响,然后比较相关系数,按3个因素对太阳镜销售量的影响的大小排序。
第2步定义变量:
月份、销量、价格、广告费用、日照时间。
第3步按Analyze|Correlate|Partial顺序启动偏相关分析的主对话框,指定分析变量和控制变量,第一次分析变量为销量与价格的偏相关系数,其余为控制变量。
在主对话框中使用系统默认的双尾检验,显示实际的显著性概率。
从上图可以看出,广告费用和价格为控制变量,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 实验 报告
![提示](https://static.bdocx.com/images/bang_tan.gif)