SPSS上机实验报告.docx
- 文档编号:9074153
- 上传时间:2023-02-03
- 格式:DOCX
- 页数:31
- 大小:38.38KB
SPSS上机实验报告.docx
《SPSS上机实验报告.docx》由会员分享,可在线阅读,更多相关《SPSS上机实验报告.docx(31页珍藏版)》请在冰豆网上搜索。
SPSS上机实验报告
SPSS上机实验报告
实验课程SPSS统计分析
实验时间2009年7月4日-7月7日
实验地点数图负一楼信息管理与信息系统实验室
姓名:
倪聪聪
学号:
06200430
专业:
工商管理
班级:
教学一班
指导教师:
唐兴艳
2009年7月7日星期二制
实验四参数估计与假设检验
一实验目的
1.掌握用SPSS进行参数估计的方法;
2.掌握用SPSS进行假设检验(T检验)。
二实验内容
实验原理:
参数是总体数量规律性的特征值,在实际问题中,总体参数都是未知的,这就需要通过样本数据所提供的总体的有关信息对参数加以推断。
对样本数据的加工和信息提取,形成了对样本数据具有代表性的统计量。
参数估计主要包括点估计和区间估计,如果在估计中直接用估计量作为固定的数值对参数作出估计,就是参数的点估计;如果在估计中要对参数作出带有可靠性的估计,就需要给出对应于这一可靠性或置信度的区间,即区间估计。
假设检验是先对未知的总体参数作出假设,然后抽取样本,利用样本提供的信息对假设的正确性进行判断的过程。
待检假设通常用H0表示,对立假设用H1表示,主要包括单样本T检验、独立样本T检验和配对样本T检验。
其基本思想是:
首先假设H0为真,考虑在H0成立的条件下观测到的样本信息出现的概率。
如果这个概率很小,说明一个小概率事件在一次试验中发生了。
而小概率原理认为,概率很小的事件在一次试验中几乎是不可能发生的,也就是说如果小概率事件在一次试验中发生了,就说明事先的假设H0为真是不下确的,因此拒绝H0,接受H1;否则接受H0。
1有两台测厚仪,一个人按同一规程操作,测量同一批产品,测得的结果如下:
第一组:
1.29,1.31,1.3,1.3,1.33,1.33,1.3,1.3,1.29,1.29
第二组:
1.21,1.19,1.17,1.19,1.22,1.2,1.18,1.2,1.19
请对以上两组给定数据进行点估计和区间估计。
实验步骤:
1)首先在SPSS中输入数据并分组
2)打开“Explore”对话框,在“DependentList”列表框中输入变量名因变量“测量”,在“FactorList”列表框内输入分组变量“组别”。
单击对话框中的“Statistics”按钮,选择“M-estimators”为点估计,选择“Descriptives”为区间估计。
实验结果:
进行点估计结果如下:
M-Estimators(e,f,g,h)
第二组
Huber'sM-Estimator(a)
Tukey'sBiweight(b)
Hampel'sM-Estimator(c)
Andrews'Wave(d)
第一组
1.19
1.3000
1.3000
1.3000
1.3000
1.20
1.3150
1.3150
1.3150
1.3150
aTheweightingconstantis1.339.
bTheweightingconstantis4.685.
cTheweightingconstantsare1.700,3.400,and8.500
dTheweightingconstantis1.340*pi.
e第一组isconstantwhen第二组=1.17.Ithasbeenomitted.
f第一组isconstantwhen第二组=1.18.Ithasbeenomitted.
g第一组isconstantwhen第二组=1.21.Ithasbeenomitted.
h第一组isconstantwhen第二组=1.22.Ithasbeenomitted.
进行区间估计结果如下:
Descriptives
Statistic
Std.Error
第一组
Mean
1.2521
.01332
95%ConfidenceIntervalforMean
LowerBound
1.2241
UpperBound
1.2801
5%TrimmedMean
1.2523
Median
1.2900
Variance
.003
Std.Deviation
.05808
Minimum
1.17
Maximum
1.33
Range
.16
InterquartileRange
.1100
Skewness
-.094
.524
Kurtosis
-1.881
1.014
结果分析:
根据点分析结果,我们可以看出每组的测量的平均水平;根据区间分析的结果我们可以知道置信度为95%,第一组区间上限为1.2801,下限为1.2241:
第二组上限为1.2801,下限为1.2241。
2测得一批钢件的20个样品的屈服点(单位:
T/cm2)为:
4.98,5.11,5.2,5.11,5,5.61,4.88,5.27,5.38,5.2,5.46,5.27,5.23,4.96,,5.35,4.77,5.33,5.54。
假设屈服点服从正态分布。
已知总体均值为5.20,试对该样本的数据进行均值检验。
实验步骤:
1)由于该正态总体的方差未知,且样本数小于30,属于小样本。
所以采用T检验法。
建立假设H0:
u=5.20;H1:
u!
=5.20。
取显著性水平a=5%。
2)选择Analyze|Comparemeans|One-SampleTTest,如图4-3所示。
这里TestValue即检验值,它是要检验的总体均值u0,本例为5.20。
再进入Options对话框,填定显著水平和缺失值的处理方式。
本例为默认为95%。
点OK。
实验结果:
One-SampleStatistics
N
Mean
Std.Deviation
Std.ErrorMean
屈服点
20
5.2085
.21883
.04893
One-SampleTest
TestValue=5.20
t
df
Sig.(2-tailed)
MeanDifference
95%ConfidenceIntervaloftheDifference
Lower
Upper
屈服点
.174
19
.864
.0085
-.0939
.1109
结果分析:
测得均值为5.2085,与均值5.20相差很小。
本例中Sig>0.05(P值)故接受原假设,说明满足要求。
3研究10个同学在参加暑期培训班前后,其成绩有无显著差异。
数据如下所示:
培训前:
99,88,79,59,54,89,79,56,89,99,23,89,70,50,67,78,89,56
培训后:
98,89,80,78,78,89,87,76,56,76,89,89,99,89,88,98,78,89实验步骤:
1)组织数据(分培训前、培训后两组)
2)Analyze|CompareMeans|Pared-SamplesTTest,在弹出的Pared-SamplesTTes话框中,将培训前后组成一个对移入到ParedVariable(s)中,如图4-7,并单击OK完成。
实验结果:
PairedSamplesStatistics
Mean
N
Std.Deviation
Std.ErrorMean
Pair1
培训前
72.9444
18
20.15666
4.75097
培训后
84.7778
18
10.33871
2.43686
PairedSamplesCorrelations
N
Correlation
Sig.
Pair1
培训前&培训后
18
-.077
.761
PairedSamplesTest
PairedDifferences
t
df
Sig.(2-tailed)
Mean
Std.Deviation
Std.ErrorMean
95%ConfidenceIntervaloftheDifference
Lower
Upper
Pair1
培训前-培训后
-11.8333
23.35216
5.50416
-23.4461
-.2206
-2.150
17
.046
结果分析:
从培训前后的效果来看,前均值为72.9444,后的均值为84.7778。
从相关性分析来看,概率值00.761>0.05,说明不具相关性。
从配对检验的结果来看,概率值0.046<0.05,应拒绝前后无显著差异的0假设。
说明:
培训后比培训前的平衡性好。
4一个品牌的方便面面饼的标准重量为80g,但是不能大小相关太大,因此要求标准差小于2g。
现随机抽取部分面饼,称其重量数据如Excel表4-9所示,请问这批面饼是否符合要求?
实验步骤:
1)由于该正态总体的方差未知,且样本数小于30,属于小样本。
所以采用T检验法。
取显著性水平a=5%。
2)选择Analyze|Comparemeans|One-SampleTTest,如图4-3所示。
这里TestValue即检验值,它是要检验的总体均值u0,本例为2。
再进入Options对话框,填定显著水平和缺失值的处理方式。
本例为默认为95%。
点OK。
实验结果:
One-SampleStatistics
N
Mean
Std.Deviation
Std.ErrorMean
WEIGHT
30
79.873
1.6056
.2931
One-SampleTest
TestValue=80
t
df
Sig.(2-tailed)
MeanDifference
95%ConfidenceIntervaloftheDifference
Lower
Upper
WEIGHT
-.432
29
.669
-.127
-.726
.473
结果分析:
分析可知标准差为1.6056<2,SIG=0.669>0.05,所以接受原假设,则符合要求。
实验五非参数检验
一实验目的
1.领会参数检验与非参数检验的适用情况;
2.掌握用SPSS进行非参数检验的方法。
二实验内容
实验原理:
非参数检验是相对于参数检验而言的,在参数检验中是基于这样的假设:
它的模型对抽出研究样本的总体的参数规定了一些条件,如观察必须是独立的、必须是从正态分布的总体中抽取、这些总体要有相同的方差等。
除了同方差假设可能是个例外,这些条件通常在进行统计分析的过程中是不进行检验的,它们只是一些可以接受的推测,它们为真与否决定了这种参数检验所获得的概率描述的意义,当有理由相信所分析的资料满足这些条件时,就应该选择参数统计检验来分析,这种选择是最佳的。
但是,当假设并不成立或测量水平不如所要求的那么高时,那么参数检验的功效很小。
非参数统计检验是:
其模型对于被抽样总体的参数不规定条件,即是不依赖总体分布的统计检验方法,是指在总体不服从正态分布且分布情况不明时,用来检验数据资料是否来自同一总体假设的一类检验方法。
大多数非参数检验都包含一定的假设,即观测是独立的,所研究的变量具有基础的连续性。
不过这些假设比参数检验的假设要少,并且弱得多。
故它不仅适于定量数据,亦适于定性数据。
包含单样本非参数检验、两个独立样本非参数检验、两个相关样本非参数检验及多个独立相关样本的非参数检验。
1在跑步时,人们往往认为赛道会对获胜有较大影响。
表5-9是重庆邮电大学在一年内对一特定运动场各赛道获胜情况的记录。
试检验跑道对获胜情况的影响(检验看)。
表5-9运动员在8个跑道上获胜的记录表
标杆位置12345678
获胜次数2919182517101511
实验步骤:
1)应先用Data菜单中的Weightcases…过程,将获胜次数定义为权重变量。
对标杆位置的进行加权处理。
2)按Analyze|NonparametricTests|Chi-Square顺序展开Chi-SquareTest对话框,选择标杆的变量进入TestVariable对话框,由于这是一个均匀分布检验,故直接使用系统默认值,单击OK
实验结果:
TestStatistics
标杆位置
获胜次数
Chi-Square(a)
16.333
16.333
df
7
7
Asymp.Sig.
.022
.022
结果分析:
p=0.022<0.05,则拒绝原假设,获胜次数与标杆位置之间有相关性
2某地一周内各日忧郁症的人数分布如表5-10所示,请检验一周内各日人们忧郁数是否满足1:
1:
2:
2:
1:
1:
1的分布。
表5-10忧郁人数分布表
周日1234567
患者数31387080292431
实验步骤:
1)应先用Data菜单中的Weightcases…过程,患者数定义为权重变量。
对周日的进行加权处理。
2)按Analyze|NonparametricTests|Chi-Square顺序展开Chi-SquareTest对话框,选择日期的变量进入TestVariable对话框,由于这是一个均匀分布检验,故直接使用系统默认值,并在最下面添加比例,1:
1:
2:
2:
1:
1:
1,单击OK。
实验结果:
周日
ObservedN
ExpectedN
Residual
1.00
31
43.3
-12.3
2.00
38
43.3
-5.3
3.00
70
43.3
26.7
4.00
80
43.3
36.7
5.00
29
43.3
-14.3
6.00
24
43.3
-19.3
7.00
31
43.3
-12.3
Total
303
患者数
ObservedN
ExpectedN
Residual
24.00
24
50.5
-26.5
29.00
29
50.5
-21.5
31.00
62
50.5
11.5
38.00
38
50.5
-12.5
70.00
70
50.5
19.5
80.00
80
50.5
29.5
Total
303
结果分析:
有结果可知,不满足1:
1:
2:
2:
1:
1:
1的分布
4一名熟练工人先后用两台机床加工同样的产品。
现从这两台机床加工的产品中随机9件,测得产品直径(mm)如表5-11所示,试问两台机床加工的产品的平均直径有无显著差异。
表5-11甲乙两台机床加工的产品的直径表
机床甲18.117.717.219.11717.517.317.818.7
机床乙18.31918.917.316.918.41817.618.6
实验步骤:
1)组织整理数据
2)按Analyze|NonparametricTest|2IndependentSamples进入相应对话框,将延长时间选入TestVariable对话框,将机床选入GroupingVariable框中,单击DefineGroups按钮,进行相应的分组(如果用的1,2代表,则分别输入1,2),并在TestType中选择Mann-WhitneyU。
试验结果:
Ranks
N
MeanRank
SumofRanks
机床已-机床甲
NegativeRanks
4(a)
3.88
15.50
PositiveRanks
5(b)
5.90
29.50
Ties
0(c)
Total
9
a机床已<机床甲
b机床已>机床甲
c机床已=机床甲
TestStatistics(b)
机床已-机床甲
Z
-.831(a)
Asymp.Sig.(2-tailed)
.406
aBasedonnegativeranks.
bWilcoxonSignedRanksTest
结果分析:
有结果可知,SIG〉0.05则接受原假设,则表明两台机床加工的产品平均直径没有显著差异。
5在一对实验中,先后用两种食物喂同一批猪的增重(磅)数据如下:
饲料A:
25,30,28,34,23,25,27,35,30,28,32,29,30,30,31,29,23,26
饲料B:
19,32,21,34,19,25,25,31,31,26,30,25,29,31,25,25,20,25
请检验两种饲料的效果是否一样。
实验步骤:
1)分析,由于是在同一批猪上做实验,数据具有相关性,故用相关样本的非参数检验;
2)按Analyze|NonparametricTests|2RelatedSamples顺序展开主对话框。
将喂A,B前后的数据变化选入TestPair(s)List框中,在TestType框中选中Wilcoxon复选项,按OK运行。
实验结果:
Ranks
N
MeanRank
SumofRanks
饲料B-饲料A
NegativeRanks
13(a)
9.58
124.50
PositiveRanks
3(b)
3.83
11.50
Ties
2(c)
Total
18
a饲料B<饲料A
b饲料B>饲料A
c饲料B=饲料A
TestStatistics(b)
饲料B-饲料A
Z
-2.937(a)
Asymp.Sig.(2-tailed)
.003
aBasedonpositiveranks.
bWilcoxonSignedRanksTest
结果分析:
有检验结果可知,p值0.003<0.05,则拒绝原假设,说明两种饲料的效果不一样。
实验六方差分析
一实验目的
1.理解方差分析的概念、原理及作用;
2.掌握用SPSS进行单因素、双因素及协方差分析的方法;
3.结合参考资料了解方差分析的其它方法及作用。
二实验内容
实验原理:
方差分析的基本原理是认为不同处理组的均值间的差别基本来源有两个:
(1)随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示,记作SS,组内自由度df;
(2)实验条件,即不同的处理造成的差异,称为组间差异。
用变量在各组的均值与总均值之偏差的总平方和表示,记作SS,组间自由度df。
单因素方差分析(One-wayANOVA)称为一维方差分析,它检验由单一因素影响的一个(或几个相互独立的)因变量,由因素各水平分组的均值之间的差异,是否具有统计意义,或者说它们是否来源于同一总体。
而如果同时研究两个或多个因子对试验结果(对单一的因变量)的影响,就称为双因子方差分析(Two-wayANOVA)。
协方差分析是利用线性回归的方法消除因素的影响后进行的方差比较。
就是说先从因变量的总偏差平方和中去除协变量对因变量的回归平方和,再对残差平方和进行分解,进行方差分析。
1有三条生产经生产同一种型号的产品,对每条生产线各观测其6天的日产量,得数据如表6-2所示,请问不同生产线的日产量是否有显著差异,置信水平为0.05。
表6-2三条生产线的日产量数据
生产线1564346414947
生产线2656863646254
生产线3484659485160
实验步骤:
1)分析:
由于有一个因素(观测量),而且是3个生产线。
故不能用独立样本T检验(仅适用两组数据),这里可用单因素方差分析;
2)数据的组织:
分成两列,一列是观测量,另一列是生产线(分别用1,2,3,标识);
3)由于方差分析的前提是各个水平下(这里是不同的饲料folder影响下的体
重weight)的总体服从方差相等的正态分布。
其中正态分布的要求并不是很严格,但对于方差相等的要求是比较严格的。
因此必须对方差相等的前提进行检验。
如下左图,点开Options,选中Homogeneityofvarianceest(方差齐性检验)。
4)通过上面的步骤,只能判断4种饲料对猪的体重是否有显著差异。
如果想进一步了解空间是哪种和其他组有显著性的均值差别(即哪种饲料更好好),就需要在多个样本均值间进行两两比较。
单击PostHoc按钮,打开击PostHoc按钮,打开One-WayANOVA:
PostHocMultipleComparisions对话框。
实验结果:
TestofHomogeneityofVariances
日产量
LeveneStatistic
df1
df2
Sig.
.595
2
15
.564
ANOVA
日产量
SumofSquares
df
MeanSquare
F
Sig.
BetweenGroups
768.444
2
384.222
13.362
.000
WithinGroups
431.333
15
28.756
Total
1199.778
17
PostHocTests
MultipleComparisons
DependentVariable:
日产量
LSD
(I)生产线
(J)生产线
MeanDifference(I-J)
Std.Error
Sig.
95%ConfidenceInterval
LowerBound
UpperBound
1
2
-15.67(*)
3.096
.000
-22.27
-9.07
3
-5.00
3.096
.127
-11.60
1.60
2
1
15.67(*)
3.096
.000
9.07
22.27
3
10.67(*)
3.096
.004
4.07
17.27
3
1
5.00
3.096
.127
-1.60
11.60
2
-10.67(*)
3.096
.004
-17.27
-4.07
●Themeandifferenceissignificantatthe
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 上机 实验 报告