spss案例大数据分析报告.doc
- 文档编号:88608
- 上传时间:2022-10-02
- 格式:DOC
- 页数:12
- 大小:557.50KB
spss案例大数据分析报告.doc
《spss案例大数据分析报告.doc》由会员分享,可在线阅读,更多相关《spss案例大数据分析报告.doc(12页珍藏版)》请在冰豆网上搜索。
Spss期末作业
关于我国城镇居民消费结构及趋势的数据分析
本次分析采用的数据来源于《中国统计年鉴—2011》,我选用的是其中的第十篇章—人民生活下的城镇居民家庭基本情况的相关数据,用以研究城镇居民消费结构及其趋势。
(附数据部分截图)
(A)下面是我对该数据做的相关分析。
表一给出的是基本的描述性统计图,表中显示各个变量的全部观测量的均值、标准差和观测值总数N,表2给出的是相关系数矩阵表,其中显示4个变量两两之间的pearson相关系数,以及关于相关关系等于零的假设的单侧显著性检验概率。
描述性统计量
均值
标准差
N
食品
2744.0660
1802.80584
5
衣着
775.8200
555.67616
5
居住
694.1920
565.48222
5
家庭设备用品及服务
488.2500
343.94006
5
表1描述性统计表
相关性
食品
衣着
居住
家庭设备用品及服务
食品
Pearson相关性
1
.998**
.991**
.995**
显著性(单侧)
.000
.001
.000
平方与叉积的和
1.300E7
4000739.197
4039135.855
2468266.142
协方差
3250108.892
1000184.799
1009783.964
617066.535
N
5
5
5
5
衣着
Pearson相关性
.998**
1
.985**
.994**
显著性(单侧)
.000
.001
.000
平方与叉积的和
4000739.197
1235103.975
1238672.922
760246.419
协方差
1000184.799
308775.994
309668.230
190061.605
N
5
5
5
5
居住
Pearson相关性
.991**
.985**
1
.996**
显著性(单侧)
.001
.001
.000
平方与叉积的和
4039135.855
1238672.922
1279080.565
775005.410
协方差
1009783.964
309668.230
319770.141
193751.352
N
5
5
5
5
家庭设备用品及服务
Pearson相关性
.995**
.994**
.996**
1
显著性(单侧)
.000
.000
.000
平方与叉积的和
2468266.142
760246.419
775005.410
473179.063
协方差
617066.535
190061.605
193751.352
118294.766
N
5
5
5
5
**.在.01水平(单侧)上显著相关。
表2相关系数矩阵
从表2中可以看出家庭设备用品及服务与食品、衣着之间相关系数分别为0.995、0.994,反映家庭设备用品及服务与食品、衣着之间存在显著的相关关系。
说明食品与衣着对家庭设备用品及服务条件的好转有显著的作用,此外食品与衣着之间,食品与居住之间,居住与衣着之间的相关系数分别为0.998、0.991、0.985,这说明他们之间也存在着显著的相关关系。
在这里还要提一下相关系数旁边的两个星号的意思,它表示显著性水平α为0.01时仍拒绝原假设,一个星号则表示显著性水平α为0.05时可拒绝原假设。
因此,两个星号比一个星号拒绝原假设犯错误的可能性更小。
(B)下面是做的回归分析
表3给出了进入模型和被剔除的变量的信息。
从表中我们可以看出所有3个自变量都进入模型,说明我们的解释变量都是显著并且是有解释力的。
表4给出了模型整体拟合效果的概述,模型的拟合优度系数为1.000,反映了因变量于自变量之间具有高度显著的线性关系。
表里还显示了R平方以及经调整的R值估计标准误差
表5给出了方差分析表我们可以看到模型的设定检验F统计量的值为411.727,显著性水平的P值为0.036。
表6给出了回归系数表和变量显著性检验的T值。
我们发现变量“食品”的T值太小,没有达到显著性水平,因此我们要将这个变量剔除。
从这里我们也可以看出模型虽然通过了设定检验,但很有可能不能通过变量的显著性检验。
输入/移去的变量
模型
输入的变量
移去的变量
方法
1
居住,衣着,食品a
.
输入
a.已输入所有请求的变量。
表3变量进入/剔除信息表
模型汇总
模型
R
R方
调整R方
标准估计的误差
1
1.000a
.999
.997
19.56464
a.预测变量:
(常量),居住,衣着,食品。
表4模型概述表
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
472796.288
3
157598.763
411.727
.036a
残差
382.775
1
382.775
总计
473179.063
4
a.预测变量:
(常量),居住,衣着,食品。
b.因变量:
家庭设备用品及服务
表5方差分析表
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
86.022
42.902
2.005
.295
食品
-.160
.133
-.838
-1.204
.441
衣着
.674
.349
1.090
1.934
.304
居住
.458
.141
.752
3.256
.190
a.因变量:
家庭设备用品及服务
表6回归系数表
残差统计量a
极小值
极大值
均值
标准偏差
N
预测值
118.2242
901.6300
488.2500
343.80092
5
残差
-11.58816
7.57571
.00000
9.78232
5
标准预测值
-1.076
1.202
.000
1.000
5
标准残差
-.592
.387
.000
.500
5
a.因变量:
家庭设备用品及服务
表7残差统计表
表7给出了残差分析表,表中显示了预测值、残差、标准化预测值、标准化残差的最小值、最大值、均值、标准偏差及样本容量等数据。
根据概率的3西格玛原则,标准化残差的绝对值最大为0.387,小于3,说明样本数据中没有奇异值。
表8残差分布直方图
表8给出了模型的直方图。
由于我们在模型中始终假设残差服从正态分布,因此我们可以从这图中直观地看出回归后的实际残差是否符合我们的假设。
从回归残差的直方图与附于图上的正态分布曲线相比较,可以认为残差的分布不是明显地服从正态分布。
尽管这样也不能盲目的否定残差服从正态分布的假设,因为我们用了进行分析的样本太小,样本容量仅为5。
(C)spss参数检验分析(单样本t检验)
1.单样本t检验。
在这里我选择的是转移性收入这个变量做的分析,推断转移性收入的平均值是否为2200元,下面是分析后输出的结果。
单个样本统计量
N
均值
标准差
均值的标准误
转移性收入
5
2420.4600
2221.14998
993.32847
表9转移性收入的基本描述统计结果
单个样本检验
检验值=2200
t
df
Sig.(双侧)
均值差值
差分的95%置信区间
下限
上限
转移性收入
.222
4
.835
220.46000
-2537.4620
2978.3820
表10转移性收入单样本t检验结果
由表9可知,五个年份的转移性收入的平均值为2420.4600元,标准差为2221.14元,均值的标准误差为993.32。
从表10中可以看出,该问题应采用双尾检验,因此比较α/2和p/2,也就是比较α和Ρ。
如果α给0.05,由于Ρ大于α,因此不应
拒绝原假设,不能认为转移性收入的平均值与2200有显著差异。
(D)比率分析
案例处理摘要
计数
总数
5
排除的
0
总计
5
工资性收入/平均每人全部年收入的比率统计量
均值
.714
平均数绝对值偏差
.048
离散系数
.068
方差系数
均值居中
8.7%
中值居中
8.7%
表11案例处理摘要
表12工资性收入的比率分析结果
表11是案例处理摘要,表12显示的是工资性收入的比率分析结果,从表12可以看出五个年份的工资性收入占平均每人全部年收入的比率的均值为0.714,也就是说,五个年份的城镇居民平均每人全部年收入中的71.4%为工资性收入,由此可见工资性收入对城镇居民生活状况改善的重要性。
(E)因子分析
在这里先将分析后得到的结果展示如下:
相关矩阵a
食品
衣着
居住
家庭设备用品及服务
医疗保健
相关
食品
1.000
.998
.991
.995
.986
衣着
.998
1.000
.985
.994
.981
居住
.991
.985
1.000
.996
.996
家庭设备用品及服务
.995
.994
.996
1.000
.990
医疗保健
.986
.981
.996
.990
1.000
a.此矩阵不是正定矩阵。
表13相关系数矩阵
公因子方差
初始
提取
食品
1.000
.995
衣着
1.000
.991
居住
1.000
.994
家庭设备用品及服务
1.000
.997
医疗保健
1.000
.988
提取方法:
主成份分析。
表14公因子方差
解释的总方差
成份
初始特征值
提取平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
1
4.965
99.300
99.300
4.965
99.300
99.300
2
.027
.538
99.838
3
.006
.118
99.956
4
.002
.044
100.000
5
3.718E-17
7.436E-16
100.000
提取方法:
主成份分析。
表15解释的总方差
表16因子的碎石图
表18成分得分系数矩阵
成份矩阵a
成份
1
家庭设备用品及服务
.999
食品
.997
居住
.997
衣着
.995
医疗保健
.994
提取方法:
主成分分析法。
a.已提取了1个成份。
成份得分系数矩阵
成份
1
食品
.201
衣着
.200
居住
.201
家庭设备用品
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 案例 数据 分析 报告