多元统计分析作业一第三题文档格式.docx
- 文档编号:13481834
- 上传时间:2022-10-11
- 格式:DOCX
- 页数:7
- 大小:32.84KB
多元统计分析作业一第三题文档格式.docx
《多元统计分析作业一第三题文档格式.docx》由会员分享,可在线阅读,更多相关《多元统计分析作业一第三题文档格式.docx(7页珍藏版)》请在冰豆网上搜索。
人口增长(%)
文盲半文盲(%)
内蒙古
5068
31.1
2141
8.23
15.83
广西
4076
34.2
2040
9.01
13.32
贵州
2342
29.8
1551
14.26
28.98
云南
4355
31.3
2059
12.1
25.48
西藏
3716
43.5
15.9
57.97
宁夏
4270
37.3
1947
13.08
25.56
新疆
6229
35.4
2745
12.81
11.44
甘肃
3456
32.8
1612
10.04
28.65
青海
4367
40.9
2047
14.48
42.92
资料来源:
《中国统计年鉴(1998)》,北京,中国统计出版社,1998。
五项指标的全国平均水平为:
3.实验步骤及结果:
解:
(1)先利用SPSS软件检验各变量是否遵从多元正态分布(见输出结果1-1)
输出结果1-1
正态性检验
Kolmogorov-Smirnova
Shapiro-Wilk
统计量
Df
Sig.
df
人均GDP
.219
9
.200*
.958
.781
三产比重
.145
.925
.437
人均消费
.209
.873
.131
人口增长
.150
.949
.682
文盲半文盲
.246
.124
.898
.242
*.这是真实显著水平的下限。
a.Lilliefors显著水平修正
上表给出了对每一个变量进行正态性检验的结果,因为该例中样本数n=9,所以此处选用Shapiro-Wilk统计量。
则Sig.值分别为0.781、0.437、0.131、0.682、0.242均大于显著性水平,由此可以知道,人均GDP、三产比重、人均消费、人口增长、文盲半文盲这五个变量组成的向量均服从正态分布,即我们认为这五个指标可以较好对各地区社会经济发展水平做出近似的度量。
(2)提出原假设及备选假设
(3)做出统计判断,最后对统计判断作出具体的解释
SPSS的GLM模块可以完成多元正态分布有关均值与方差的检验。
依次点选AnalyzeGeneralLinearModelMultivariate……进入Multivariate对话框,将人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占15岁以上人口等这五项指标选入Dependent列表框,将分类指标选入FixedFactor(s)框,点击OK运行,则可以得到如下结果(见输出结果1-2)。
输出结果1-2
主体间因子
值标签
N
分类
1.00
边远及少数民族聚居区社会经济发展水平
2.00
全国经济平均发展水平
1
多变量检验a
效应
值
F
假设df
误差df
截距
Pillai的跟踪
.990
81.986b
5.000
4.000
.000
Wilks的Lambda
.010
Hotelling的跟踪
102.482
Roy的最大根
.834
4.029b
.101
.166
5.037
a.设计:
截距+分类
b.精确统计量
上面第一张表是样本数据分别来自边远及少数民族聚居区社会经济发展水平、全国的个数。
第二张表是多变量检验表,该表给出了几个统计量。
由Sig.值可以看到,无论从哪个统计量来看,两个分类的经济发展水平是无显著差别的。
实际上,GLM模型是拟合了下面的模型:
式中
(人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲)
上面多变量检验表实际上是对该线性模型显著性的检验,此处有常数项是因为不能肯定模型过原点。
而模型没有通过显著性检验,意味着分类中的不同取值对Y的取值无显著影响,也就是说,不同分类的经济发展水平是相同的。
但是,在实际中,我们往往更希望知道差别主要来自哪些分类,或者不同分类经济发展水平的比较。
对此,对GLM模块的选项作如下设置:
在GLM主对话框中点击Contrasts…按钮进入Contrasts对话框,在ChangeContrasts框架中打开Contrasts右侧的下拉框并选择Simple,此时下侧的ReferenceCategory被激活,默认是Last被选中,表明边远及少数民族聚居区社会经济发展水平与全国平均发展水平作比较,点击Change按钮,Continue继续,OK进行,得到如下结果(见输出结果1-3)
输出结果1-3
对比结果(K矩阵)
分类简单对比a
因变量
级别1和级别2
对比估算值
-2003.232
2.274
-1006.111
2.712
12.014
假设值
差分(估计-假设)
标准误差
1129.265
4.912
395.860
2.761
15.688
.114
.656
.035
.355
.466
差分的95%置信区间
下限
-4607.321
-9.053
-1918.967
-3.655
-24.162
上限
600.857
13.602
-93.256
9.079
48.190
a.参考类别=2
见输出结果1-3表示
(1)在显著性水平的水平下,可以看到Sig.值分别为0.114、0.656、0.035、0.355、0.466,由此我们可以知道边远及少数民族聚居区社会经济发展水平与全国平均发展水平中的人均消费存在显著差别,即全国的平均人均消费大于边远及少数民族聚居区人均消费,相差值为1006.111元。
人均GDP、三产比重、人口增长率、文盲半文盲等指标无明显差别。
(2)在显著性水平的水平下,可以看到Sig.值分别为0.114、0.656、0.035、0.355、0.466均大于显著性水平,我们可以看出边远及少数民族聚居区社会经济发展水平与全国平均发展水平中的人均GDP、三产比重、人均消费、人口增长率、文盲半文盲等指标无明显差别。
输出结果1-4
多变量检验结果
4.029a
Wilks的lambda
a.精确统计量
4.实验结果(或心得体会):
通过实验,得出输出结果1-4是上面多重比较可信性的度量,并且由Sig.值可以让我们看到,比较检验是可信的。
利用spss可将多指标数据进行良好的分析。
5.指导教师点评(总分100分,所列分值仅供参考,以下部分打印时不可以断页)
实验内容
出色完成30分
良好完成25分
基本完成20分
部分完成15分
初步完成5分
实验步骤
精益求精30分
比较完善25分
合乎要求20分
缺少步骤15分
少重要步骤5分
实验结论
(心得体会)
分析透彻20分
分析合理17分
合乎要求14分
结论单薄8分
难圆其说4分
工作态度
勇于探索20分
能够务实17分
中规中矩14分
华而不实8分
态度不端正0分
总分
有抄袭剽窃行为则实验成绩记为零分,并且严重警告!
!
教师签字:
日期:
年月日
注:
验证性实验仅上交电子文档,设计性试验需要同时上交电子与纸质文档进行备份存档。
欢迎下载,谢谢观看!
资料仅供参考学习
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计分析 作业 第三