数据分析课后答案spss.docx
- 文档编号:30257894
- 上传时间:2023-08-13
- 格式:DOCX
- 页数:51
- 大小:293.67KB
数据分析课后答案spss.docx
《数据分析课后答案spss.docx》由会员分享,可在线阅读,更多相关《数据分析课后答案spss.docx(51页珍藏版)》请在冰豆网上搜索。
数据分析课后答案spss
习题1.3
統計資料
全国居民
N
有效
22
遺漏
0
平均數
1117.00
中位數
727.50
標準偏差
1015.717
變異數
1031680.286
偏斜度
1.025
偏斜度標準誤
.491
峰度
-.457
峰度標準誤
.953
百分位數
25
304.25
50
727.50
75
1893.50
(1).由表可知,全国居民的均值、方差、标准差、偏度、峰度分别为1117.00、1031680.286、1015.717、1.025、-0.457。
变异系数有公式
计算得90.9325。
(2)中位数为727.50,上四分位数304.35,下四分位数为1893.50。
四分位极差由公式
得到1579.15
三均值由公式
得到913.1857。
(3)直方图
(4)茎叶图
全国居民Stem-and-LeafPlot
FrequencyStem&Leaf
9.000.122223344
5.000.56788
2.001.03
1.001.7
1.002.3
3.002.689
1.003.1
Stemwidth:
1000
Eachleaf:
1case(s)
(5)
由箱图可以看出并不异常点。
統計資料
农村居民
N
有效
22
遺漏
0
平均數
747.86
中位數
530.50
標準偏差
632.198
變異數
399673.838
偏斜度
1.013
偏斜度標準誤
.491
峰度
-.451
峰度標準誤
.953
百分位數
25
239.75
50
530.50
75
1197.00
(1).由图可知农村居民的平均数、方差、标准差、偏度、峰度分别为747.86、399673.838、632.198、1.013、-0.451。
由公式可以算得变异系数为84.5342。
(2)中位数530.50,上四分位数239.75,下四分位数1197.00。
由公式可得四分位极差为957.25,三均值为624.4375。
(3)
茎叶图
农村居民Stem-and-LeafPlot
FrequencyStem&Leaf
10.000.1111222334
6.000.555678
2.001.14
4.001.7889
Stemwidth:
1000
Eachleaf:
1case(s)
(4)
箱图表明了并无异常点。
統計資料
城镇居民
N
有效
22
遺漏
0
平均數
2336.41
中位數
1499.50
標準偏差
2129.821
變異數
4536136.444
偏斜度
.970
偏斜度標準誤
.491
峰度
-.573
峰度標準誤
.953
百分位數
25
596.25
50
1499.50
75
4136.75
(1)由表可知城镇居民均值、方差、标准差、偏度、峰度为2336.41、4536136.444、2129.821、0.970、-0.573。
变异系数为91.1578。
(2)中位数1499.50、上四分位数596.25、下四分位数4136.75、四分位极差3540.5、三均值为1933。
(3)
(4)茎叶图
城镇居民Stem-and-LeafPlot
FrequencyStem&Leaf
9.000.444556689
5.001.04569
1.002.3
2.003.08
1.004.8
2.005.47
2.006.26
Stemwidth:
1000
Eachleaf:
1case(s)
(5)箱图
箱图可以看出无异常点。
1.4
統計資料
月11
N
有效
31
遺漏
0
平均數
19.1665
中位數
14.7700
標準偏差
19.79977
變異數
392.031
偏斜度
2.515
偏斜度標準誤
.421
峰度
8.267
峰度標準誤
.821
百分位數
25
6.2400
50
14.7700
75
20.3400
(1).11月份的收入均值为19.1665、方差为392.031、标准差为19.79977、偏度为2.515、峰度为8.267、变异系数为103.304.
(2)中位数为14.7700,上四分位数6.2400、下四分位数20.3400、四分位极差为14.1。
(3)
(4)
Pearson相关系数分别为1,0.976spearman相关系数为1,0.928.
相關
月11
月1
月11
皮爾森(Pearson)相關
1
.976
顯著性(雙尾)
.000
N
31
31
月1
皮爾森(Pearson)相關
.976
1
顯著性(雙尾)
.000
N
31
31
相關
月11
月1
Spearman的rho
月11
相關係數
1.000
.928
顯著性(雙尾)
.
.000
N
31
31
月1
相關係數
.928
1.000
顯著性(雙尾)
.000
.
N
31
31
統計資料
月1
N
有效
31
遺漏
0
平均數
246.1932
中位數
179.4100
標準偏差
232.97210
變異數
54275.998
偏斜度
1.916
偏斜度標準誤
.421
峰度
4.385
峰度標準誤
.821
百分位數
25
103.8100
50
179.4100
75
273.2900
1月到11月收入平均数为246.1932、方差为54275.998、标准差为232.97210、偏度为1.916、峰度为4.385、变异系数为96.6297
中位数179.4100,上四分位数103.8100,下四分位数273.2900,四分位极差169.48.
习题1.6
中位数向量M=(18.100,27.400,4.800,34.100)
相關
x1
x2
x3
x4
x1
皮爾森(Pearson)相關
1
.766**
.385
.336
顯著性(雙尾)
.000
.085
.136
N
21
21
21
21
x2
皮爾森(Pearson)相關
.766**
1
.427
.340
顯著性(雙尾)
.000
.054
.131
N
21
21
21
21
x3
皮爾森(Pearson)相關
.385
.427
1
.613**
顯著性(雙尾)
.085
.054
.003
N
21
21
21
21
x4
皮爾森(Pearson)相關
.336
.340
.613**
1
顯著性(雙尾)
.136
.131
.003
N
21
21
21
21
**.相關性在0.01層上顯著(雙尾)。
Pearson相关系数为
1
0.7661
0.3850.4271
0.3360.3400.6131
同理可得显著性检验,spearman相关系数和显著性检验
相關
x1
x2
x3
x4
Spearman的rho
x1
相關係數
1.000
.790**
.434*
.431
顯著性(雙尾)
.
.000
.049
.051
N
21
21
21
21
x2
相關係數
.790**
1.000
.511*
.488*
顯著性(雙尾)
.000
.
.018
.025
N
21
21
21
21
x3
相關係數
.434*
.511*
1.000
.691**
顯著性(雙尾)
.049
.018
.
.001
N
21
21
21
21
x4
相關係數
.431
.488*
.691**
1.000
顯著性(雙尾)
.051
.025
.001
.
N
21
21
21
21
**.相關性在0.01層上顯著(雙尾)。
*.相關性在0.05層上顯著(雙尾)。
习题1.7
統計資料
x1
x2
x3
N
有效
50
50
50
遺漏
0
0
0
平均數
14.4100
16.0200
4.2300
中位數
15.0000
15.0000
4.0000
(1)均值向量为(14.4100,16.0200,4.2300)
中位数向量(15.000,15.000,4.000)
相關
x1
x2
x3
Spearman的rho
x1
相關係數
1.000
.546**
.507**
顯著性(雙尾)
.
.000
.000
N
50
50
50
x2
相關係數
.546**
1.000
.530**
顯著性(雙尾)
.000
.
.000
N
50
50
50
x3
相關係數
.507**
.530**
1.000
顯著性(雙尾)
.000
.000
.
N
50
50
50
**.相關性在0.01層上顯著(雙尾)。
相關
x1
x2
x3
Spearman的rho
x1
相關係數
1.000
.546**
.507**
顯著性(雙尾)
.
.000
.000
N
50
50
50
x2
相關係數
.546**
1.000
.530**
顯著性(雙尾)
.000
.
.000
N
50
50
50
x3
相關係數
.507**
.530**
1.000
顯著性(雙尾)
.000
.000
.
N
50
50
50
**.相關性在0.01層上顯著(雙尾)。
习题2.4
係數a
模型
非標準化係數
標準化係數
T
顯著性
B
標準錯誤
Beta
1
(常數)
3.453
2.431
1.420
.181
人数
.496
.006
.934
81.924
.000
收入
.009
.001
.108
9.502
.000
a.應變數\:
销量
(1).回归方程为y=3.453+0.496x1+0.009x2误差方差为4.740
變異數分析a
模型
平方和
df
平均值平方
F
顯著性
1
迴歸
53844.716
2
26922.358
5679.466
.000b
殘差
56.884
12
4.740
總計
53901.600
14
a.應變數:
销量
b.預測值:
(常數),收入,人数
模型摘要
模型
R
R平方
調整後R平方
標準偏斜度錯誤
1
.999a
.999
.999
2.177
a.預測值:
(常數),收入,人数
(2)显著性为.000表明销量与人数收入显著性强
复相关系数为0.999,很大说明y与x1,x2线性关系显著。
係數a
模型
非標準化係數
標準化係數
T
顯著性
B的^1信賴區間
B
標準錯誤
Beta
下限
上限
1
(常數)
3.453
2.431
1.420
.181
-1.843
8.749
人数
.496
.006
.934
81.924
.000
.483
.509
收入
.009
.001
.108
9.502
.000
.007
.011
a.應變數\:
销量
(3)置信区间分别为[0.483,0.509],[0.007,0.011]
(4)由系数表可以看出x1,x2对y影响显著,再由表可知交互作用对y影响不大。
係數a
模型
非標準化係數
標準化係數
T
顯著性
B的^1信賴區間
B
標準錯誤
Beta
下限
上限
1
(常數)
4.901
8.539
.574
.578
-13.892
23.695
人数
.491
.028
.925
17.344
.000
.429
.553
收入
.009
.003
.102
2.777
.018
.002
.016
z
1.698E-6
.000
.014
.178
.862
.000
.000
a.應變數\:
销量
(5)预测值为135.57141置信区间为[-1.8438.749]
(6)
殘差統計資料a
最小值
最大值
平均數
標準偏差
N
預測值
53.29
253.72
150.60
62.017
15
標準預測值
-1.569
1.663
.000
1.000
15
預測值的標準誤
.591
1.295
.955
.196
15
調整後預測值
52.67
254.39
150.47
61.978
15
殘差
-3.832
3.309
.000
2.016
15
標準殘差
-1.760
1.520
.000
.926
15
Stud.殘差
-1.925
1.891
.026
1.054
15
刪除的殘差
-4.583
5.122
.127
2.628
15
Stud.刪除的殘差
-2.217
2.161
.027
1.135
15
馬氏(Mahal.)距離
.099
4.022
1.867
1.085
15
庫克距離
.000
.653
.108
.166
15
置中的槓桿值
.007
.287
.133
.078
15
a.應變數:
销量
从图可以看出正态性假定不合理。
习题2.6
由图可以看出点分布不均匀需要对数据做变换。
习题2.7
係數a
模型
非標準化係數
標準化係數
T
顯著性
B
標準錯誤
Beta
1
(常數)
-27.512
6.558
-4.195
.000
高度
.349
.093
.135
3.744
.001
z
.168
.007
.911
25.222
.000
a.應變數\:
体积
此模型为y=-27.512+0.349x2+0.168x1^2
再进行残差分析
画出学生化残差的QQ图与2.6比较合理性强。
2.8
(1)方差分析表和系数表
變異數分析a
模型
平方和
df
平均值平方
F
顯著性
1
迴歸
24.856
4
6.214
64.091
.000b
殘差
4.557
47
.097
總計
29.414
51
a.應變數:
z
b.預測值:
(常數),x4,x2,x3,x1
係數a
模型
非標準化係數
標準化係數
T
顯著性
B
標準錯誤
Beta
1
(常數)
.472
.366
1.288
.204
x1
.149
.037
.305
3.995
.000
x2
.028
.003
.619
9.268
.000
x3
.024
.003
.618
8.204
.000
x4
.040
.065
.057
.613
.543
a.應變數\:
z
(2)
模型中的自变量
p
R方
X1
2
0.093
221.701
X2
2
0.353
144.381
X3
2
0.271
168.67
X4
2
0.467
110.515
X1,x4
3
0.457
112.32
X2.x4
3
0.608
68.27
X3,x4
3
0.534
89.86
X2,x3
3
0.723
34.56
X1,x2
3
0.412
125.34
X1,x3
3
0.422
122.29
X1,x2,x3
4
0.834
3.35
X1,x3,x4
4
0.535
88.85
X2,x3,x4
4
0.780
18.928
X1.x2.x3,x4
5
0.832
4.98
选择最优回归方程均为含自变量x1,x2,x3的拟合回归方程结果如表:
變異數分析a
模型
平方和
df
平均值平方
F
顯著性
1
迴歸
24.820
3
8.273
86.454
.000b
殘差
4.593
48
.096
總計
29.414
51
a.應變數:
z
b.預測值:
(常數),x3,x2,x1
係數a
模型
非標準化係數
標準化係數
T
顯著性
B
標準錯誤
Beta
1
(常數)
.350
.305
1.145
.258
x1
.164
.028
.335
5.801
.000
x2
.029
.003
.639
11.071
.000
x3
.025
.002
.647
11.211
.000
a.應變數\:
z
复相关系数的平方为0.834,与表2.8的结果变化明显,但模型包含的变量不变。
X4对Z的影响是很小的。
最优的回归方程:
Z=0.350+0.164x1+0.029x2+0.025x3
2.9
係數a
模型
非標準化係數
標準化係數
T
顯著性
B
標準錯誤
Beta
1
(常數)
162.876
25.776
6.319
.000
x1
-1.210
.301
-.613
-4.015
.001
x2
-.666
.821
-.177
-.811
.427
x3
-8.613
12.241
-.157
-.704
.490
a.應變數\:
y
方程为y=162.876-1.210x1-0.666x2-8.613x3
由正态QQ图可知正态性合理性较差。
(2)
模型中的自变量
p
R平方
X1
2
0.579
4.299
X2
2
0.314
19.01
X3
2
0.332
17.986
X1x2
3
0.631
2.495
X1x3
3
0.627
2.658
X2x3
3
0.334
18.129
X1x2x3
4
0.621
3.9997
由于模型中含有变量x1,x2的R方值最大所以选出最优回归方程为
係數a
模型
非標準化係數
標準化係數
T
顯著性
B
標準錯誤
Beta
1
(常數)
166.591
24.908
6.688
.000
x1
-1.260
.289
-.639
-4.359
.000
x2
-1.089
.551
-.289
-1.976
.062
a.應變數\:
y
y=-1.26x1-1.089x2+166.591
(3)由于spss的进入值与删除值不能相等所以无法得出结果
(4)残差分析的QQ图为:
习题3.4
如图产品的得率服从同方差的正态分布
變異數同質性測試
产品得率
Levene統計資料
df1
df2
顯著性
1.846
3
20
.171
變異數分析
产品得率
平方和
df
平均值平方
F
顯著性
群組之間
.006
3
.002
1.306
.300
在群組內
.030
20
.001
總計
.036
23
有方差齐性表可知显著性大于0.1接受原假设,方差不齐
方差分析表显著性为0.3大于0.01即四种不同的催化剂对某一化工产品得率的影响不显著。
3.5
(1)方差分析表可知过去三年科研经费投入的不同对当年生产力提高量有显著影响。
變異數分析
生产能力提高量
平方和
df
平均值平方
F
顯著性
群組之間
20.589
2
10.295
16.584
.000
在群組內
14.898
24
.621
總計
35.487
26
(2)
多重比較
因變數:
生产能力提高量
Bonferroni法
(I)科研经费投入
(J)科研经费投入
平均差異(I-J)
標準錯誤
顯著性
95%信賴區間
下限
上限
1
2
-1.2838*
.3417
.003
-2.163
-.404
3
-2.4622*
.4395
.000
-3.593
-1.331
2
1
1.2838*
.3417
.003
.404
2.163
3
-1.1785*
.4146
.027
-2.246
-.111
3
1
2.4622*
.4395
.000
1.331
3.593
2
1.1785*
.4146
.027
.111
2.246
*.平均值差異在0.05層級顯著。
-
置信区间[-2.163,-0.404]
置信区间[-3.593,-1.331]
置信区间[-2.246,-0.111]
所以
过去三年科研经费投入越高,当年生产能力的改善越显著。
习题3.6
各水平组合上的标准差和均值如图。
描述性統計資料
因變數:
存留量百分比
铁离子
剂量
平均數
標準偏差
N
Fe3
高剂量
3.6989
2.03087
18
中剂量
8.2039
5.44739
18
底剂量
11.7500
7.02815
18
總計
7.8843
6.1436
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 课后 答案 spss