数据分析实验报告Word格式.docx
- 文档编号:20864379
- 上传时间:2023-01-26
- 格式:DOCX
- 页数:16
- 大小:134.35KB
数据分析实验报告Word格式.docx
《数据分析实验报告Word格式.docx》由会员分享,可在线阅读,更多相关《数据分析实验报告Word格式.docx(16页珍藏版)》请在冰豆网上搜索。
GOO
4-1X
100^3
11
1sea
eoa
SOS
1-4-31
12!
1s>
os»
7*02
GGZ>
1ODD
1n
1990
QO3
S7I
■曰曰曰
14
S>
DECS
C521
1SI2O
1992
•107*0
z-ie
•1S
1993
1331
e<
5©
3ON7
17
i
•1X-46
11-1s
3391
1曰
1QQS
143/1
Z1E17/1
immm
zaenn
a了曰曰
S-43O
20
1QQ7-
1Q7G
G7-QG;
21
im曰曰
N曰了;
2
aeo©
曰wa了
NN
1mmm
3FE3O
Qosn
中位数等统计量。
2数据的描述,包括求均值、方差、分析一描述统计一频率,选择如下:
盘频率:
统计量
百分住值
集中趋势
□匹分銭◎
□为阖U):
□$分銭(B
□厳小值
□最大值
L'
.助值的核龛扇:
◎
0WM)
□台讣
匚鱼为组的中点(U
输出:
统计援
全国居民
农村居民
城镇居民
有效
22
缺失
均值
1116.82
747.86
2336.41
中值
727.50
530.50
1499.50
方盪
1031026.918
399673.838
4536136.444
百分位数
25
304.25
239.75
596.25
50
75
1893.50
1197.00
4136.75
3画直方图,茎叶图,QQ图。
(全国居民)分析一描述统计一探索,选择如下:
□皓唸谡的正态圉◎
伸購与纟脇I]Ieveng脸3S
0&
0?
水字分纽(E)不分组①
O无
O孚花计Q
O已恬検①滋|白热对菽
O*^WU)
描述性(D)
rcz/rfl
怀
1015^395
N-22
全国居民Stcm-and-LcafPlot
Frequency
Leaf
9.00
5.00
2.00
1.00
3.00
0・122223344
0・56788
1・03
1・7
2・3
2・689
3・1
Stemwidth:
1000
Eachleaf:
1casc(s)
分析一描述统计一00图,选择如下:
金国居风的正念Q-QPH
1high
变量
126
149
■L
143
4
141
5
127
6
123
137
8
132
9
135
10
134
1-1
1花
习题1.1
4数据正态性的检验:
K—S检验,W检验
数据:
取显著性水平为0.05
分析一描述统计一探索,选择如下:
-Kta;
±
E:
R)
(i)K—S检验
单样本Kolmogorov-Smirnov检验
身高
60
正态参数均值
139.00
标准濫
7.064
最极端盪别绝对值
.089
正
.045
负
・・089
Kolmogorov・SmirnovZ
.686
渐近显著性(双側)
.735
a•检验分布为正态分布。
b.根据数据计算得到。
结果:
p=0.735大于0.05接受原假设,即数据来自正太总体。
(2)W检验
正态性检验
Kolmogorov・Smirnov"
Shapiro-Wilk
统计虽
df
Sig.
.200*
.972
.174
a.Li11iefors显著水平修正
*.这是真实显著水平的卜•限。
在Shapiro-Wilk检验结果w0=0.972,p二0.174大于0.05接受原假设,即数据来自正太总体。
习题1.5
5多维正态数据的统计量
x1
x2
x3
x4
18.8
28.1
5.1
35.1
17.4
25.6
4.9
33.9
16.0
27.4
5.0
32.2
19.3
29.5
1.7
29.1
4.5
35.6
15.3
25.3
3.6
7
16.7
25.8
4.4
33.0
R
174
?
A7
44
昭fl
xl
N有效
18.219
27.867
4.505
33.767
均值向量为:
X=(18.21977.836,4.505,33.767)
项间协方差矩阵
3.509
2.707
1.019
1.266
3.559
1.139
1.289
1.998
1.740
4.032
相矢性
X1
Pearson相尖性
・766・・
.385
.336
显著性(双側)
.000
.085
.136
Pearson相矢性
.766“
.427
.340
显著性(双侧)
.054
.131
.613”
.003
.613“
和•在・01水平(双侧)上显著柑矢。
x4与其他数据无相关性,其他三组数据线性相关
相矢系数
XI
Spearman的rhoxl
1.000
.790“
.434*
.431
Sig.(双侧)
■
.049
.051
•790“
.511'
.488"
Sig.(双側)
•
.018
.025
.434
.69广
.001
.488'
.691“
和.在呂信度(双测)为0.01时,相尖性是显著的。
*.在宜信度(双测)为0・05时,相尖性是显著的“
由Spearman相关矩阵的输出结果看,取显著性水平0.1,p值皆小于0.1,所以数据相关性显著
习题2・4
city
number
people
income
162
274
2450
120
180
3254
223
375
3802
131
205
2838
67
86
2347
169
266
3782
81
96
n
Q
mn
ndcn
6线性回归线的拟合,回归系数的区间估计与假设检验,回归系数的选择、逐步回归。
7残差分析
分析一回归一线性,选择如下:
系数m
樟型
非标淮化系数
标准系数
t
B
标准误差
试用版
1(常呈)
人数
22.959
.528
3.741
.014
.995
6.137
37.663
・OQQ
2OB)
收入
3.548
.495
.009
2.470
.006
.934
.109
1.436
80.605
9.379
.176
•CIOO
・OOQ
乩因变昼销量
逐步回归结果:
y=0.495X]+0.009x2+3.548
两变量的系数p值均小于0.05均有统计学意义。
残差统计呈*
极小值
极丈值
标准偏差
预测值
52.93
253.66
150.60
62.015
15
残差
-3.870
3.313
2.049
标准预测值
-1.575
1.662
标准残差
-1.749
1.497
.926
a.因麦亘销量
山残差统汁量表看出,数据无偏离值,标准差比较小,认为模型健康。
概率论课本习题7・5
var
2830
2800
2795
2785
2820
8—个正态总体独立样本均值的t检验与区间估计
分析一比较均值一独立样本T检验:
输出:
One-SampleStatistics
Mean
Std.Deviation
Std.ErrorMean
折断力
2833.50
35.044
11.082
样本均值为2833.50与总体均值2820比较接近
One-SampleTest
TestValue=2820
Sig.(2-tailed)
MeanDifferenee
95%ConfidenceIntervalofthe
Difference
Lower
Upper
1.218
.254
13.500
・11.57
38.57
t值为1.218小于临界值2.26,且P值为0.254大于显著性水平0.05,接受原假设,即认为样本均值与总体均值之差可能是抽样误差所导致
概率论课本习题7.7
I応I
0.140
0.138
0.143
0.141
0.144
0.137
9两个正态总体均值差异比较的t检验与配对检验
分析一均值比较一独立样本T检验,选择如下:
曹定义俎区]
G>使用招定徴
俎统计量
批次
标淮差
均值的标准误
电阴1
.14050
.002739
.001118
.13850
.002665
.001088
独立祥本检验
方差方程的Levene检验
均值方程的t检验
差分的的9
。
置信区间
F
Siq.
均值差值
标准饯差值
下限
上限
电阻假设方差相等
1.282
.229
.002000
.001560
-.001476
.005476
假设方差不相等
9.992
・002000
・001560
P值为1大于显著性水平0.05,认为方差相等。
此时,p值(Sig.(2-tailed))为0.229大于显著性水平0.05,认为样本均值是相等的,即电阻均值没有显著性差异。
分析一比较均值一配对样本T检验,选择如下:
戒对爽量(Q:
成对祎本统计量
标准差
对1第一批
第二批
成对祎本相关系数
相关系数
Sici.
对1第一批&
-.041
.938
成对存本检验
成对差分
Sici.OSJtl)
葆准差
均佰的标准愎
差分的95%置信区间
对1第一批-第二批
.003899
.001592
-.002091
.006091
1.257
.264
结果同上:
认为样本均值是相等的,即电阻均值没有显著性差异。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 实验 报告