统计学实验报告完成版.docx
- 文档编号:24288268
- 上传时间:2023-05-26
- 格式:DOCX
- 页数:24
- 大小:99.65KB
统计学实验报告完成版.docx
《统计学实验报告完成版.docx》由会员分享,可在线阅读,更多相关《统计学实验报告完成版.docx(24页珍藏版)》请在冰豆网上搜索。
统计学实验报告完成版
实验一:
EXCEL的数据整理与显示
一、实验目的及要求:
(一)目的
1.了解EXCEL的基本命令与操作、熟悉EXCEL数据输入、输出与编辑方法;
2.熟悉EXCEL用于预处理的基本菜单操作及命令;
3.熟悉EXCEL用于整理与显示的基本菜单操作及命令。
(二)内容及要求
根据学生实验数据2011-2012,
1.用Excel制作一张学生政治面貌的频数分布表,并绘制一张柱状图,反映不同政治面貌的学生人数分布情况。
政治面貌
汇总
共青团员
160
其他
7
中共党员
13
总计
180
2.对学生的体重进行等距分组,整理成频数分布表,并绘制直方图。
分组
频率
40-44
20
45-49
38
50-54
46
55-59
24
60-64
24
65-69
16
70-74
5
75-79
6
80-84
1
合计
180
3.编制生源与专业交叉分布的列联表,并画出雷达图,比较两个专业的学生生源的分布是否相似。
生源
专业
会计
物流
总计
北京、天津、上海
25
14
39
农村
13
12
25
省会城市
14
13
27
县城
23
14
37
小城镇、集镇
12
5
17
中等城市
23
12
35
总计
110
70
180
二、仪器用具
硬件:
计算机(安装Windows98、Windows2000或WindowsXP或以上)
软件:
EXCEL
三、实验原理
统计中数据整理与显示的相关理论。
四、实验方法与步骤
1.用Excel制作一张学生政治面貌的频数分布表,并绘制一张柱状图,反映不同政治面貌的学生人数分布情况。
1)菜单——数据——数据透视表和数据透视图
2)将政治面貌拉到列和数据中
计数项:
政治面貌
政治面貌
汇总
共青团员
160
其他
7
中共党员
13
总计
180
3)插入——图表——柱状图
2.对学生的体重进行等距分组,整理成频数分布表,并绘制直方图。
1)复制学生体重数据放入新的工作区——数据——排序
2)输入接受区域数据
44
49
54
59
64
69
74
79
84
3)工具——数据分析——直方图
4)输入区域选择体重数据,接受区域为
5)修改输出,结果如下
分组
频率
40-44
20
45-49
38
50-54
46
55-59
24
60-64
24
65-69
16
70-74
5
75-79
6
80-84
1
合计
180
6)选中表格——插入——图标,选择柱状图——修改分类间距
3.编制生源与专业交叉分布的列联表,并画出雷达图,比较两个专业的学生生源的分布是否相似。
1)数据——数据透视表和数据透视图——新建
2)将生源拉入列,专业拉入行,生源拉入数据
生源
专业
会计
物流
总计
北京、天津、上海
25
14
39
农村
13
12
25
省会城市
14
13
27
县城
23
14
37
小城镇、集镇
12
5
17
中等城市
23
12
35
总计
110
70
180
3)选中表格,插入——图标——雷达图
由上图看出,会计和物流的学生生源的分布相似。
五、实验结果与数据处理
1、频数分布表
计数项:
政治面貌
政治面貌
汇总
共青团员
160
其他
7
中共党员
13
总计
180
2、
分组
频率
40-44
20
45-49
38
50-54
46
55-59
24
60-64
24
65-69
16
70-74
5
75-79
6
80-84
1
合计
180
3、
生源
专业
会计
物流
总计
北京、天津、上海
25
14
39
农村
13
12
25
省会城市
14
13
27
县城
23
14
37
小城镇、集镇
12
5
17
中等城市
23
12
35
总计
110
70
180
六、讨论与结论
实验二:
EXCEL的数据特征描述、列联分析、多元回归分析
一、实验目的及要求:
(一)目的
熟悉EXCEL用于数据描述统计、列联分析、多元回归的基本菜单操作及命令。
(二)内容及要求
根据学生实验数据2011-2012,
1.对学生的身高进行描述统计,说明学生身高的一些基本特征。
2.对不同户口中贫困生的分布情况编制列联表,并分析贫困生的数量的多少是否与户口的不同是有关。
3.根据学生的体育成绩(y1)与学生的年龄(x1)、体重(x2)、身高(x3)和性别(x4)建立一个多元回归模型,并判断此模型有无意义。
二、仪器用具
硬件:
计算机(安装Windows98、Windows2000或WindowsXP或以上)
软件:
EXCEL
三、实验原理
统计中数据整理与显示的相关理论。
四、实验方法与步骤
1.对学生的身高进行描述统计,说明学生身高的一些基本特征。
1)在“工具”中的“数据分析”选择“描述统计”,其中“输入区域”为“身高”列。
身高
平均
164.7722222
标准误差
0.595129756
中位数
163.5
众数
155
标准差
7.984503536
方差
63.75229671
峰度
-0.696982464
偏度
0.248125331
区域
36
最小值
150
最大值
186
求和
29659
观测数
180
最大
(1)
186
最小
(1)
150
置信度(95.0%)
1.174372756
2.对不同户口中贫困生的分布情况编制列联表,并分析贫困生的数量的多少是否与户口的不同是有关。
1)在“数据”的“数据透视表和数据透视图”选择“数据透视表”,然后显示勾选“现有工作表”中的“布局”,其中“布局”为依次将“户口”拖至“列”区域,将“是否贫困生”拖至“行”区域,将“户口”拖至“数据”区域,至此完成,其结果显示如下:
计数项:
是否贫困生
是否贫困生
户口
否
是
总计
城市户口
125
11
136
农村户口
38
6
44
总计
163
17
180
2)将做好的数据透视表“选择性粘贴”,要勾选“数据”和“转置”;
3)根据公式计算出期望值,并绘制期望值和观察值表格,结果显示如下:
贫困生占总人数的比例:
17/180*100%=9.4%
非贫困生占总人数的比例:
163/180*100%=90.6%
观察值
期望值
125
123
11
13
38
40
6
4
选择函数“CHITEST”,“Actual_range”选中观察值数据,“Expected_range”选中期望值数据。
3.根据学生的体育成绩(y1)与学生的年龄(x1)、体重(x2)和身高(x3)和性别(x4)建立一个多元回归模型,并判断此模型有无意义。
1)新建“sheet4”,将“性别”“年龄”“体重”“身高”“体育成绩”四列复制,粘贴到“sheet4”;
2)在“sheet4”中将“性别”列复制,然后粘贴到现有工作表,其中要将“性别”改为“代码”,在“编辑”中的“查找和替换”中用“0”替代“男”,用“1”替代“女”;
3)在空白列首行输入“Y”,选择“筛选”中的“自动筛选”,其中“性别”为“男”,在“Y”列的空白格为“男生的体育成绩/1”,同理可得女生的“Y”值为“女生的体育成绩/0.8”;
4)在“工具”中的“数据分析”中选择“回归”,然后在“Y值输入区域”选中“Y”列数据;“X值输入区域”选中“代码”“年龄”“体重”“身高”四列数据,选择“选择输出区域’,至此完成。
五、实验结果与数据处理
(一)描述统计
身高
平均
164.7722222
标准误差
0.595129756
中位数
163.5
众数
155
标准差
7.984503536
方差
63.75229671
峰度
-0.696982464
偏度
0.248125331
区域
36
最小值
150
最大值
186
求和
29659
观测数
180
最大
(1)
186
最小
(1)
150
置信度(95.0%)
1.174372756
学生身高的基本特征:
该数据为右偏分布,众数<中位数<平均数;学生身高平均值约为164.77厘米,中位数为163.5厘米,众数位155厘米。
还有学生身高的方差和标准差都比较大,说明学生中身高差距大,分布比较不平衡。
(二)经过excel统计得出如下列联表:
不同城市户口中贫困生的分布情况列联表
计数项:
是否贫困生
是否贫困生
户口
否
是
总计
城市户口
125
11
136
农村户口
38
6
44
总计
163
17
180
根据excel计算结果得出,相关性为:
0.696,即P=0.696136326>α=0.05,不能拒绝原假设,因此是否贫困生与户口是无关的。
(三)多元回归模型
SUMMARYOUTPUT
回归统计
MultipleR
0.796934
RSquare
0.635103
AdjustedRSquare
0.626763
标准误差
25.01996
观测值
180
方差分析
df
SS
MS
F
SignificanceF
回归分析
4
190671.3
47667.83
76.14687
2.7701E-37
残差
175
109549.7
625.9985
总计
179
300221
Coefficients
标准误差
tStat
P-value
Lower95%
Upper95%
下限95.0%
上限95.0%
Intercept
404.13
82.63214
4.890712
2.26E-06
241.046221
567.2139
241.0462
567.2139
XVariable1
-1.66712
2.046022
-0.81481
0.416287
-5.7051787
2.37093
-5.70518
2.37093
XVariable2
0.306909
0.339212
0.904772
0.36683
-0.3625633
0.976381
-0.36256
0.976381
XVariable3
-0.91951
0.427453
-2.15114
0.032836
-1.7631378
-0.07589
-1.76314
-0.07589
XVariable4
56.93088
6.201459
9.180239
1.2E-16
44.6916004
69.17015
44.6916
69.17015
回归模型:
y=404.13-1.66712X1+0.306909X2-0.91951X3+56.93088X4
AdjustedRSquare=0.626763,即解释力度为62.6763%;
F检验:
将SignificanceF值(即P值)与给定的α=0.05进行比较,因为SignificanceF=2.7701E-37<α=0.05,所以学生的年龄、体重、身高和性别与学生的体育成绩之间的线性关系显著;
t检验:
直接用p值进行比较,可以看出,其中x3和x4对应的p值小于0.05,通过t检验,但x1和x2对应的p值大于0.05,未通过检验。
这说明了:
在影响体育成绩的4个变量中只有身高和性别的影响是显著的,而其他2个变量均不显著。
小结:
虽然该模型中的因变量(体育成绩)与各自变量之间总体显著,但因变量与其中两个自变量的线性关系并不显著,因此该模型虽然有一定意义,但说明力度不大。
六、讨论与结论
在做实验过程中经常忘记如何应用Excel的功能,还有对于书上的一些重要的公式没有掌握好,其中主要是期望的计算和相关性系数的检验的很不熟悉。
实验三:
时间序列分析
一、实验目的及要求:
(一)目的
掌握EXCEL用于移动平均、线性趋势分析的基本菜单操作及命令。
(二)内容及要求
综合运用统计学时间序列中的移动平均、季节指数运算、时间序列因素分解、图形展示等知识,并结合经济学等方面的知识,对一家大型百货公司最近几年各季度的销售额数据(见Book13)的构成要素进行分解,并绘制图形进行分析。
二、仪器用具
硬件:
计算机(安装Windows98、Windows2000或WindowsXP或以上)
软件:
EXCEL
三、实验原理
时间序列分析中的移动平均分析原理、季节指数原理等。
四、实验方法与步骤
(一)季节指数和季节变动图
1.完善“年/季度”列和“时间标号”列;
2.在“粘贴”中“选择性粘贴”(其中要勾选“数值”和“转置”)将“销售额”从“sheet1”复制粘贴到“sheet2”中的“销售额”列;
3.分别计算数值。
第一,计算移动平均值。
在数据分析中选择移动平均,输入区域选择“销售额”列,在输出区域选择“移动平均值”列,其中间隔值为4;第二,计算中心化后的移动平均值。
在数据分析中选择移动平均,输入区域选择“移动平均值”列,在输出区域选择“中心化后的移动平均值”列,其中间隔值为2;第三,计算比值。
用“C7/E7”求出“比值”列的值;第四,计算季节指数。
用“选择性粘贴”(并注意勾选“数值”和“转置”)将“比值”列的值复制粘贴到“各季节指数计算表”;进行合计,得出∑值,通过∑/9得出平均值。
通过平均值的合计值/4得出误差1.003823,最后求出季节指数=∑/1.003823;
4.画出季节变动图。
在常用工具栏的“图标向导”图标中选择“折线图”,其中在系列中删除“季节”并在“标题”中的“分类(X)轴”填“季节”至此得出季节变动图。
(二)各项趋势值
第一,补充完整“sheet3”里的“年/季度”列和“时间标号”列,用“选择性粘贴”将“季节指数”从“sheet2”粘贴到“sheet3”;
第二,算“季节分离后的时间序列”。
用“销售额/季节指数”求出“季节分离后的时间序列”;
第三,求出回归后的趋势。
在“工具”中的“数据分析”中选择“回归”,其中在“Y值输入区域”选择“季节分离后的时间序列”列,在“X值输入区域”选择“时间标号”列,还有在“输出区域”选择“SUMMARYOUTPUT”→回归统计表,方差分析表,标准误差。
计算出回归后的趋势(T)=2043.392+163.7064*时间标号;
第四,计算算出最终预测值,用季节指数(S)*回归后的趋势(T);
第五,计算出预测误差,用销售额(Y)-最终预测值。
(三)用一张线图显示各期实际销售额、季节分离后的销售额、季节分离后的趋势的对比情况
在常用工具栏的“图标向导”图标中选择“折线图”,其中数据区域选“销售额”“季节分离后的时间序列”“回归后的趋势”,得出线图。
(四)绘制销售额预测图
在常用工具栏的“图标向导”图标中选择“折线图”,其中数据区域选“销售额”“最终预测值”,得出线图。
五、实验结果与数据处理
(一)季节指数和季节变动图
季节
指数
1
0.751728
2
0.851278
3
1.234322
4
1.162672
(二)各项趋势值
年/季度
时间标号
销售额(Y)
季节指数(S)
季节分离后的时间序列(Y/S)
回归后的趋势(T)
最终预测值
预测误差
1991/1
1
993.1
0.751728
1321.09
2207.10
1659.137
-666.037
2
2
971.2
0.851278
1140.873
2370.80
2018.214
-1047.01
3
3
2264.1
1.234322
1834.287
2534.51
3128.402
-864.302
4
4
1943.3
1.162672
1671.408
2698.22
3137.142
-1193.84
1992/1
5
1673.6
0.751728
2226.338
2861.92
2151.388
-477.788
2
6
1931.5
0.851278
2268.941
3025.63
2575.653
-644.153
3
7
3927.8
1.234322
3182.152
3189.34
3936.668
-8.86769
4
8
3079.6
1.162672
2648.726
3353.04
3898.49
-818.89
1993/1
9
2342.4
0.751728
3116.021
3516.75
2643.638
-301.238
2
10
2552.6
0.851278
2998.55
3680.46
3133.092
-580.492
3
11
3747.5
1.234322
3036.08
3844.16
4744.933
-997.433
4
12
4472.8
1.162672
3847
4007.87
4659.837
-187.037
1994/1
13
3254.4
0.751728
4329.227
4171.57
3135.889
118.5111
2
14
4245.2
0.851278
4986.854
4335.28
3690.53
554.6696
3
15
5951.1
1.234322
4821.352
4498.99
5553.199
397.9012
4
16
6373.1
1.162672
5481.425
4662.69
5421.185
951.9154
1995/1
17
3904.2
0.751728
5193.635
4826.40
3628.14
276.0605
2
18
5105.9
0.851278
5997.922
4990.11
4247.969
857.9309
3
19
7252.6
1.234322
5875.777
5153.81
6361.464
891.1357
4
20
8630.5
1.162672
7422.987
5317.52
6182.532
2447.968
1996/1
21
5483.2
0.751728
7294.129
5481.23
4120.39
1362.81
2
22
5997.3
0.851278
7045.053
5644.93
4805.408
1191.892
3
23
8776.1
1.234322
7110.058
5808.64
7169.73
1606.37
4
24
8720.6
1.162672
7500.481
5972.35
6943.88
1776.72
1997/1
25
5123.6
0.751728
6815.765
6136.05
4612.641
510.9592
2
26
6051
0.851278
7108.135
6299.76
5362.847
688.1534
3
27
9592.2
1.234322
7771.231
6463.46
7977.995
1614.205
4
28
8341.2
1.162672
7174.163
6627.17
7705.227
635.9729
1998/1
29
4942.4
0.751728
6574.72
6790.88
5104.891
-162.491
2
30
6825.5
0.851278
8017.943
6954.58
5920.285
905.2146
3
31
8900.1
1.234322
7210.518
7118.29
8786.261
113.8391
4
32
8723.1
1.162672
7502.631
7282.00
8466.575
256.5254
1999/1
33
5009.9
0.751728
6664.513
7445.70
5597.142
-587.242
2
34
6257.9
0.851278
7351.181
7609.41
6477.724
-219.824
3
35
8016.8
1.234322
6494.903
7773.12
9594.526
-1577.73
4
36
7865.6
1.162672
6765.106
7936.82
9227.922
-1362.32
2000/1
37
6059.3
0.751728
8060.497
8100.53
6089.393
-30.0926
2
38
5819.7
0.851278
6836.426
8264.23
7035.163
-1215.46
3
39
7758.8
1.234322
6285.881
8427.94
10402.79
-2643.99
4
40
8128.2
1.162672
6990.965
8591.65
9989.27
-1861.07
2.季节分离后的趋势(T)
SUMMARYOUTPUT
回归统计
MultipleR
0.882769191
RSquare
0.779281444
AdjustedRSquare
0.773473061
标准误差
1031.833918
观测值
40
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 实验 报告 完成