数理统计大作业文档格式.docx
- 文档编号:15512208
- 上传时间:2022-11-03
- 格式:DOCX
- 页数:12
- 大小:146.06KB
数理统计大作业文档格式.docx
《数理统计大作业文档格式.docx》由会员分享,可在线阅读,更多相关《数理统计大作业文档格式.docx(12页珍藏版)》请在冰豆网上搜索。
第一章引言
理论上认为影响成品钢材的需求量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。
为此,收集了我国成品钢材的需求量,选择与其相关的八个因素:
原油产量、生铁产量、原煤产量、发电量、铁路货运量、固定资产投资额、居民消费、政府消费作为影响变量,1980——1998年的有关数据如下表。
本题旨在通过建立这些经济变量的线性模型来说明影响成品钢材需求量的原因。
数据来源:
易丹辉.数据分析与EViews应用.中国人民大学出版社.2008(教材第85页)。
原始数据(中国统计年鉴):
年份
成品钢材(万吨)
原油(万吨)
生铁(万吨)
原煤(亿吨)
发电量(亿千瓦时)
铁路货运量(万吨)
固定资产投资额(亿元)
居民消费(亿元)
1980
2716.2
10595
3802.4
6.2
3006.2
111279
910.9
2317.1
1981
2670.1
10122
3416.6
3092.7
107673
961
2604.1
1982
2902
10212
3551
6.66
3277
113495
1230.4
2867.9
1983
3072
10607
3738
7.15
3514
118784
1430.1
3182.5
1984
3372
11461.3
4001
7.89
3770
124074
1832.9
3674.5
1985
3693
12489.5
4384
8.72
4107
130709
2543.2
4589
1986
4058
13068.8
5064
8.94
4495
135635
3120.6
5175
1987
4356
13414
5503
9.28
4973
140653
3791.7
5961.2
1988
4689
13704.6
5704
9.8
5452
144948
4753.8
7633.1
1989
4859
13764.1
5820
10.54
5848
151489
4410.4
8523.5
1990
5153
13830.6
6238
10.8
6212
150681
4517
9113.2
1991
5638
14009.2
6765
10.87
6775
152893
5594.5
10315.9
1992
6697
14209.7
7589
11.16
7539
157627
8080.1
12459.8
1993
7716
14523.7
8739
11.51
8395
162663
13072.3
15682.4
1994
8482
14608.2
9741
12.4
9281
163093
17042.1
20809.8
1995
8979.8
15004.94
10529.27
13.61
10070.3
165885
20019.3
26944.5
1996
9338.02
15733.39
10722.5
13.97
10813.1
168803
22974
32152.3
1997
9978.93
16074.14
11511.41
13.73
11355.53
169734
22913.5
34854.6
说明:
由于数据是经过人工录入的,经反复对照没有发现错误,因此就采用了此数据做回归模型。
但是也不能排除在录入过程中会出现一些小的错误,所以回归模型仅满足上表数据。
第二章问题假设
为了问题的简洁明了,现对题目中的变量给出以下假设:
中国成品钢材的需求量为(万吨)、原油产量(万吨)、生铁产量(万吨)、原煤产量(亿吨)、发电量(亿千瓦时)、铁路货运量(万吨)、固定资产投资额(亿元)、居民消费(亿元)、政府消费(亿元)作为影响变量,而且本题收集的数据均为定量变量,其符号和经济意义如下表:
变量
符号
代表意义
中国成品钢材的需求量为(万吨)
成品钢材需求总量
原油产量(万吨)
原油工业发展水平
生铁产量(万吨)
生铁工业发展水平
原煤产量(亿吨)
原煤工业发展水平
发电技术水平
运输产业水平
固定资产支出水平
居民支出水平
政府消费(亿元)
政府支出水平
第三章问题分析
在上述问题中,中国成品钢材的需求量(万吨)的影响因素不只是原油产量(万吨),还有生铁产量(万吨)、原煤产量(亿吨)、发电量(亿千瓦时)、铁路货运量(万吨)、固定资产投资额(亿元)、居民消费(亿元)、政府消费(亿元)等,这样因变量就与多个自变量有关。
因此,我们就可以采用多元线性回归进行问题的分析。
多元线性回归模型的基本形式:
设随机变量与一般变量的理论线性回归模型为:
其中,是个未知参数,称为回归常数,称为回归系数。
称为被解释变量(因变量),而是个可以精确测量并可控制的一般变量,称为解释变量(自变量)。
是随机误差,与一元线性回归一样,对随机误差项我们常假定
称
为理论回归方程。
第四章数据的预处理
4.1曲线统计图
分析:
从曲线统计图上我们可以大致的来看,变量和因变量在1980年到1986年的增长速度都相对平稳没有明显的增势;
从1986年到1993年,个变量开始缓慢增长;
从1993年到1998年,增长的幅度开始加大了。
的曲线近似为一条水平的直线,这两个变量分别表示原油和原煤的量,可能受到资源和政策的限制,因而增长的速度非常缓慢。
从图中可以明显看到随着年限的增加,我国的各种产业和支出水平都随之逐渐增长。
4.2散点统计图
从散点统计图上我们可以细致的来看,变量(铁路运货量)的变化最为明显,还可以清楚的看到1981年,1991年,1998年,因为一些特殊事件而导致的铁路运输量降低。
与在1980年到1986年的增长速度都相对平稳没有明显的增势,从1986年到1993年,个变量开始缓慢增长;
但是(原油)与(原煤)的产量却始终保持相对平稳的增长趋势,而却增长速度非常的缓慢,这可能是受到了资源的限制和国家政策的影响。
从散点图中可以很明显的看到各年的真是数据,还可以看出随着年限的增加,我国的各种产业和支出水平都随之逐渐增长。
第五章回归模型的建立及检验
5.1回归模型的建立
本次数据分析采用SPSS软件来进行。
将数据导入到SPSS中,然后用SPSS软件通过回归线性分析得到如下表数据:
模型汇总
模型
R
R方
调整R方
标准估计的误差
1
1.000a
.999
.998
113.19930
a.预测变量:
(常量),x1,x2,x3,x4,x5,x6,x7,x8。
根据模型汇总表得出以下结论,复相关系数,决定系数,通过决定系数来看回归方程高度显著。
Anovab
平方和
DF
均方
F
Sig.
回归
1.291E8
8
16139672.560
1259.526
.000a
残差
128140.806
10
12814.081
总计
1.292E8
18
b.因变量:
y
系数a
非标准化系数
标准系数
t
B
标准误差
试用版
(常量)
-381.485
912.146
-.418
.685
x1
.122
.107
.088
1.134
.283
x2
.125
.187
.135
.668
.519
x3
-149.154
121.354
-.141
-1.229
.247
x4
.653
.277
.723
2.359
.040
x5
.003
.023
.024
.131
.898
x6
.081
.042
.260
1.932
.082
x7
-.120
.047
-.522
-2.570
.028
x8
.394
.239
.434
1.646
a.因变量:
根据方差分析表,,P值=0.000,表明回归方程高度显著,说明从整体上对有显著的线性关系影响。
根据上述表可以得出对自变量的整体线性回归方程如下:
5.2回归模型的检验
5.2.1F检验
Anovab
df
(常量),x8,x5,x1,x3,x6,x2,x7,x4。
从结果来看,由,P值=0.000,因此可知回归方程高度显著,即做出8个自变量整体对因变量y产生显著线性影响的判断不可能发生错误。
5.2.2T检验
B的95.0%置信区间
下限
上限
-2413.874
1650.904
-.118
.361
-.292
.542
x
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数理统计 作业
![提示](https://static.bdocx.com/images/bang_tan.gif)