统计学 期末报告.docx
- 文档编号:29474262
- 上传时间:2023-07-23
- 格式:DOCX
- 页数:22
- 大小:297.08KB
统计学 期末报告.docx
《统计学 期末报告.docx》由会员分享,可在线阅读,更多相关《统计学 期末报告.docx(22页珍藏版)》请在冰豆网上搜索。
统计学期末报告
统计学期末课程实验报告
姓名学号
组长:
欧青青40804651
组员:
***40804328
王琴40804334
郑开淑40804314
李天锐40801341
刘俊才40802544
徐世超40802537
陈灿林40802126
陈理海40802143
谭睿40804343
第一部分关于地区对教育经费的投入的单因素方差分析
为研究地区对教育经费的投入是否有影响,我们做以地区为因素的单因素方差分析,具体分析过程如下。
原始数据:
建立假设
对于因素(地区):
H0:
μ1=μ2地区对教育经费无影响
H1:
μ1≠μ2地区对教育经费有影响
Excel输出的结果如下:
方差分析
SUMMARY
组
观测数
求和
平均
方差
北京
7
7462023
1066003
1.90895E+12
天津
7
2972795
424684.9
2.39331E+11
河北
7
8102272
1157467
1.71937E+12
山西
7
4853160
693308.6
6.77037E+11
内蒙古
7
3778568
539795.4
5.04472E+11
辽宁
7
7666565
1095224
1.63142E+12
吉林
7
3999536
571362.2
4.65067E+11
黑龙江
7
5133034
733290.6
7.71998E+11
上海
7
7822041
1117434
1.89303E+12
江苏
7
14659703
2094243
4.53467E+12
浙江
7
12099312
1728473
3.03304E+12
安徽
7
6367784
909683.4
1.09393E+12
福建
7
6016447
859492.5
8.68912E+11
江西
7
5322688
760384
6.34548E+11
山东
7
12317641
1759663
3.89919E+12
河南
7
10302533
1471790
3.13855E+12
湖北
7
6649542
949934.5
9.25611E+11
湖南
7
7652963
1093280
1.24731E+12
广东
7
19127605
2732515
7.86592E+12
广西
7
5105379
729339.9
7.89732E+11
海南
7
1361317
194473.9
52686589004
重庆
7
4059467
579923.9
3.73396E+11
四川
7
9053450
1293350
2.24224E+12
贵州
7
3878246
554035.1
5.43321E+11
云南
7
5174702
739243.2
9.43664E+11
西藏
7
836377.6
119482.5
38044692636
陕西
7
5310027
758575.3
5.99404E+11
甘肃
7
3170853
452979
3.57888E+11
青海
7
877736
125390.9
35036050662
宁夏
7
1193383
170483.3
58250941979
新疆
7
3564154
509164.9
4.68187E+11
方差分析
差异源
SS
df
MS
F
P-value
Fcrit
组间
7.25E+13
30
2.42E+12
1.71964546
0.016303
1.520659
组内
2.61E+14
186
1.4E+12
总计
3.34E+14
216
由分析可知,对于因素地区,因为:
P值<α,(α=0.05)则拒绝H0(原假设),表明地区对教育经费的投入有显著影响.
第二部分相关与回归分析
一、实验方案
(1)数据来源:
国家统计局——中国统计年鉴(2009)【20-6各级各类学校在校学生数及20-36各地区教育经费情况】
(2)现象相关分析:
由于国家在教育经费上投入的不同可能会引起普通高等学校学生就读的不同情况,因此我们选取普通高等学校的在校人数对就读情况做一个呈现,选取国家在教育经费上的投入为自变量,普通高等学校的在校学生人数为因变量对其进行相关与回归分析
二、原始数据
年份
教育经费(单位:
亿元)
普通高等在校人数(单位:
万人)
1992
867.0
218.4
1993
1059.9
253.6
1994
1488.8
279.9
1995
1878.0
290.6
1996
2262.3
302.1
1997
2531.7
317.4
1998
2949.1
340.9
1999
3349.0
413.4
2000
3849.1
556.1
2001
4637.7
719.1
2002
5480.0
903.4
2003
6208.3
1108.6
2004
7242.6
1333.5
2005
8418.8
1561.8
2006
9815.3
1738.8
2007
12148.1
1884.9
三、具体分析
1.散点图分析
2、相关回归分析
观测值
预测218.4
残差
1
132.90213
120.6978726
2
207.66618
72.2338232
3
275.51335
15.08665423
4
342.52724
-40.427244
5
389.49289
-72.0928923
6
462.24905
-121.349047
7
531.98145
-118.581446
8
619.15756
-63.0675559
9
756.63788
-37.5678781
10
903.49467
-0.13467302
11
1030.4546
78.14538292
12
1210.7789
122.7210638
13
1415.843
145.9336565
14
1659.3017
79.49834227
15
2065.9915
-181.096059
3、相关系数分析
列1
列2
列1
1
/
列2
0.984662768
1
数据解释:
因变量(普通高等学校在校人数)与自变量(教育经费)的相关系数为0.7<0.98466<1,所以因变量(普通高等学校在校人数)与自变量(教育经费)呈高度线性相关。
4、相关系数检验
Ý=-51.8859268720847+0.174338642381827Xi
取显著性水平α=0.05,查t分布表的自由度为16-2=14的临界值为1.7613,因为计算的t统计量21.11516967大于临界值,表明:
两变量间的相关系数是显著不为零的,即我国普通高等院校学生人数与教育经费之间是线性相关的关系。
5、可决系数
RSquare=0.970072137
数据解释:
因变量(普通高等学校在校人数)的变化有97%可以由自变量(教育经费)来解释。
6、预测
点预测:
如果通过其他方式预测2011年我国普通高等学校在校人数将增长19.36%即可到达14500亿元,
Ý=-51.886+0.174×14500=2476.02(亿元)
区间预测:
教育经费平均值=4636.6(亿元)
方差=11148901.64
Σ(Xi-
)2=167233524.6
取α=0.025查表得tα/2(n-2)=t0.025(15-2)=2.1448
标准误差=104.7343336
置信上下限:
2476.024-2.145*104.734*SQRT(1+(1/16)+(14500-4636.6)^2/167233524.6)=2187.98
2476.024+2.145*104.734*SQRT(1+(1/16)+(14500-4636.6)^2/167233524.6)=2764.07
区间下限=2187.98
区间上限=2764.07
当教育经费的投入为14500元时,普通高等学校的在校人数的置信度98%的预测区间为(2187.98亿元,2764.07亿元)
第三部分时间序列分析与预测
一实验方案
数据来源:
国家统计数据库季度数据(主要工业产品的生产﹑销售与库存2005-2009中国白酒销售量)
主要目的:
主要考察近几年中国白酒的销售量增长情况和每个季度的销售量,了解白酒的销售旺季和淡季,为生产商提供生产量的数据来源。
二原始数据
三时间序列指标分析
1.季度间的
逐期增长量
环比增长速度
70.3
76
127.4
83.29%
49.13%
55.22%
85.4
86.6
119
91.93%
185.15%
44.92%
98.1
117.2
156
86.28%
55.34%
47.42%
120.6
125.3
184.1
91.29%
49.58%
48.70%
171.1
124.7
194.5
123.81%
40.32%
44.82%
累计增长量
定基发展速度
70.3
146.3
273.7
183.29%
273.34%
424.29%
85.4
146.3
291
191.93%
285.15%
413.24%
98.1
215.3
371.3
186.28%
285.15%
426.56%
120.6
245.9
430
191.29%
286.15%
425.51%
171.1
295.8
490.3
223.81%
286.15%
454.78%
环比发展速度
定基增长速度
183.29%
149.13%
155.22%
83.29%
173.34%
324.29%
191.93%
285.15%
144.92%
91.93%
185.15%
313.24%
186.28%
155.34%
147.42%
86.28%
185.15%
326.56%
191.29%
149.58%
148.70%
91.29%
186.15%
325.51%
223.81%
140.32%
144.82%
123.81%
186.15%
354.78%
2.年份间的
逐期增长量
8.5
23.6
34.2
25.8
20.8
33.5
64.1
101.1
18.4
40.9
49
77.1
6.1
56.6
56
66.4
累计增长量
8.5
23.6
34.2
25.8
29.3
57.1
98.3
126.9
47.7
98
147.3
204
53.8
154.6
203.3
270.4
环比发展速度
110.07%
115.26%
114.82%
107.20%
122.39%
118.79%
124.20%
126.33%
116.18%
119.31%
114.89%
115.90%
104.62%
122.40%
114.81%
111.81%
环比增长速度
10.07%
15.26%
14.82%
7.20%
22.39%
18.79%
24.20%
26.33%
16.18%
19.31%
14.89%
15.90%
4.62%
22.40%
14.81%
11.81%
定基发展速度
110.07%
115.26%
114.82%
107.20%
134.72%
136.91%
142.61%
135.44%
156.52%
163.35%
163.85%
156.97%
163.74%
199.94%
188.12%
175.51%
定基增长速度
10.07%
15.26%
14.82%
7.20%
34.72%
36.91%
42.61%
35.44%
56.52%
63.35%
63.85%
56.97%
63.74%
99.94%
88.12%
75.51%
3.年度总量间
逐期增长量
92.1
平均增长量
170.525
219.5
185.4
185.1
累计增长量
92.1
311.6
497
682.1
环比发展速度
111.12%
平均发展速度
1.163061
123.86%
116.27%
113.97%
环比增长速度
11.12%
平均值
16.31%
23.86%
16.27%
13.97%
定基发展速度
111.12%
平均值
147.80%
137.64%
160.03%
182.39%
定基增长速度
11.12%
平均值
47.80%
37.64%
60.03%
82.39%
四季节变动分析
第一步求出四期移动平均值进而求出四期中心平均值(这样可以消除消除季节变动因素),最后用销售量y除以四期中心化平均值求出剔除趋势值(这个系数就代表受季节影响的程度)
时间
销售量
四期移动平均k=4
四期中心化平均值
剔除趋势值
2005年
第一季度
84.4
/
/
/
第二季度
154.7
206.975
/
/
第三季度
230.7
209.1
208.0375
1.10893469
第四季度
358.1
215
212.05
1.68875265
2006年
第一季度
92.9
223.55
219.275
0.42366891
第二季度
178.3
230
226.775
0.78624187
第三季度
264.9
235.2
232.6
1.138865
第四季度
383.9
243.575
239.3875
1.60367605
2007年
第一季度
113.7
259.6
251.5875
0.45193024
第二季度
211.8
284.875
272.2375
0.77799715
第三季度
329
289.475
287.175
1.1456429
第四季度
485
299.7
294.5875
1.64636992
2008年
第一季度
132.1
311.95
305.825
0.43194637
第二季度
252.7
331.225
321.5875
0.78578925
第三季度
378
332.75
331.9875
1.13859709
第四季度
562.1
346.9
339.825
1.65408666
2009年
第一季度
138.2
360.9
353.9
0.39050579
第二季度
309.3
377.5
369.2
0.83775731
第三季度
434
/
/
/
第四季度
628.5
/
/
/
第二步为便于计算,先将上表中的趋势剔除值按季对齐排列,根据趋势剔除值算出同季平均和总平均数。
最后用同季平均出于总平均后求出季节指数
季度
年份
第一季度
第二季度
第三季度
第四季度
2005年
/
/
1.108934687
1.688753
2006年
0.423669
0.786242
1.138865004
1.603676
2007年
0.45193
0.777997
1.145642901
1.64637
2008年
0.431946
0.785789
1.138597086
1.654087
2009年
0.390506
0.837757
/
/
总平均数
同季平均
0.424513
0.796946
1.133009919
1.648221
1.000673
季节指数
0.424227
0.796411
1.13224835
1.647113
第三步调整
季节指数之和必须等于周期长度L(4)
季度
年份
第一季度
第二季度
第三季度
第四季度
2005年
/
/
1.11
1.69
2006年
0.42
0.79
1.14
1.60
2007年
0.45
0.78
1.15
1.65
2008年
0.43
0.79
1.14
1.65
2009年
0.39
0.84
/
/
同季平均
0.42
0.80
1.13
1.65
季节指数
0.42
0.80
1.13
1.65
由于0.42+0.80+1.13+1.65=4=周期长度所以不用调整
第四结论
季节指数最高,表明该季为旺季;季节指数最低,表明该季为淡季。
所以可以看出中国白酒销售量在第一季度为淡季第四季度为旺季
五长期趋势分析
欲求长期趋势,则应消除季节对其影响(用每个季度的销售量除以每个季度的季节指数就得到了无季节影响的序列)
时间序号
销售量
季节指数
无季节影响的序列
1
84.4
0.42
198.82
2
154.7
0.80
193.38
3
230.7
1.13
204.16
4
358.1
1.65
217.03
5
92.9
0.42
218.84
6
178.3
0.80
222.88
7
264.9
1.13
234.42
8
383.9
1.65
232.67
9
113.7
0.42
267.84
10
211.8
0.80
264.75
11
329
1.13
291.15
12
485
1.65
293.94
13
132.1
0.42
311.18
14
252.7
0.80
315.88
15
378
1.13
334.51
16
562.1
1.65
340.67
17
138.2
0.42
325.55
18
309.3
0.80
386.63
19
434
1.13
384.07
20
628.5
1.65
380.91
折线图(长期趋势分析)(以无季节影响的序列作为数据生成折线图就得到的长期趋势折线图)
结论:
2005-2009年中国的销售量成上升趋势,增长的方式类似于线性增长
六、趋势预测分析
根据线性方程Y=10.723X+168.37(x=21,22,23,24)除以每个季度的季节指数可以预测2010年各个季度的销售量。
具体方式如下
2010年第一季度=(10.723*21+168.37)*0.42=165.3(万千升)
2010年第二季度=(10.723*22+168.37)*0.80=323.42(万千升)
2010年第三季度=(10.723*23+168.37)*1.13=468.95(万千升)
2010年第四季度=(10.723*24+168.37)*1.65=702.44(万千升)
第四部分:
统计指数
1.时间数列分析法与统计指数分析法的区别:
前者侧重于单个体的发展变化情况。
后者着重于多个个体的发展变化情况。
2.概念
指数是指说明现象数量变动或差异程度的相对数,有广义和狭义之分。
广义的指数是指一切说明社会经济现象数量变动或差异程度的相对数。
狭义指数是指综合反应复杂现象总体数量变动或差异程度的特殊相对数。
狭义指数具有综合性和平均性的特点。
综合性:
指狭义指数是综合反映多个个体构成的复杂现象总体的变动。
平均性:
指狭义指数反映的总变动本质上是一种平均变动,是总体水平的一个代表性数值。
3.统计指数的分类:
a.按反映现象范围的不同:
个体指数是反映单个事物变动的相对数。
总指数是反映复杂现象总体综合变动的相对数。
b.按反映现象特征的不同:
数量指标指数是根据数量指标计算的,说明现象在总规模、总水平变动的指数。
质量指标指数是根据质量指标计算的,说明现象在总体对比关系、总体质量上数量变动的指数。
c.按反映现象对比性质的不同:
动态指数是用于说明在不同时间上对比的相对数,反映现象在时间上的变化过程和程度。
动态指数按采用的对比基期的不同,分为环比指数和定基指数。
在一个动态指数数列中,若各期指数都以上期为对比基期,称为环比指数;若各期指数都以某一固定时期为对比基期,称为定基指数。
4.总指数的基本计算方法有综合法和平均法。
综合法是通过两个时期的综合总量(价值总量)对比计算的总指数。
平均法是通过对个体指数加权平均而求得的总指数。
5.使不同度量、不能加总的现象转化为同度量可采用同度量因素,同度量因素还具有权数的作用。
6.拉氏综合法指数和帕氏综合法指数的区别:
拉氏综合法指数将同度量因素固定在基期。
帕氏综合法指数将同度量因素固定在报告期。
综合法指数
某企业商品销售量及价格统计表
商品名称
计量单位
销售量
价格(万元)
基期q0
报告期q1
基期q0
报告期q1
A
个
400
350
30
31
B
件
30
32
20
33
C
台
55
61
45
55
D
箱
11
14
22
24
某企业商品销售量及价格统计表
商品名称
计量单位
销售量
价格(万元)
销售额(万元)
基期q0
报告期q1
基期q0
报告期q1
基期q0p0
报告期q1p1
假定q1p0
假定q0p1
A
个
400
3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 期末报告 期末 报告