财政收入和国家生产总值之间的一元线性回归分析.docx
- 文档编号:6953377
- 上传时间:2023-01-13
- 格式:DOCX
- 页数:13
- 大小:164.29KB
财政收入和国家生产总值之间的一元线性回归分析.docx
《财政收入和国家生产总值之间的一元线性回归分析.docx》由会员分享,可在线阅读,更多相关《财政收入和国家生产总值之间的一元线性回归分析.docx(13页珍藏版)》请在冰豆网上搜索。
财政收入和国家生产总值之间的一元线性回归分析
成绩评定表
学生姓名
王柳
班级学号
1309050109
专业
应用统计学
课程设计题目
财政收入和国家生产总值之间的一元线性回归分析
评
语
组长签字:
成绩
日期
2015年7月1日
课程设计(论文)任务书
学院
理学院
专业
应用统计学
学生姓名
王柳
班级学号
1309050109
课程名称
数理统计课程设计
课程设计(论文)题目
财政收入和国家生产总值之间的一元线性回归分析
设计要求(技术参数):
通过该课程设计,使学生进一步理解数理统计的基本概念、理论和方法;初步掌握Excel统计工作表在数据整理中的应用,spss、matlab统计软件包作常见的统计检验和统计分析;具备初步的运用计算机完成数据处理的技能,使课堂中学习到理论得到应用。
设计任务:
1.数据整理:
收集数据,录入数据,画出相应图形(如分布图、直方图、盒状图等)。
2.一元线性回归模型:
回归系数的估计与检验,数据散点与回归直线的图示,残差图。
运用spss统计软件,对给定的数据拟合回归方程,做出预测。
3.单因子方差分析:
建立数学模型,运用spss统计软件,解算模型,做出检验,能对结果进行简单分析。
计划与进度安排:
第一周:
周三7~8节:
选题,设计解决问题方法,周四1~6节:
调试程序
第二周:
周三1~8节:
答辩,完成论文。
指导教师(签字):
张玉春
2015年6月12日
专业负责人(签字):
2015年7月16日
主管院长(签字):
2015年7月17日
摘要
现实世界中,经常出现一些变量,他们相互联系相互依存着,他们之间存在着一定的关系,数理统计中研究变量之间的相互关系的一种有效方法是回归分析。
对于一元线性相关关系,用线性方程大致描述变量之间的关系,按最小二乘法求位置参数的估计值,最终求得线性回归方程找到变量之间的关系。
这些复杂的步骤在spss中可简单实现。
本文通过运用spss线性回归的方法对我国财政收入和国内生产总值的关系进行回归分析,求解线性回归方程,并通过方差分析和相关系数检验进行显著性检验。
了解了影响国内生产总值的因素与其实质关系。
本文利用概率纶与数理统计中的所学的回归分析知识,根据1992~2006年财政收入和生产总值的数据建立数学模型,利用这些数据做出国内生产总值x关于财政收入y的线性回归方程,并SPSS软件对验数据进行分析处理,得出线性回归系数与拟合系数等数据,并用F检验法检验了方法的可行性,同时用分布参数置信区间和假设检验问题 ,得出了国内生产总值x关于财政收入y的线性关系显著,并进行了深入研究,提出了小样本常用分布参数的置信区间与假设检验的解决方法。
关键词:
一元线性回归分析;国内生产总值和财政收入;方差分析
财政收入和国家生产总值之间的一元线性回归分析
一、设计目的
为了更好的了解概率论与数理统计的知识,熟练掌握概率论与数理统计在实际问题上的应用,并将所学的知识结合SPSS数据处理软件对数据的处理解决实际问题。
本设计是利用方差分析等对财政收入和柜内生产总值进行分析,并利用SPSS数据处理软件进行求解。
二、设计问题
现有1992~2006年财政收入和生产总值(单位:
亿元)的数据,如表所示,请研究财政收入和国内生产总值之间的线性关系。
由此我们利用这些数据做出国内生产总值
关于财政收入
的线性回归方程。
三、设计原理
在实际问题中,经常会出现两个变量之间的相关关系不是线性的(即直线型),而是非线性的(即曲线型)。
设其中有两个变量X与Y,我们可以用一个确定函数关系式:
y=u(𝑥)大致的描述Y与X之间的相关关系,函数u(𝑥)称为Y关于X的回归函数,方程y=u(𝑥)成为Y关于X的回归方程。
一元线性回归处理的是两个变量x与y之间的线性关系,可以设想y的值由两部分构成:
一部分由自变量x的线性影响所致,表示x的线性函数a+bx;另一部分则由众多其他因素,包括随机因素的影响所致,这一部分可以视为随机误差项,记为ε。
可得一元线性回归模型y=a+bx+ε。
式中,自变量x是可以控制的随机变量,成为回归变量;固定的未知参数a,b成为回归系数;y称为响应变量或因变量。
由于ε是随机误差,根据中心极限定理,通常假定ε~N(0,𝜎2),𝜎2是未知参数。
确定Y与X之间的关系前,可根据专业知识或散点图,选择适当的曲线回归方程,而这些方程往往可以化为线性方程或者就是线性方程,因此,我们可以用线性方程:
y=a+bx大致描述变量Y与X之间的关系;
回归分析一般分为一元线性回归和多元线性回归,本文采用一元线性回归。
回归分析的基本思想是:
虽然自变量和因变量之间没有严格的,确定性的函数关系,但可以设法找出最能代表他们之间关系的数学表达式。
四、设计程序
1、定义3个变量,分别为year(年份),x(国内生产总值),y(财政收入)并输入数据。
如图4.1和4.2。
图4.1
图4.2
2、做散点图,观察两个变量的相关性。
依次选择菜单→图形→旧对话框→散点/点状→简单分布,将国内生产总值作为x轴财政收入作为y轴,得到如图4.3所示的散点图。
图4.3
由上图可以看出两变量具有较强的线性关系可以用一元线性回归来拟合两变量。
3、一元线性回归分析设置
(1)选择菜单“分析→回归→线性”,打开“线性回归”对话框,并按图4.4所示进行设置。
图4.4
(2)“统计量”对话框设置:
单击“统计量(S)…”按钮,打开“线性回归:
统计量”对话框,并按图4.5所示进行设置。
图4.5
(3)“图形”对话框设置:
单击“绘制(T)…”按钮,打开“线性回归:
图”对话框,并按图4.6所示进行设置。
图4.6
(4)“保存”对话框设置:
单击“保存(S)…按钮,打开”线性回归:
保存“对话框,并按图4.7所示进行设置。
图4.7
(5)“选项”对话框设置:
单击“选项(O)…”打开线性回归:
选项“对话框,并按图4.8所示进行设置。
图4.8
五、结果分析
1、模型汇总表,主要是回归方程的拟合优度检验,表中显示相关系数R决定系数R方,调整的相关系数的平方和估计值的标准误差等信息,这些信息反映了因变量和自变量之间的线性相关强度。
从表中可以看出R=0.989,说明自变量与因变量之间的相关性很强。
R方等于0.979说明自变量x可以解释因变量y的97.9%的差异性。
模型汇总表b
模型
R
R平方
调整后R方
标准估计的误差
1
.989a
.979
.977
1621.66312
a.预测变量:
(常数),x
b.因变量:
y
2、方差分析表,显示因变量的方差来源、方差平方和、自由度、均方、F检验统计量的观测值和显著性水平。
方差来源有回归、残差。
从表中可以看出,F统计量的观测值为592.25,显著性概率为0.000,即检验假设“
:
回归系数B=0”成立的概率为0.000,从而应拒绝原假设,说明因变量和自变量的线性关系是非常显著的,可建立线性模型。
方差分析表a
模型
平方和
自由度
平均值平方
F
显著性
1
回归
1557492999.819
1
1557492999.819
592.250
.000b
残差
34187286.770
13
2629791.290
总计
1591680286.589
14
a.财政收入:
y
b.预测值:
(常数),x
3、回归系数表,常数项、非标准化的回归系数B值及其标准差、标准化的回归系数值、统计量t值以及显著性水平。
从表中可以看出,回归系数的常数项为-4993.281,自变量国内生产总值的回归系数为0.197。
因此可以得出回归方程:
财政收入y=-4993.281+0.197*国内生产总值x
回归系数的显著性水平为0.000,明显小于0.05,故应拒绝T检验的原假设,这也说明了回归系数的显著性,说明建立线性模型是恰当的。
回归系数表a
模型
非标准化系数
标准系数
T
显著性
B
标准误差
Beta
1
(常量)
-4993.281
919.356
-5.431
.000
x
.197
.008
.989
24.336
.000
5、残差统计表,依次列出了预测值、标准预测值、预测值的标准误差、调整的预测值、残差、标准残差、student化残差、已剔除的残差、student化已剔除的残差、马氏距离、cook距离以及居中杠杆值。
残差统计表a
最小值
最大值
均值
标准偏差
N
预测值
315.9509
36589.8320
14925.1933
10547.48785
15
标准预测值
-1.385
2.054
.000
1.000
15
预测值的标准值
418.964
983.777
570.042
165.910
15
调整的预测值
-494.3054
35325.9648
14789.4147
10469.84809
15
残差
-1928.81250
3167.41895
.00000
1562.67369
15
标准残差
-1.189
1.953
.000
.964
15
Stud.残差
-1.239
2.189
.038
1.067
15
刪除的残差
-2093.78027
3977.67529
135.77867
1927.94233
15
Stud.刪除的残差
-1.268
2.646
.084
1.165
15
Mahal距离
.001
4.219
.933
1.181
15
Cool距离
.000
.825
.132
.251
15
居中杠杆值
.000
.301
.067
.084
15
a.因变量:
财政收入
6、图5-6和图5-7是残差分布直方图和观测累计概率P-P图.再回归分析中总是假设残差服从正态分布,这两个图就是根据样本数据的计算结果显示残差分析实际情况.从残差分布的直方图与附于其上的正态分布曲线的比较,可以观察出残差分析的正态性.同时,从观测量累计概率P-P图也可以看出残差分布服从正态性。
图5-6
图5-7
六、设计总结
通过对概率论与数理统计的这道实际问题的解决,不仅使我更加深刻的理解了概率论与数理统计的基础知识,对一元线性回归以及线性回归的方差分析、相关系数的显著性检验有了更深刻的了解,而且使我对这些知识在实际中的应用产生了浓厚的兴趣,同时对我学习好概率论与数理统计这门课有很大帮助。
在实现这道题的过程中我应用了SPSS软件,学会了一些软件的应用,更加熟练的操作该软件进行一些数据上的处理。
致谢
本论文是在张玉春老师的悉心指导下完成的,老师渊博的知识,严谨的治学态度,一丝不苟的工作作风,平易近人的性格都是我学习的楷模。
在此谨向导师表示忠心的感谢和崇高的敬意。
同时我还要感谢我的同学们,在论文设计中,他们给了我很多的建议和帮助。
我还要感谢我的论文中被我引用或参考的文献的作者。
参考文献
[1]张庆利,spss宝典,电子工业出版社
[2]沈恒范,概率论与数理统计教程[M],第四版,高等教育出版社
[3]茆诗松,概率论与数理统计教程(第二版),高等教育出版社
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 财政收入 国家 生产总值 之间 一元 线性 回归 分析