毕业论文定稿版优秀毕业论文统计学本科基于SPSS的多元回归分析模型选取的应用Word文件下载.doc
- 文档编号:14209652
- 上传时间:2022-10-20
- 格式:DOC
- 页数:31
- 大小:3.79MB
毕业论文定稿版优秀毕业论文统计学本科基于SPSS的多元回归分析模型选取的应用Word文件下载.doc
《毕业论文定稿版优秀毕业论文统计学本科基于SPSS的多元回归分析模型选取的应用Word文件下载.doc》由会员分享,可在线阅读,更多相关《毕业论文定稿版优秀毕业论文统计学本科基于SPSS的多元回归分析模型选取的应用Word文件下载.doc(31页珍藏版)》请在冰豆网上搜索。
指导教师安军职称副教授
日期2014-5-10
基于SPSS的多元回归分析模型选取的应用
数学与统计学院2010级统计专业2班 殷婷学号:
2010101217
指导老师安军
摘要
本文不仅对于复杂的统计计算通过常用的计算机应用软件SPSS来实现,同时通过对两组数据的实证分析,来研究统计学中多元回归分析中的变量选取,让大家对统计学中的多元回归分析中模型的选取以及变量的选取和操作方法有更深层次的了解.一组数据是对于淘宝交易额的未来发展趋势的研究,一组数据时对于我国财政收入的研究.本文通过两个实证即淘宝交易额研究和财政收入研究从不同程度上对非线性回归模型和变量选取的研究运用通俗的语言和浅显的描述将SPSS在多元回归分析中的统计分析方法呈现在大家面前,让大家对多元回归分析以及SPSS软件都可以有更深一步的了解.通过SPSS软件对数据进行分析,对数据进行处理的方法进行总结,找出SPSS对于数据处理和分析的优缺点,最后得在对变量的选取和软件的操作提出建议.
关键词:
统计学,SPSS,变量选取,多元回归分析
Abstract
ThisarticlenotonlyforcomplexstatisticalcalculationsdonebythecommonlyusedcomputerapplicationsoftwareofSPSS,throughtheempiricalanalysisofthetwogroupsofdataatthesametime,tostudythestatisticsofthevariablesinthemultivariateregressionanalysis,leteverybodyinthemultipleregressionanalysisofstatisticalmodelselectionaswellastheselectionofvariablesandoperationmethodshaveadeeperunderstanding.Isasetofdataforthefuturedevelopmenttrendofresearchtaobaotransactions,asetofdatafortheresearchofourcountry'
sfiscalrevenue.Inthispaper,throughtwoempiricaltaobaotransactionsandfiscalrevenueresearchfromdifferentdegreeofthestudyofnonlinearregressionmodelandvariableselectionusingacommonlanguageandplaintheSPSSstatisticalanalysismethodinmultipleregressionanalysisofpresentinfrontofeveryone,leteveryonetomultipleregressionanalysisandSPSSsoftwarecanhaveadeeperunderstanding.ThroughSPSSsoftwaretoanalyzedata,andsummarizesmethodofdataprocessing,findouttheadvantagesanddisadvantagesofSPSSfordataprocessingandanalysis,finallyhadtoputforwardtheproposaltotheoperationoftheselectionofvariablesandsoftware.
Keywords:
Statistical,SPSS,Theselectionofvariables,multipleregressionanalysis
目录
第一章引言 3
第二章多元回归模型的选取 4
2.1多元回归分析概述 4
2.2相关系数概述 5
2.3非线性回归模型概述 5
2.4多元线性回归模型自变量的选取 6
第三章非线性回归模型案例:
淘宝交易额模型的研究 7
3.1回归模型变量的确定 7
3.1.1数据来源 7
3.1.2复相关系数 8
3.1.3散点图看线性关系 9
3.1.4回归分析看拟合度 11
3.1.5确定回归模型变量 11
3.2调整后的变量的相关分析 12
3.2.1散点图 12
3.2.2计算相关系数 14
3.3多元线性回归分析 16
3.4小结 18
第四章线性回归分析变量选取案例:
财政收入模型的研究 18
4.1数据来源及变量选取 18
4.2相关分析 20
4.2.1散点图 20
4.2.2计算相关系数 21
4.3线性回归分析 24
4.4逐步回归 26
4.5小结 27
第五章总结 28
参考文献 30
第一章引言
随着社会的发展,统计的运用范围越来越广泛,统计学作为高等院校经济类专业和工商管理类专业的核心课程,不管是在经济管理领域,或是在军事、医学等领域的研究中对于数量分析与统计分析都需要更高的要求,需要用到的数学知识较多,应用方面的灵活性也较强,计算量大且复杂.然而科学研究的深入,研究的对象也日益变得复杂,复杂系统的研究问题更是成为当今研究的热点.为了更好的描述一个复杂的现象,就需要大量的数据和信息,如何高效、准确地利用已知的信息便成为当今社会研究的一项重要课题.
在科学技术飞速发展的今天,统计学通过不断吸收和融合相关学科的新理论,开发应用新技术和新方法,拓展新的领域的同时不断深化和丰富了统计学传统领域的理论与方法.在我国,社会主义市场经济体制的逐步建立,实践发展的需要对统计学提出了新的更多、更高的要求.随着我国社会主义市场经济的成长和不断完善,统计学的潜在功能将得到更充分更完满的开掘.从20世纪60年代开始,关于回归自变量的选择成为统计学中研究的热点问题,统计学家提出了许多回归选元的准则,并提出了许多行之有效的选元方法.在应用回归分析去处理实际问题时,回归自变量选择是首先要解决的重要问题.通常在做回归分析时,人们根据所研究问题的目的,结合经济理论罗列出对因变量可能有影响的的一些因素作为自变量引进回归模型,把一些对因变量影响很小的,有些甚至是没有影响的自变量,不但使得计算量变大,估计和预测的精度也下降了.此外,如果遗漏了某些重要变量,回归方程的效果肯定不好.SPSS软件作为当今国际上运用广泛的统计分析软件,其功能齐全带有各种特点,在各个领域内都得到了迅速普及,并成为各个行业提高管理水平、形成科学决策的重要手段.然而,我国对于该软件的运用和理解始终处于早期应用阶段,无论是在功能的研究开发还是实际生活当中的运用都与西方发达国家相差甚远.尤其是在管理决策方面,都因为没有进行深度分析而造成了浪费,要么就是利用SPSS软件进行简单分析而未进行深度开发,导致所得的信息有限、各信息间的关系不明确,最终导致管理者的判断出现偏差.
基于以上背景,本文通过总结和吸取其他国内外学者对统计学研究的,并结合我国的实际情况,本文采用了案例一对于网络购物这块的的研究,通过对2005年到2012年的居民消费水平,以及我国网络普及度,我国人人均纯收入以及我国的居民消费水平对淘宝网的未来发展趋势进行非线性回归模型的研究以及案例二对于我国财政收入的进行变量选取研究,通过对1992年到2012年的人均国内生产总值,城镇居民家庭人均可支配收入,全社会固定投资,进出口总额,居民消费价格水平对我国财政收入的影响进行定量数据的研究.通过对数据的选取,回归模型的确定以及软件的操作方法来告知读者如何在SPSS的操作中变量选取的原则、要求和方法.
第二章多元回归模型的选取
2.1多元回归分析概述
回归分析是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法(即寻找具有相关关系的变量减的数学表达式并进行统计推断的一种统计方法).按照其所涉及的自变量,可分为一元回归分析和多元回归分析;
线性回归分析和非线性回归分析是按照自变量和因变量之间的关系划分的.
而本文运用了多元线性回归分析中的方法,多元线性回归分析就是指回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系.多元回归分析的主要内容有以下几点:
(1)从一组数据出发,确定某些变量之间的定量关系式,即建立数学模型并估计其中的未知参数.估计参数的常用方法是最小二乘法;
(2)对这些关系式的可信程度进行检验;
(3)在许多自变量共同影响着一个因变量的关系中,判断哪些自变量的影响是显著的,哪些自变量的影响是不显著的,将影响显著的自变量选入模型中,而剔除影响不显著的变量,通常用逐步回归等方法;
(4)利用所求的关系式对某一生产过程进行预测或控制.
回归分析研究的主要问题是确定与间的定量关系表达式,这种表达式称为回归方程;
对求得的回归方程的可信度进行检验;
判断自变量对因变量有无影响;
利用所求得的回归方程进行预测和控制.回归分析主要应用于研究两个变量之间到底是哪个变量受哪个变量的影响,影响程度如何,通过分析现象之间相关的具体形式,确定其因果关系,并用数学模型来表现其具体关系,并根据实测数据来求解模型的各个参数,然后评价回归模型是否能够很好的拟合实测数据;
如果能够很好的拟合,则可以根据自变量作进一步预测.
2.2相关系数概述
相关关系是一种非确定性的关系,相关系数是研究变量之间线性相关程度的量.相关关系是现象间客观存在的,但数值又是不严格及不完全确定的相互依存关系.
1)复相关系数
在一元回归分析中我们用相关系数来说明两变量之间线性相关的程度,在多元回归分析中,仍用它来表示与其他自变量之间的线性密切程度,此为复相关系数.复相关是指因变量与多个自变量之间的相关关系.复相关系数只是反映变量间表面的非本质的联系,因为变量很有可能受到其他变量的影响.
2)偏相关系数
在多变量的情况下,变量之间的相关系数是相当复杂的.任意两个变量之间都有可能存在着相关关系,因此,只知道被解释变量与解释变量的总的相关程度是不够的.如果需要了解某两个变量间的相关程度,就应在消除其他变量影响的情况下来计算他们的相关系数,这就是偏相关系数.偏相关系数与复相关系数不同,复相关系数的取值在0-1之间,而偏相关系数则是有正有负,所以复相关系数与偏相关系数之间也有可能相差很大.变量之间本存在错综复杂的关系,甚至可能使得符号也相反,但是偏相关系数才是变现变量之间的本质联系的.
偏相关的主要用途:
偏相关主要是用来研究自变量与
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业论文 定稿 优秀 统计学 本科 基于 SPSS 多元 回归 分析 模型 选取 应用
链接地址:https://www.bdocx.com/doc/14209652.html