书签分享收藏举报版权申诉 / 29

立即下载加入VIP,免费下载

当前位置：首页 > 高等教育 > 军事 > 大学论文影响考研人数因素分析文档格式.docx

大学论文影响考研人数因素分析文档格式.docx

文档编号：18070247
上传时间：2022-12-13
格式：DOCX
页数：29
大小：122.19KB

《大学论文影响考研人数因素分析文档格式.docx》由会员分享，可在线阅读，更多相关《大学论文影响考研人数因素分析文档格式.docx（29页珍藏版）》请在冰豆网上搜索。

大学论文影响考研人数因素分析文档格式.docx

第一步：

确定预测目标，第二步：

搜索审核资料，第三步：

选择预测模型和方法，第四步：

分析预测误差，改进预测模型，第五步：

提出预测报告．

1.2应用预测分析方法概述及实施

定量预测法注重于事物发展在数量方面的分析，重视对事物发展变化的程度做数量变化的描述，更多地依据历史统计资料，较少受主观因素的影响[4]．本文主要运用干预分析模型预测法、多元线性回归预测法．

1.2.1干预分析模型预测法

干预的含义：

时间序列经常会受到某些特殊事件及态势的影响，称这类外部事件为干预．

研究干预分析的目的是从定量分析的角度来评估政策干预或突发事件对经济环境和经济过程的具体影响．

利用干预影响发生前的已知数据，建立一个单变量的时间序列模型，然后利用该模型进行外推预测，求得新的预测值，作为不受干预影响的具体数值，最后用实际值减去预测值，得到的是受干预影响的具体结果，利用这些结果就可以求估干预模型的各个参数．

一是：

利用干预影响产生前的数据，建立单变量的时间序列模型．然后利用此模型进行外推预测，得到的预测值，作为不受干预影响的数值．

二是：

将实际值减去预测值，得到受干预影响的具体结果，利用这些结果估算干预影响的参数．

三是：

利用排除干预影响后的全部数据，识别与估计出一个单变量的时间序列模型．

最后：

求出总的干预分析模型．

1.2.2多元线性回归预测法

社会经济现象的发展变化往往会受到多个因素的影响，因此，一般要进行多元回归分析，我们把包括两个或两个以上自变量的回归分析称为多元回归分析．多元回归与一元回归类似，一般运用最小二乘法估计模型参数，最后需要对模型及模型参数进行统计检验．

（1）二元线性回归模型（以二元线性回归模型为例）

类比使用最小二乘法的方法对参数进行估计．

（2）拟合优度指标检验

标准误差：

对y值与模型估计值之间的离差的一种度量．

其计算公式为：

（3）可决系数的计算及检测

可决系数公式：

表示回归模型不能对因变量y的变差做出任何解释；

表示回归模型对因变量y的全部变差做出解释．

（4）置信范围的计算

置信区间的计算公式为：

置信区间=

其中

是自由度为

的统计量数值表中的数值，

是观察值的个数，

是包括因变量在内的变量的个数．

（5）自相关和多重共线性问题

自相关检验：

多元线性回归模型的基本假设之一就是模型的随机干扰项相互独立即不相关，实际问题中的自相关往往是由于：

变量固有惯性、模型设定偏误、数据的“编造”等原因，如果存在自相关会对参数的估计产生许多不良后果，主要运用D-W检验法检验．

D-W值的计算

其中：

多重共线性检验：

模型中的各个自变量所提供的是各个不同因素的信息，并且回归分析的基本假定里，假定各自变量同其他自变量之间是显著无关的，但是，实际上两个自变量之间可能存在相关关系，这种关系会导致建立错误的回归模型以及得出使人误解的结论．为了避免这个问题，有必要对自变量之间相关与否进行检验[5]．

任何两个自变量之间的相关系数为：

经验法则认为，两个自变量的相关系数的绝对值小于0.75或者0.5,表示这两个自变量之间不存在多重共线性问题．如果某两个自变量之间存在高度相关的关系，就有必要把模型中的其中一个自变量删去．

2变量的选取

影响考研人数的定量因素有很多例如：

应届本科毕业生人数、就业情况、GDP、招生人数、教育投入、在校学习成绩等等，考虑到数据的可获性及对考研人数影响的重要性，选取影响考研人数变动的的几个主要定量因素如下：

失业率

—代表就业情况；

普通本科生毕业数

—代表研究生人数的基数；

教育经费

—代表国家对大学生考研的助力；

研究生招生人数

—代表社会和国家对研究生的需求量．

3模型的建立

3.1制作曲线图观查曲线走势

运用spss软件制作考研人数随时间变化的时间序列线性图3-1

图3-1

由曲线走势图3-1看出2008年和2014年数据走势和大体走势明显有差异，绝对数也验证了这一点2008年和2014年是近20年内仅有的两次人数下降，由于2014年后的数据缺失本文以2008年为例运用干预分析模型进行分析，建立模型预测考研人数．（数据见附录）

3.1.1确立初步模型

根据1998~2007年的数据建立一个时间序列模型：

其中，t为自变量，t表示时间，

表示干预事件对因变量的影响，它的确定是整个模型的关键．由于干预的影响是逐渐加强的，它的作用又是长期并且深远的，因此，干预变量可选以下的形式：

对1998~2007年的数据建立一个时间增长模型，由图像看出比较接近多项式增长模型

运用spss软件对多项式增长模型做以下模型分析和检验

表3-1F检验表

模型

平方和

Df

均方

F

Sig.

1

回归

13787.617

2

6893.809

139.568

.000a

残差

345.757

7

49.394

-

总计

14133.374

9

表3-2R方检验表

R

R方

调整R方

标准估计的误差

.988a

.976

.969

7.02807

由表3-2看出R，R方，调整R方以及表3-1的F值数值都说明该模型拟合度较好，可以通过参数的显著性检验和整个回归方程的显著性检验．

3.1.2分离数据，估算参数

在此基础上分离出干预因素影响的具体数值，并估算干预模型的参数，用刚才的模型进行2008到2014年考研人数的预测，然后用实际值减去预测值得到的差值，就是08年产生的干预值,记为Zt．所求具体数值见下表3-3：

表3-3干预值表

T

2008

2009

2010

2011

2012

2013

2014

Zt

-35.025

-48.1013

-50.5756

-59.348

-64.9184

-75.3868

-101.053

利用上表3-3的数据，可以估算出干预模型:

的参数

与

，实际上是自回归方程:

的参数：

即：

3.1.3计算净化序列建立拟合模型

净化序列是指消除了干预影响后计算得到的序列，它是由实际的观察序列值减去干预影响值后得到的，即：

对净化系列

建立时间序列模型如下：

表3-4F值检验表

198126.859

99063.430

1436.318

965.585

14

68.970

199092.445

16

a.预测变量:

（常量）,t,VAR00001

b.因变量:

VAR00003

表3-5R方检验表

.998a

.995

.994

8.30484

（常量）,VAR00004,VAR00001

R，R方，调整R方均比优化前优越说明：

该模型拟合度较好，可以通过参数的显著性检验和整个回归方程的显著性检验．

3.1.4组建干预模型

通过以上各步的参数估计，可以组建最终的干预分析模型如下：

3.1.5预测对比

利用干预分析模型计算出的预测值

与原始数值

比较如下表：

表3-6预测值表

1998

1999

2000

2001

2002

2003

2004

2005

2006

27.143

32.271

39.585

49.085

60.771

74.643

90.701

108.945

129.375

2007

132.097

106.743

107.578

131.803

145.619

168.024

182.819

169.404

进一步做对比图3-2：

图3-2

该图说明预测值和实际值的重合度很高，直观的说明了干预模型取得了相当不错的效果．

3.2多元线性回归预测模型

由于统计年鉴只更新到2013年，故该模型的建立选取了1998年到2012年15组数据运用excl和spss软件进行分析（注：

若无特殊说明，本文中的各类数据检验显著性水平均为0.05）．（数据均来自统计年鉴、教育网）（数据见附录）

3.2.1模型的建立

建立以下线性回归模型：

（1）

用spss软件得到如下结果回归模型为：

（2）

3.2.2模型的检验

（6）

拟合优度检验

表3-7R方检验表

.986a

.972

.961

9.10733

（常量）,招生数,失业率,教育经费,毕业生数．

由该表3-7可以看出R=0.986，R方=0.972，调整R方为0.961，意味着回归模型对y的百分之九十六以上变差做出解释，说明该模型总体拟合较好．

（7）F值检验

表3-8F值检验表

df

28810.442

4

7202.611

86.838

829.434

10

82.943

29639.876

VAR00001

上表3-8格为F值检验可以看到F值为86.838，F值对应p值显著小于0.05，说明在为0.05置信水平下显著通过了F值检验．

小结：

由以上两个检验得，在0.05置信水平下模型显著的通过了拟合优度检验，模型整体能够解释对因变量y百分之九十六以上的变差，模型整体拟合度较好．

（8）变量的显著性t值检验

表3-9系数显著性检验表

非标准化系数

标准系数

t

B

标准误差

试用版

（常量）

11.568

16.570

.698

.501

-2.523

8.011

-.028

-.315

.759

毕业生数

-.011

.218

-.022

-.049

.962

7.521

.000

-.123

.459

.056

招生数

2.964

.895

1.133

3.310

.008

a.因变量:

由上述表3-9可以看出四个变量只有最后一个变量研究生招生人数

能通过t值检验，但是模型整体显著的通过了检验，估计存在多重共线性或者自相关．

（9）自相关检验

表3-10D-W检验表

Durbin-Watson

1.867

以上该表3-10可以看出D-W值为1.867，查表得

=0.49,

=1.70，D-W值在

-2之间故该模型不存在自相关，最大的可能是存在多重共线性．

（10）多重共线性检验

表3-11相关性检验表

Pearson相关性

.858**

.670*

.471

显著性（双侧）

.001

.006

.077

N

15

.968**

.483

.072

.335

.080

*.在0.05水平（双侧）上显著相关．

**.在.01水平（双侧）上显著相关．

由以上表3-11可以看出变量x3与x1，x2以及x2和x1之间有高度相关性，特别是x2和x1之间，高度相关性就会表现为多重共线性，这应该就是回归模型没有通过t值检验的主要原因．

由变量显著t检验的表3-9可以看出研究生人数（y）和招生数之间的线性拟合度最好，所以应该保留变量x4，再顺次加入其它变量x3、x2、x1对原始模型运用spss软件进行修正逐步回归，如下表：

表3-12系数显著性检验表

标准误差

6.948

5.281

1.316

.213

9.113

8.182

1.334

.017

3.018

.357

1.154

8.451

y

该表3-12显示两个变量t值对于P值均明显小于0.05，故在0.05置信水平下两变量均显著的通过了t值检验，然后观察R检验表格如下：

表3-13拟合优度检验表

模型汇总

.996a

.992

8.35751

b.预测变量:

（常量）,招生数,教育经费．

表3-14F值检验表

Anovab

28801.701

14400.850

206.174

838.176

12

69.848

对比表3-13和修正前表3-7的

发现

有了很大的改善，所以必须保留下x3，同理将其他新变量逐步添加进来进行修正逐步回归，添加新的变量x2发现有两项检验不能通过，第一是t值检验通不过，第二是系数为负数，即考研人数和毕业本科生人数呈负相关，不符合经济意义检验，实际生活中两者应该呈正相关关系，所以x2应该被删除．添加新变量x1其参数仍为负数，一般来说失业率增长应该会导致更多的本科毕业生选择考研，从而提高自己的素质和就业能力，两者必将呈现正相关关系，所以x1变量也应该剔除．最后通过一系列的检验及校正，得出以下结果

（3）

以上分析在统计意义上进行了各种检验说明，之前选择的四个变量中失业率

和普通本科生毕业数

对考研人数的影响没有想象的那么大，数据表明删除两个变量后，模型的预测效果有了较为明显的改善．

（11）经济意义检验

由（3）式得x3和x4表示的变量教育经费和研究生招生人数都是影响考研人数的主要因素，另外两个变量虽然有一定影响但是系数的正负所表示的经济意义是错误的．该模型的

=0.996，调整

=0.994，都相对较大，说明模型的拟合程度比较高，F值也证明了这一点．

此外失业率

对考研人数的影响，从经济意义上来讲都应该是正相关的失业率增加更多的本科生应该会选择考研，毕业生数是考研的基数，从统计概率意义上来说，毕业生数增加考研人数也应该是增加才对，但是

（2）式中明显的系数符号错误，与经济意义不符．

（12）图表拟合检验