张爽 计量经济学.docx
- 文档编号:25176566
- 上传时间:2023-06-05
- 格式:DOCX
- 页数:19
- 大小:23.27KB
张爽 计量经济学.docx
《张爽 计量经济学.docx》由会员分享,可在线阅读,更多相关《张爽 计量经济学.docx(19页珍藏版)》请在冰豆网上搜索。
张爽计量经济学
《商务数据分析》结课论文
论文题目:
幼儿教育普及率影响因素分析
学号:
20084325
姓名:
张爽
班级:
08物流一班
幼儿教育普及率影响因素分析
摘要:
本文通过建立准确而合理的计量经济学模型,探求幼儿教育普及率和社会经济的相关指标之间的函数关系,从而较为准确地对国家短期内幼儿教育普及率进行定量的分析,以此来了解教育行业。
所有结果均用spss输出,并运用了经济意义检验,统计检验和计量经济学检验对模型进行了相应的检验。
当模型不能通过的检验时,运用相应的方法对模型进行了修正和改进,以便达到预期效果。
关键字:
幼儿教育普及率计量经济学模型检验
一、背景
随着我国国民生活水平的提高,学前教育越发受到重视,对于幼儿的教育,在我国的有些大城市已经十分普及了,甚至有天价幼儿园的出现,然而在欠发达地区,幼儿园入学率却没有那么高,正因为如此,也直接反映了整个幼儿教育行业的现状,为了了幼儿教育普及率的具体影响因素,提出合理建议,本文将运用计量学的知识进行科学分析,得出科学的结论。
二、模型的建立
2.1所用数据均来源于《中国统计年鉴2010》。
所设定模型的样本容量为31个。
在建立中国幼儿教育普及率模型时,主要考虑如下因素:
(1)各地区人口儿童抚养比;
(2)各地区城镇居民平均每人全年家庭可支配收入;(3)各地区城镇人口比重。
如下表:
地区
X1
X2
X3
Y
北京
12.13
26738.48
85
57779.00
天津
13.96
21402.01
78.01
43937.00
河北
21.36
14718.25
43
27774.00
山西
24.62
13996.55
45.99
28066.00
内蒙古
19.36
15849.19
53.4
30486.00
辽宁
15.85
15761.38
60.35
30523.00
吉林
15.55
14006.27
53.32
25943.00
黑龙江
16.26
12565.98
55.5
24805.00
上海
10.00
28837.78
88.6
58336.00
江苏
18.46
20551.72
55.6
35217.00
浙江
18.61
24610.81
57.9
36553.00
安徽
29.09
14085.74
42.1
28723.00
福建
24.55
19576.83
51.4
28366.00
江西
32.94
14021.54
43.18
24165.00
山东
20.88
17811.04
48.32
29398.00
河南
27.43
14371.56
37.7
26906.00
湖北
19.53
14367.48
46
26547.00
湖南
22.89
15084.31
43.2
26534.00
广东
24.98
21574.72
63.4
36469.00
广西
31.77
15451.48
39.2
27322.00
海南
30.97
13750.85
49.13
24790.00
重庆
27.55
15748.67
51.59
30499.00
四川
24.37
13839.4
38.7
28149.00
贵州
39.57
12862.53
29.89
27437.00
云南
31.62
14423.93
34
26163.00
西藏
30.75
13544.41
23.8
45347.00
陕西
22.24
14128.76
43.5
29566.00
甘肃
28.99
11929.78
32.65
26743.00
青海
30.44
12691.85
41.9
32481.00
宁夏
32.39
14024.7
46.1
32916.00
新疆
29.12
12257.52
39.85
27617.00
2.2模型的建立
以每十万人口幼儿园平均在校生数为被解释变量,各地区人口儿童抚养比、各地区城镇居民平均每人全年家庭可支配收入、各地区城镇人口比重为解释变量建立线性回归模型:
Yi=β0+β1X1+β2X2+β3X3+ui
其中:
X1——各地区人口儿童抚养比(单位:
人)
X2——各地区城镇居民平均每人全年家庭可支配收入(单位:
元)
X3——各地区城镇人口比重(单位:
%)
Y——每十万人口幼儿园平均在校生数(单位:
人)
β0、β1、β2、β3—表示待定系数ui—表示随机误差项
2.3利用SPSS软件,输入Y、X1、X2、X3等数据,采用这些数据对模型进行OLS回归,结果如附表1所示。
由此得回归方程:
Yi=2626.108+74.174X1+1.472X2+69.561X3
(10581.984)(232.642)(0.423)(159.586)
t=(0.248)(0.319)(3.479)(0.436)
R=0.640F=16.020df=30
2.4模型检验
(1)经济检验
按照一般的经济理论,每十万人口幼儿园平均在校生数与各地区人口儿童抚养比、各地区城镇居民平均每人全年家庭可支配收入、各地区城镇人口比重呈正相关关系。
所得方程各解释变量的系数均为正,符合经济理论。
为了更进一步的检验此模型的真实性,下边将进行多重共线性检验。
(2)拟合优度检验
从上面的回归结果,可决系数R2=0.64,因为R越小表明回归直线所能结实的因变量y与x的线性相关关系越小。
因而我们可以知道各地区人口儿童抚养比、各地区城镇居民平均每人全年家庭可支配收入、各地区城镇人口比重与每十万人口幼儿园平均在校生数之间有可能存在着线性相关关系。
(3)变量的显著性检验(t检验)
各地区人口儿童抚养比、各地区城镇居民平均每人全年家庭可支配收入、各地区城镇人口比重的t统计量的值分别为0.319、3.479、0.436。
在显著性水平为0.05时,t(29)=2.045,可见在0.05的显著性水平下,各地区城镇居民平均每人全年家庭可支配收入对每十万人口幼儿园平均在校生数的影响是显著的,但是各地区人口儿童抚养比、各地区城镇人口比重对每十万人口幼儿园平均在校生数的影响是不显著的。
(4)方程的显著性检验(F检验)
模型的F值为16.020,在给定显著水平为0.05的情况下,F(3,29)=2.70,所以拒绝方程不显著的假设,回归方程显著。
由上述检验可以看出回归模型存在很多问题,下面将进行具体的分析。
三、多重共线性检验及其修正
3.1进行双变量相关分析
计算各解释变量的相关系数,选择X1、X2、X3数据,运用SPSS软件得相关系数矩阵。
根据相关性分析,与X1和X2有关的数据有小于0.8的,有可能存在多重共线性,所以进行下一步多重共线性分析。
3.2多重共线性的修正
利用逐步回归的办法,去检验和解决多重共线性问题,分别做Y对X1、X2、X3的一元回归,结果如下表:
变量
X1
X2
X3
参数估计值
-608.469
1.592
405.521
t统计量
-3.109
7.145
5.103
R
0.25
0.638
0.473
R的大小排序为:
X2、X3、X1。
各地区人口儿童抚养比、各地区城镇居民平均每人全年家庭可支配收入、各地区城镇人口比重的t统计量的值分别为-3.1109、7.145、5.103。
在显著性水平为0.05时,t(29)=2.045,可见在0.05的显著性水平下,各地区人口儿童抚养比、各地区城镇居民平均每人全年家庭可支配收入、各地区城镇人口比重对每十万人口幼儿园平均在校生数的影响是显著的。
R从小到大排序:
X2、X3、X1。
以X2为基础,顺次加入其他变量逐步回归。
得最后修正严重多重共线性影响的回归结果为:
Y=5877.204+1.592X2
(3749.50)(0.223)
t=(1.568)(7.145)
R=0.638F=51.048df=30
3.3模型检验
(1)经济检验
经过多重共线性的检验和修正,排除了各地区人口儿童抚养比和各地区城镇人口比重多重共线性的影响。
方程结果表明,在其他因素不变的情况下,各地区城镇居民平均每人全年家庭可支配收入每增加1元,每十万人口幼儿园平均在校生数增加1.592人。
而其他两组数据即各地区人口儿童抚养比、各地区城镇人口比重与每十万人口幼儿园平均在校生数不存在明显的线性相关关系,符合一般的经济理论。
(2)拟合优度检验
可决系数R2=0.64,因为R越大表明回归直线所能结实的因变量y与x的线性相关关系越大。
因而我们可以知道各地区城镇居民平均每人全年家庭可支配收入与每十万人口幼儿园平均在校生数之间存在着线性相关关系。
(3)变量的显著性检验(t检验)
各地区城镇居民平均每人全年家庭可支配收入的t统计量的值分别为7.145.在显著性水平为0.05时,t(29)=2.045,可见在0.05的显著性水平下,各地区城镇居民平均每人全年家庭可支配收入对每十万人口幼儿园平均在校生数的影响是明显显著的。
(4)方程的显著性检验(F检验)
模型的F值为51.048,在给定显著水平为0.05的情况下,F(3,29)=2.70,所以拒绝方程不显著的假设,回归方程显著。
此案例存在的问题是样本容量过小,其可靠性受到影响,如果增大样本容量,效果会好一些。
四、异方差检验及其修正
Goldfeld-Quanadt检验
4.1首先对X2按递增排序。
由于n=31,中间1/4约7个观察值,构建两个子样本。
然后用OLS方法进行回归分析。
可求得F=37.010/0.077=480.649,在α=0.05下,两个回归结果的分子自由度均为10,查F分布表,得临界值F0.05(10,10)=2.98,480.649>2.98,所以拒绝原假设,表明模型存在异方差。
4.2因为模型存在异方差,应该运用加权最小二乘法进行修正,这里不做详细说明,留待后续研究。
五、自相关检验及其补救
从模型可以看出
Yi=5877.204+1.592X2
3749.0500.223
t=(1.568)(7.145)
R2=0.638,DW=1.482,F=51.048,df=29
当α=0.05时,查DW统计表可知dL=1.341,dU=1.483。
dL 这时应采取增大样本数据来进行修正,这里不做说明,留待后续研究。 五、分布之后模型 设定有限分布滞后模型为: 运用经验加权法,选择下列三组权数: (1)1,1/2,1/4,1/8 (2)1/4,1/2,3/4,1/4 (3)1/4,1/4,1/4,1/4 分别估计上述模型,并从中选择最佳的方程。 记新的线性组合变量分别为: Z1=Xt+1/2Xt-1+1/4Xt-2+1/8Xt-3 Z2=1/4Xt+1/2Xt-1+2/3Xt-2+1/4Xt-3 Z3=1/4Xt+1/4Xt-1+1/4Xt-2+1/4Xt-3 由上述公式生成线性组合变量Z1,Z2,Z3的数据。 然后分别估计如下经验加权模型。 回归分析结果整理如下: 模型一: Y=-3571.778+1.157Z1 (6789.290)(0.218) t=(-0.526)(5.306) R2=0.520F=28.152dw=1.429 模型二: Y=14444.524+0.621Z2 (10425.946)(0.367) t=(1.385)(1.693) R2=0.099F=2.868dw=1.489 模型三: Y=6919.648+1.550Z3 (10484.407)(0.644) t=(0.660)(2.048) R2=0.182F=5.797dw=1.528 查表得DL=1.341DU=1.483 从上述回归分析结果可以看出,没有无自相关数,所以选R方最大的,第一组作为最优。 再选取1、1/2、1/3、1/4作为全数分析上述过程。 Y=-3791.678+1.053Z3 (9569.914)(0.220) t=(-0.501)(4.780) R2=0.468F=22.846dw=1.408 与原DW相比,本次结果更好。 八、总结 其他因素不变的情况下,各地区城镇居民平均每人全年家庭可支配收入每增加1元,每十万人口幼儿园平均在校生数增加1.592人。 说明城镇居民平均每人全年家庭可支配收入对学前教育的普及率具有很显著的影响,随着收入水平的提高,人们对于幼儿教育的关注度也就越高。 因此,要通过各种方式提高居民的可支配收入,才可以带动学前教育的发展,由于学前教育具有不可忽视的重要性,学前教育的发展也是一个不可逆转的趋势,所以只有提高收入,才能从根本上提高人们对于幼儿教育的关注度,从而为祖国幼儿教育事业的发展和为国家输送人才提供必要保障。 九、附表 模型汇总b 模型 R R方 调整R方 标准估计的误差 更改统计量 Durbin-Watson R方更改 F更改 df1 df2 Sig.F更改 1 .800a .640 .600 5453.17263 .640 16.020 3 27 .000 1.483 a.预测变量: (常量),x3,x1,x2。 b.因变量: y 系数a 模型 非标准化系数 标准系数 t Sig. B 标准误差 试用版 1 (常量) 2626.108 10581.984 .248 .806 x1 74.174 232.642 .061 .319 .752 x2 1.472 .423 .738 3.479 .002 x3 69.561 159.685 .118 .436 .667 a.因变量: y 相关性 x1 x2 x3 x1 Pearson相关性 1 -.633** -.795** 显著性(双侧) .000 .000 N 31 31 31 x2 Pearson相关性 -.633** 1 .837** 显著性(双侧) .000 .000 N 31 31 31 x3 Pearson相关性 -.795** .837** 1 显著性(双侧) .000 .000 N 31 31 31 **.在.01水平(双侧)上显著相关。 模型汇总b 模型 R R方 调整R方 标准估计的误差 更改统计量 Durbin-Watson R方更改 F更改 df1 df2 Sig.F更改 1 .500a .250 .224 7597.90211 .250 9.666 1 29 .004 1.661 a.预测变量: (常量),x1。 b.因变量: y 系数a 模型 非标准化系数 标准系数 t Sig. B 标准误差 试用版 1 (常量) 46478.444 4916.990 9.453 .000 x1 -608.469 195.714 -.500 -3.109 .004 a.因变量: y 模型汇总b 模型 R R方 调整R方 标准估计的误差 更改统计量 Durbin-Watson R方更改 F更改 df1 df2 Sig.F更改 1 .799a .638 .625 5280.56996 .638 51.048 1 29 .000 1.483 a.预测变量: (常量),x2。 b.因变量: y Anovab 模型 平方和 df 均方 F Sig. 1 回归 1.423E9 1 1.423E9 51.048 .000a 残差 8.086E8 29 2.788E7 总计 2.232E9 30 a.预测变量: (常量),x2。 b.因变量: y 模型汇总b 模型 R R方 调整R方 标准估计的误差 更改统计量 Durbin-Watson R方更改 F更改 df1 df2 Sig.F更改 1 .688a .473 .455 6368.12088 .473 26.042 1 29 .000 1.621 a.预测变量: (常量),x3。 b.因变量: y Anovab 模型 平方和 df 均方 F Sig. 1 回归 1.056E9 1 1.056E9 26.042 .000a 残差 1.176E9 29 4.055E7 总计 2.232E9 30 a.预测变量: (常量),x3。 b.因变量: y 模型汇总b 模型 R R方 调整R方 标准估计的误差 更改统计量 Durbin-Watson R方更改 F更改 df1 df2 Sig.F更改 1 .799a .638 .625 5280.56996 .638 51.048 1 29 .000 1.483 a.预测变量: (常量),x2。 b.因变量: y 系数a 模型 非标准化系数 标准系数 t Sig. B 标准误差 试用版 1 (常量) 5877.204 3749.050 1.568 .128 x2 1.592 .223 .799 7.145 .000 a.因变量: y 模型汇总b 模型 R R方 调整R方 标准估计的误差 更改统计量 Durbin-Watson R方更改 F更改 df1 df2 Sig.F更改 1 .088a .008 -.092 6090.05038 .008 .077 1 10 .787 2.486 a.预测变量: (常量),x2。 b.因变量: y 模型汇总b 模型 R R方 调整R方 标准估计的误差 更改统计量 Durbin-Watson R方更改 F更改 df1 df2 Sig.F更改 1 .887a .787 .766 5241.14439 .787 37.010 1 10 .000 1.907 a.预测变量: (常量),x2。 b.因变量: y 模型汇总b 模型 R R方 调整R方 标准估计的误差 更改统计量 Durbin-Watson R方更改 F更改 df1 df2 Sig.F更改 1 .799a .638 .625 5280.56996 .638 51.048 1 29 .000 1.483 a.预测变量: (常量),x2。 b.因变量: y 系数a 模型 非标准化系数 标准系数 t Sig. B 标准误差 试用版 1 (常量) 5877.204 3749.050 1.568 .128 x2 1.592 .223 .799 7.145 .000 a.因变量: y 模型汇总b 模型 R R方 调整R方 标准估计的误差 更改统计量 Durbin-Watson R方更改 F更改 df1 df2 Sig.F更改 1 .721a .520 .501 6392.27940 .520 28.152 1 26 .000 1.429 a.预测变量: (常量),z1。 b.因变量: y 系数a 模型 非标准化系数 标准系数 t Sig. B 标准误差 试用版 1 (常量) -3571.778 6789.290 -.526 .603 z1 1.157 .218 .721 5.306 .000 a.因变量: y 模型汇总b 模型 R R方 调整R方 标准估计的误差 更改统计量 Durbin-Watson R方更改 F更改 df1 df2 Sig.F更改 1 .315a .099 .065 8755.03396 .099 2.868 1 26 .102 1.489 a.预测变量: (常量),z2。 b.因变量: y 系数a 模型 非标准化系数 标准系数 t Sig. B 标准误差 试用版 1 (常量) 14444.524 10425.946 1.385 .178 z2 .621 .367 .315 1.693 .102 a.因变量: y 模型汇总b 模型 R R方 调整R方 标准估计的误差 更改统计量 Durbin-Watson R方更改 F更改 df1 df2 Sig.F更改 1 .427a .182 .151 8341.98227 .182 5.797 1 26 .023 1.528 a.预测变量: (常量),z3。 b.因变量: y 系数a 模型 非标准化系数 标准系数 t Sig. B 标准误差 试用版 1 (常量) 6919.648 10484.407 .660 .515 z3 1.550 .644 .427 2.408 .023 a.因变量: y 模型汇总b 模型 R R方 调整R方 标准估计的误差 更改统计量 Durbin-Watson R方更改 F更改 df1 df2 Sig.F更改
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 张爽 计量经济学 计量 经济学