应用回归分析论文.docx
- 文档编号:8712551
- 上传时间:2023-02-01
- 格式:DOCX
- 页数:17
- 大小:260.06KB
应用回归分析论文.docx
《应用回归分析论文.docx》由会员分享,可在线阅读,更多相关《应用回归分析论文.docx(17页珍藏版)》请在冰豆网上搜索。
应用回归分析论文
民族大学
实用回归分析论文
(GuizhouMinzuUniversity)
论文题目:
影响谷物的因素分析
年级:
2014级
班级:
应用统计班
小组成员:
:
黄邦秀学号:
8序号:
4
:
王远学号:
4序号:
26
:
江倩学号:
6序号:
11
:
吴堂礼学号:
时间:
2016.12.06
影响谷物的因素分析
摘要:
在实际问题的研究中,经常需要研究某一些现象与影响它的某一最主要因素的关系,如影响谷物产量的因素非常多。
本文采用多元线性回归分析方法,以1994—2014年中国谷物产量及其重要因素的时间序列数据为样本,对影响中国谷物生产的多种因素进行了分析。
分析结果表明,近年来我国谷物生产主要受到单产提高缓慢、播种面积波动大、农业基础设施投入不足、自然灾害频繁等重要因素的影响。
为提高谷物产量、促进谷物生产,首先应该提供一套促进谷物生产的政策措施,提高谷物种植效益,增加谷物收入是根本。
在这个前提下,才有可能提高单产、稳定面积、加强基础设施建设、提高抗灾能力,增强我国谷物生产能力和生产稳定性。
关键词:
谷物产量影响因素多元线性回归分析
一、问题的提出
我国土地资源稀缺,人口多而粮食需求量大,因此粮食产量的稳定增长,直接影响着人民生活和社会的稳定与发展。
粮食生产的不稳定性对国民经济的影响是不可忽略的,主要体现在:
粮食生产不稳定会引发粮食供求关系的变动,尤其当国家粮食储备不足的时候,很容易导致粮价上涨,从而影响整个宏观经济。
因此,对关系国计民生的这个特殊农产品,我们不得不慎重对待。
因此,分析粮食产量波动的原因,并据此提出相应的对策,对保障粮食生产持续稳定发展,具有重要意义。
二、多元线性回归模型的基假设
(1)解释变量x1,x2,x3,xp是确定性变量,不是随机变量,且要求rank(k)=p+1 (2)随机误差项具有零均值和等方差,即: 这个假定常称为高斯-马尔柯夫条件。 ,即,假设观测值没有系统误差,随机误差项 的平均值为零。 随机误差项 的协方差为零,表明随机误差项在不同的样本之间是不相关的(在正态假定下即为独立的),不存在序列相关,并且有相关的精度。 (3)正态分布的假定条件为: 对于多元线性回归的矩阵模式 ,这个条件便可表示为: 由上述假定和多元正态分布的性质可知,随机向量y服从n维正态分布,回归模型 的期望向量 因此 三、收集整理统计数据 3.1数据的收集 选用了谷物产量y(万吨)、谷物零售价格指数x1、受灾面积x2(万公顷),化肥施用量x3(万吨),乡村农林牧渔业从业人员数x4(万人),谷物作物播种面积x5(千公顷),农用机械总动力x6(万千瓦),农村用电量x7(亿千瓦),把这7个指标的1994—2014年21年间的时间序列数据进行回归分析,来分析这些因素与谷物产量的关系。 以谷物产量作为因变量,其它7个指标作为解释变量进行回归分析。 表1-11994-2014年度谷物产量影响因素表 谷物产量(万吨)y 价格指数x1 受灾面积(万公顷)x2 化肥施用量(万吨)x3 乡村农林牧渔业从业人员数(万人)x4 谷物作物播种面积(千公顷)x5 农用机械总动力(万千瓦)x6 农村用电量(亿千瓦时)x7 1994 35450 110.2 3313.3 1513.4 31152.7 113462 16614.2 396.9 1995 38727.5 99.9 3471.3 1659.8 31645.1 114047 19497.2 435.2 1996 40730.5 99.8 3188.7 1739.8 31685 112884 20912.5 464 1997 37910.8 110.9 4436.5 1775.8 30351.5 108845 22950 508.9 1998 39151.2 109.3 4713.5 1930.6 30467.9 110933 24836 586.7 1999 40473.3 106.2 4208.6 1999.3 30870 111268 26575 658.8 2000 39408 114.1 5087.4 2141.5 31455.7 110123 28067 712 2001 40754.9 121.3 4699.1 2357.1 32440.5 112205 28707 790.5 2002 44624.3 95.2 3847.4 2590.3 33336.4 113466 29388 884.5 2003 43529.3 108.6 5547.2 2805.1 34186.3 112314 30308.4 963.2 2004 44265.8 124.3 5133.3 2930.2 34037 110560 31816.6 1106.9 2005 45648.8 127.7 4882.9 3151.9 33258.2 110509 33802.5 1244.9 2006 44510.1 148.7 5504.3 3317.9 32690.3 109544 36118.1 1473.9 2007 46661.8 134.4 4582.1 3593.7 32334.5 110060 38546.9 1655.7 2008 50453.5 107.5 4698.9 3827.9 32260.4 112548 42015.6 1812.7 2009 49417.1 92.1 5342.9 3980.7 32677.9 112912 45207.7 1980.1 2010 51229.5 96.9 5014.5 4083.7 32626.4 113787 48996.1 2042.2 2011 50838.6 96.4 4998.1 4124.3 32911.8 113161 52573.6 2173.2 2012 46217.5 90.1 5468.8 4146.4 32797.5 108463 55172.1 2421.3 2013 45263.7 101.5 5221.5 4253.8 32451 106080 57929.9 2610.8 2014 45705.8 98.6 4711.9 4339.4 31990.6 103891 60386.5 2993.4 注: 数据来源相应年度的《中国统计年鉴》、《中国农村统计年鉴》、《中国农业发展报告》、《中华人民国年鉴》、《中国统计摘要》 3.2确定理论回归模型的数学形式 通过对中国谷物生产及影响因素的初步定性分析后假设,谷物产量与其它7个指标之间存在多元线性关系,即谷物零售价格指数、受灾面积,化肥施用量,乡村农林牧渔业从业人员数,谷物作物播种面积,农用机械总动力,农村用电量之间存在着线性关系,也即可以把谷物产量的线性回归模型初步设定为: 其中,y: 谷物产量,x1谷物零售价格指数、x2受灾面积,x3化肥施用量,x4乡村农林牧渔业从业人员数,x5谷物作物播种面积,x6农用机械总动力,x7农村用电量,然后利用已有的数据进行模型拟合,以便发现这些因素之间存在的数量关系。 可能有人会提出质疑,是否遗漏了其它重要的解释变量,的确像农业科技费用等这些因素对谷物产量有重要的影响,但考虑农业科技费用会导致严重的多重共线性(因为它们与谷物单产有极高的正相关性),又考虑到它代表对农业的投入和科技进步,在选用指标中已有灌溉面积、农机总动力等性质相似的指标,再加上分析工具的局限性,因此就舍弃了这几个指标。 这也是线性相关分析的局限性之一 四、模型参数的估计、模型的检验与修改 4.1SPSS软件运用 将收集到的数据运用SPSS软件进行运算,可以得到以上模型设定的参数估计值,结果如下表 表4-1系数a 模型 非标准化系数 标准系数 B 标准误差 试用版 t Sig. 1 (常量) 37259.895 24839.352 1.500 .157 x1 -29.854 24.382 -.099 -1.224 .243 x2 -1.606 .581 -.251 -2.765 .016 x3 12.870 2.025 2.843 6.354 .000 x4 -.433 .291 -.100 -1.490 .160 x5 .043 .188 .025 .228 .823 x6 .136 .147 .400 .926 .371 x7 -12.366 3.115 -2.192 -3.970 .002 a.因变量: y 表4-2模型汇总b 模型 R R方 调整R方 标准估计的误差 Durbin-Watson 1 .987a .974 .960 906.04373 2.031 a.预测变量: (常量),x7,x1,x4,x2,x5,x6,x3。 b.因变量: y 由表4-2得 所以回归方程拟合较好 表4-3Anovab 模型 平方和 df 均方 F Sig. 1 回归 3.953E8 7 5.647E7 68.795 .000a 残差 1.067E7 13 820915.240 总计 4.060E8 20 a.预测变量: (常量),x7,x1,x4,x2,x5,x6,x3。 b.因变量: y 由上表4-1和表4-2数据可得所求回归方程 , , , 4.2用SPSS软件,得到相关系数矩阵表 由相关系数矩阵表得如下矩阵: 相关矩阵 从相关矩阵看出,y与x1,x2,x3,x4,x5,x6,x7的相关系数 偏小,P值=0.232; 偏小,P值=0.006; ,P值=0.000; 偏小,P值=0.002; 偏小P值=0.481; 偏小,P值=0.000; 偏小,P值=0.000。 x1谷物零售价格指数、x2受灾面积,x3化肥施用量,x4乡村农林牧渔业从业人员数,x5谷物作物播种面积,x6农用机械总动力,x7农村用电量,说明x1谷物零售价格指数、x2受灾面积,x3化肥施用量,x4乡村农林牧渔业从业人员数,x5谷物作物播种面积,x6农用机械总动力,x7农村用电量对谷物产量无显著影响。 自变量之间可能存在多重共线性,SPSS软件同时可以计算出相关系数显著性单侧和双侧检验的P值。 4.3回归方程的显著性检验 F检验 表4-4Anovab 模型 平方和 df 均方 F Sig. 1 回归 3.953E8 7 5.647E7 68.795 .000a 残差 1.067E7 13 820915.240 总计 4.060E8 20 a.预测变量: (常量),x7,x1,x4,x2,x5,x6,x3。 b.因变量: y ,拒绝原假设,即作出7个自变量整体对因变量y显著影响 x1对应的 t,对应的 ;x2对应的 t,对应的 ;x3对应的 t,对应的 ;x4对应的 t,对应的 ;x5对应的 t,对应的 ;x6对应的 t,对应的 ;x7对应的 t,对应的 ,所以x1、x4、x5、x6对y没有显著影响,只有x2、x3、x7通过系数的显著性检验。 回归系数没有通过显著性检验的,将用逐步回归法重新建立回归方程。 4.4利用逐步回归法进行修正 4-5模型汇总 模型 R R方 调整R方 标准估计的误差 1 .896a .803 .793 2050.32352 2 .966b .934 .927 1220.78525 3 .974c .949 .940 1103.98755 a.预测变量: (常量),x3。 b.预测变量: (常量),x3,x5。 c.预测变量: (常量),x3,x5,x7。 4-6Anovad 模型 平方和 df 均方 F Sig. 1 回归 3.261E8 1 3.261E8 77.577 .000a 残差 7.987E7 19 4203826.532 总计 4.060E8 20 2 回归 3.792E8 2 1.896E8 127.210 .000b 残差 2.683E7 18 1490316.627 总计 4.060E8 20 3 回归 3.853E8 3 1.284E8 105.371 .000c 残差 2.072E7 17 1218788.516 总计 4.060E8 20 a.预测变量: (常量),x3。 b.预测变量: (常量),x3,x5。 c.预测变量: (常量),x3,x5,x7。 d.因变量: y 4-7系数a 模型 非标准化系数 标准系数 B 标准误差 试用版 t Sig. 1 (常量) 31827.796 1437.037 22.148 .000 x3 4.057 .461 .896 8.808 .000 2 (常量) -45087.994 12920.482 -3.490 .003 x3 4.738 .297 1.047 15.950 .000 x5 .675 .113 .392 5.966 .000 3 (常量) -25062.601 14716.130 -1.703 .107 x3 7.331 1.189 1.620 6.165 .000 x5 .468 .138 .272 3.401 .003 x7 -3.613 1.614 -.641 -2.238 .039 a.因变量: y 从表输出结果看到,逐步回归的最优子集为模型3,回归方程为: 由回归方程可以看出,对谷物产量有显著性影响的是x3化肥施用量、x5谷物作物播种面积、x7农村用电量,回归方程中2个自变量的系数为正、1个系数为负,即化肥施用量和谷物作物播种面积越大,每万吨谷物产量越大;农村用电量越大,每万吨谷物产量越小。 具体说,在x5、x7保持不变时,x3每增加一个百分点,每万吨谷物产量平均增加7.331万吨,在x3、x7保持不变时,x5每增加一个百分点,每万吨谷物产量平均增加0.468万吨,在x3、x5保持不变时,x7每增加一个百分点,每万吨谷物产量平均减少3.613万吨。 4.5DW检验法 4-8残差统计量a 极小值 极大值 均值 标准偏差 N 预测值 37091.8359 50786.3945 43855.8095 4389.04304 21 残差 -2284.96460 1848.82971 .00000 1017.82623 21 标准预测值 -1.541 1.579 .000 1.000 21 标准残差 -2.070 1.675 .000 .922 21 a.因变量: y 模型汇总d 模型 更改统计量 R方更改 F更改 df1 df2 Sig.F更改 Durbin-Watson 1 .803 77.577 1 19 .000 2 .131 35.594 1 18 .000 3 .015 5.010 1 17 .039 1.995 d.因变量: y 由上表4-2可得,DW=1.995, , , , ,所以误差项之间不存在自相关。 五、结果分析 我们进行了一系列的检验和修正后的结果如下: ,DW=1.995, 从模型中可以看出: 1、x1、x2、x4、x6不符合经济意义的检验,因为在实际上,谷物产量是随着x1谷物零售价格指数的增长而增加;谷物产量是随着x2受灾面积增广而减少,谷物产量是随着x4乡村农林牧渔业从业人员数增加而增加,谷物产量是随着x6农用机械总动力增加而减少,所以最新的模型的剔除了这4个在原模型的解释变量。 2、新的模型表明: 化肥施用量每增加1万吨,谷物产量提高7.331万吨;x5谷物作物播种面积增广一个单位,谷物产量提高0.468万吨;x7农村用电量增加一个单位,谷物产量就会减少3.613万吨 3、可见,化肥使用量是影响谷物产量的显著性因素。 但从经济意义上来说,施肥过度反而会导致谷物死亡,从而减产。 4、所以我们的模型所反映的经济意义不能包括现实中的每一种情况。 六、建议 我们知道农业是一个国民经济的基础,谷物生产是关系到一个国家生存与发展的一个永恒的主题,再加上我国的人口庞大的基本国情,告诉我们。 谷物产量对我国具有特别的意义和重要性。 因而谷物产量生产关系到我们上至国家,下至人民的一件大事,每个人都应该促进和稳定谷物产量提高上做出努力,而政府在此当中的则是起着关键性的作用。 在此,我们建立的模型的基础上,就谷物产量的提高,提出了一些可供参考的政策。 1、通过模型和上面的分析可以看出,谷物播种面积对产量提高有着重要的作用,所以我们应该在合理的基础上有目的的,有规划的提高耕地面积。 2、化肥使用量虽然对谷物增产有着积极作用,但物极必反,过度使用化肥必然在很大程度上降低土地肥力,抑制谷物的生产。 所以在合理控制化肥量的同时,也要加大对化肥质的提高。 总之,任何措施办法都应该在顺应自然的基础上,我们要保证谷物的稳定增长,就一定要注意走谷物生产的课持续发展之路。 七、参考文献 [1]何晓群,文卿.应用回归分析[M].中国人民大学,2015.3 []茆诗松,程依明.概率论与数理统计教程[M].高等教育,2011.2 九、附录 y x1 x2 x3 x4 x5 x6 x7 35450.00 110.20 3313.30 1513.40 31152.70 113462.00 16614.20 396.90 38727.50 99.90 3471.30 1659.80 31645.10 114047.00 19497.20 435.20 40730.50 99.80 3188.70 1739.80 31685.00 112884.00 20912.50 464.00 37910.80 110.90 4436.50 1775.80 30351.50 108845.00 22950.00 508.90 39151.20 109.30 4713.50 1930.60 30467.90 110933.00 24836.00 586.70 40473.30 106.20 4208.60 1999.30 30870.00 111268.00 26575.00 658.80 39408.00 114.10 5087.40 2141.50 31455.70 110123.00 28067.00 712.00 40754.90 121.30 4699.10 2357.10 32440.50 112205.00 28707.00 790.50 44624.30 95.20 3847.40 2590.30 33336.40 113466.00 29388.00 884.50 43529.30 108.60 5547.20 2805.10 34186.30 112314.00 30308.40 963.20 44265.80 124.30 5133.30 2930.20 34037.00 110560.00 31816.60 1106.90 45648.80 127.70 4882.90 3151.90 33258.20 110509.00 33802.50 1244.90 44510.10 148.70 5504.30 3317.90 32690.30 109544.00 36118.10 1473.90 46661.80 134.40 4582.10 3593.70 32334.50 110060.00 38546.90 1655.70 50453.50 107.50 4698.90 3827.90 32260.40 112548.00 42015.60 1812.70 49417.10 92.10 5342.90 3980.70 32677.90 112912.00 45207.70 1980.10 51229.50 96.90 5014.50 4083.70 32626.40 113787.00 48996.10 2042.20 50838.60 96.40 4998.10 4124.30 32911.80 113161.00 52573.60 2173.20 46217.50 90.10 5468.80 4146.40 32797.50 108463.00 55172.10 2421.30 45263.70 101.50 5221.50 4253.80 32451.00 106080.00 57929.90 2610.80 45705.80 98.60 4711.90 4339.40 31990.60 103891.00 60386.50 2993.40 RES_1 ZRE_1 RES_2 ZRE_2 RES_3 ZRE_3 -2284.96469 -2.06974 -2284.96469 -2.06974 -2284.96469 -2.06974 -216.36815 -.19599 -216.36815 -.19599 -216.36815 -.19599 1848.82966 1.67468 1848.82966 1.67468 1848.82966 1.67468 818.96416 .74182 818.96416 .74182 818.96416 .74182 227.71623 .20627 227.71623 .20627 227.71623 .20627 1149.77062 1.04147 1149.77062
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 回归 分析 论文