农业保险费率厘定研究数模优秀论文.docx
- 文档编号:27222120
- 上传时间:2023-06-28
- 格式:DOCX
- 页数:13
- 大小:26.07KB
农业保险费率厘定研究数模优秀论文.docx
《农业保险费率厘定研究数模优秀论文.docx》由会员分享,可在线阅读,更多相关《农业保险费率厘定研究数模优秀论文.docx(13页珍藏版)》请在冰豆网上搜索。
农业保险费率厘定研究数模优秀论文
农业保险费率厘定研究数模优秀论文
农业保险费率厘定研究数模优秀论文农业保险定价问题摘要我国是农业大国,农业在国民经济中占有重要的地位。
而农业保险则是农业健康发展的重要保障。
在此大背景下,本文通过建立数学模型分析全国各省从1979-2011年的稻谷单产量,给出最佳的农业保险定价。
针对问题一,对稻谷的历史数据进行去趋势化处理,采用确定性趋势模型。
将各省的数据进行曲线拟合,比较线性回归与二次趋势回归在显著性0.05条件下的通过率和拟合程度,发现二次趋势更准确。
以北京市为例,拟合函数为,结合去趋势公式得到去趋势值并利用matlab得到去趋势前后的比较图。
针对问题二,由于各省的单产情况不同,所对应的的最优分布也不一样。
本文选取了正态、对数正态、Gamma、weibull、logistic分布模型分别对各省的概率密度进行拟合。
为了更好的给出最优分布,在对原始数据与累积分布图像直观观察的的基础上进行Anderson-Darling(AD)拟合优度检验,算出各分布模型的AD值,AD值小的则代表拟合的更好,进而得到各省市对应的最优分布模型。
以北京市为例,各分布模型AD值分别为0.628、0.898、0.768、0.624、0.311,故其最佳分布模型为logistic分布。
针对问题三,利用各分布模型的概率密度函数,结合纯费率的计算公式,通过matlab计算得到各省在这5个分布模型下的单产长期期望值和纯费率。
结合问题二得到的各省最优分布模型,即得到各省的最佳纯费率。
以北京市为例,各分布下的纯费率为3.93%、4.15%、4%、4.09%、3.49%,最佳纯费率为3.49%。
针对问题四,结合问题三的计算结果,分析得到对称分布的纯费率较非对称分布要高且不同分布下的纯费率高低具有一致性的分布特征。
讨论发现logistic与weibull分布拟合较传统分布如正态分布等要好;不同分布拟合得到的纯费率是不同的,要选择适当的分布模型;单产量波动大的地区,相应的纯费率也高,纯费率从侧面反映了单产量的波动情况。
关键词:
确定性趋势模型分布模型AD检验纯费率22农业保险定价问题1、问题重述据央视4月17日焦点访谈报道,目前东北三省和内蒙古地区有1.43亿亩旱地处于春涝状态,其中黑龙江省有7600多万亩,占总耕地面积的三分之一,东北春涝面积之广、程度之重,为半个世纪以来历史罕见。
受2012年降水偏少和近期持续晴热天气影响,云南部分地区出现干旱,干旱造成云南农业、林业等受灾严重。
据统计,截至4月23日全省因干旱已造成农作物受灾1173万亩,成灾537万亩、绝收128万亩,林地受灾面积2331万亩,成灾991万亩,报废362万亩;因灾造成全省需救助人口323万余人。
全省直接经济损失近100亿元,其中农业损失27.7亿元、林业损失33.63亿元。
我国是一个农业大国,农业在国民经济中居于基础性地位,但同时我国农业又是三大产业中现代化程度最低的产业,农民收入较低,抗风险能力较弱,一旦遭遇自然灾害损失惨重。
农业保险是规避农业生产风险的重要手段之一,其作为一种分散风险并能在灾后及时提供经济补偿的风险管理手段,是现代化农业健康发展的重要保障,也是全球范围内广泛研究和应用的风险转移工具,重要性越来越被人们所认识。
我国于2007年开始了新一轮农业保险试点,在中央和各级地方财政的支持下农业保险得到了快速发展。
2012年,我国农业保险的保费规模已经达到了240.13亿元,同比增长了38.4%,居世界第二。
请查阅有关资料及数据资源,以我国各省或者某省各地区的某一农作物为例,以农作物产量统计模型为基础,对某一农作物保险进行定价(费率厘定),要求:
1.对某一农作物历史单产数据序列进行去趋势处理;2.对该种农作物单产服从的概率分布进行拟合;3.计算纯费率;4.分析该种农作物纯费率的分布特征,并对结果进行讨论。
2、问题分析根据保险原理,纯费率应等于保险人的期望赔付支出与其承保规模的比值。
在产量统计模型中,农作物保险纯费率厘定的准确性主要由作物单产分布期望损失率的大小决定。
而农作物产量期望损失的计算依赖于农作物单位面积产量的分布。
因此作物单产分布是问题研究的关键点。
对于问题一的数据去趋势处理,我们对31个省(除青海)从1979—2011年的稻谷亩产量进行曲线拟合,利用确定性时间序列拟合方法,对数据进行线性趋势和二次趋势拟合,综合各因素,如显著性、拟合优度等特点选取去趋势模型。
对于问题二,考虑到各省的分布特点不同,其最优的分布模型也趋向不同,采用常用的正态、对数正态、gamma、logistic、weibull分布模型对各省去趋势后的单产量进行拟合,选取AD值最小的为最优分布模型。
对于问题三,计算纯费率,由题目中所给出的纯费率的计算公式,结合问题二的求解结果,代入公式,得到相应各省的最佳纯费率。
对于问题四,结合问题一、二、三的计算结果,对结果进行分析,分析其分布特征,并对结果进行讨论。
3.假设与符号3.1模型的假设1.假设本文各样本省平均单产均能够反映其省内农户的风险水平,即省内各农户的风险程度相似,具有同分布的特点。
这样便可以用整体的分布反应各个农户单产的分布密度。
2.在保险定价的一定时期内保险行业的保险相关政策不会出现大幅度的改动,行业较稳定。
3.农业保险费都是按照保险精算原则厘定的,单位面积的保障水平假设为1.3.2模型的符号符号意义原假设备择假设t实际年份-1978得到的时间量第i个省市在t时间的水稻单产实际值第i个省市在t时间的水稻单产模型拟合值第i个省市在t时间的水稻单产去除趋势值单产在最优分布下的概率密度函数Anderson-Darling(AD)检验的统计量回归平方和与总离差平方和的比值,越接近1,拟合效果越好显著性水平4.模型的建立与求解4.1问题一4.1.1模型的建立对全国31个省(除青海省外,下面都为30个省)稻谷的历史单产数据序列进行去趋势化处理,利用确定性趋势模型中的趋势拟合方法。
在确定性时间序列分析中,对于具有趋势因素的时间序列需要剔除时间序列的短期波动因素,而明确它的长期变化趋势。
趋势拟合方法就是利用OLS法估计出时间序列中只与时间t有关的部分。
常用的趋势拟合方程有:
(1)线性趋势模型:
(2)二次趋势模型:
(3)指数增长模型:
在曲线拟合的基础上进行方差分析:
:
时间与单产量相互独立:
时间与单产量有关系分析显著性及拟合程度R,选择一次线性函数还是二次函数进行拟合,得到或这里的t=年份—1978在曲线拟合的基础上分析得到去趋势化公式:
其中为去除趋势产量,为模型拟合值,为2011~2001年水稻单产的平均值。
此平均值是100%保障水平下的保障产量。
4.1.2模型的求解利用spss软件对30个省1979年—2011年在一次趋势下进行回归,在0.05的显著水平下有26个通过了检验,而在二次趋势下,在0.05的显著水平下有28个通过了检验。
一次和二次趋势下显著性差异不大,但是拟合程度各省的二次趋势拟合普遍大于一次线性拟合,并且由于国内耕地的减少以及科技信息的发达,单产量在未来会趋向减少,进一步证明了单产量呈二次趋势模型。
所以采用二次趋势模型来去除趋势。
以北京省为例(其余见附录):
图一得到二次曲线方程:
此二次曲线由于二次项系数较小,开口较大,趋势变化平缓,科技信息的发展使稻谷单产量增加,但同时科技进步,资源消耗大,耕地面积也在逐步的减少,自然灾害、极端天气的出现使单产量随着年份的增加逐步减产。
将所得二次曲线方程代入去趋势化方程得到并绘制实际值、趋势值和去除趋势值的分布图。
观察可以发现,调整后的单产序列是平稳的,且趋势调整前后单产序列的波动情况大体一致,如下图:
图二问题二2.1模型的建立与求解各省稻谷单产量不同,则服从的概率密度分布也不同。
常用的密度参数模型有正态分布、对数正态分布、gamma分布、weibull分布、logistic分布模型,将用这5个分布对30个省利用matlab进行概率密度拟合。
正态分布模型:
若随机变量X服从一个数学期望为μ、方差为σ的高斯分布,记为N(μ,σ)。
其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。
概率密度函数:
对数正态模型:
一个随机变量的对数服从正态分布,则该随机变量服从对数正态分布。
概率密度函数:
Gamma分布模型:
设α,β是正常数,如果X的密度是:
就称X是服从参数为(β,α)的Gamma分布。
Weibull分布模型:
又称韦伯分布,是可靠分析和寿命检验的理论基础。
概率密度函数:
Logostic分布模型:
“评定模型”,“分类评定模型”,又作Logisticregression,”逻辑回归”)是离散选择法模型之一,属于多重变量分析范畴。
概率密度函数:
在概率密度函数的基础上画出累计函数分布图,可进行直观的判断哪种分布最优。
但是这种判断往往出现主观上的误差,若五种分布模型相似,则不能从图像中进行直接的判断。
为了更准确的得到拟合优度,可进行卡方拟合优度检验、Kolmogorov-Smirnov(K-S)检验和Anderson-Darling(AD)检验。
但AD检验是K一S检验的修正和加强,与K一s检验相比,它赋予了样本分布尾端数据更大的权重。
在三种检验方法中,AD检验的检验结果最为精确、可信度最高。
AD统计量的定义以此度量经验分布函数与拟合分布函数的偏离程度:
其中为权重函数,,是拟合的概率密度函数,则为拟合的累计分布函数,n为样本个数。
在实践中,一般使用近似的公式:
其中表示样本数据从小到大排序后处于第i位的样本。
越小,则表明此分布拟合的更好。
2.2模型的求解在30个省中以北京为例,在matlab中得到表一正态对数正态gammalogisticweibullabmbab北京414.58240.84976.022220.10413999.18064.18007416.66621.0204431.96711.6697并且得到以下5种分布的概率密度图:
图三从中发现这五种分布模型均能较好的反映样本的分布形态,然而同时也可以看出,五种分布模型的分布形态也有很大差别。
判断拟合优度,首先可以通过图形进行直观的检验。
图四给出了北京市原始数据与各种分布模型的累计分布:
图四从图四中看,这五种分布模型在拟合北京时拟合相似,从图像中不能进行直观的判断哪个分布最好,所以还要进行严格的数理检验,也就是拟合优度检验。
利用minitab软件对各省进行AD(Anderson-Darling)检验,算出拟合值与实际值的偏离程度,AD值小的则说明此分布模型对该省份拟合的更好。
得到如下结果:
各省份在不同分布模型下的AD值省份logisticnormalgammalognormalweibull最优分布北京0.3110.6280.7680.8980.624logistic天津0.4160.9881.5161.8770.373weibull河北0.4020.5440.7570.8960.254weibull山西0.2010.4360.7791.1270.447logistic内蒙古0.681.8562.8753.6452.039logistic辽宁1.2892.5554.3795.4131.883logistic吉林0.2190.2250.3950.5270.144weibull黑龙江0.591.5132.3592.9340.499weibull上海1.2563.2123.944.3881.285logistic江苏0.8783.1664.2284.8470.943logistic浙江0.9052.8753.5213.9360.922logistic安徽1.492.6653.1593.4551.165weibull福建1.5424.745.576.0371.444weibull江西1.2123.9924.8945.4141.138weibull山东4.3472.4433.674.3471.283weibull河南1.0911.8872.4272.7350.859weibull湖北1.5984.5085.6366.2351.734logistic湖南1.5984.6625.5576.0551.565weibull广东0.5012.0412.7183.1871.019logistic广西0.8682.0062.6413.0540.88logistic海南0.8091.1871.2931.3590.548weibull重庆0.4840.9271.0571.1630.454weibull四川0.9622.8923.7544.2820.855weibull贵州1.1281.6732.0422.2480.889weibull云南0.7662.6633.2993.7170.978logistic西藏0.2660.4060.5470.8480.417logistic陕西0.7721.1191.4221.580.564weibull甘肃0.240.3620.5340.7470.459logistic宁夏1.6052.4712.9783.2551.349weibull新疆1.2612.3753.8544.7881.936logistic表三从表中可以看出,不同的省份进行拟合的分布也不同,有些得到的AD值差异甚大,如福建的lognormal分布的AD值logistic分布的AD值的近6倍,这也反应了不同省市的概率密度所对应的的分布模型是不一样的。
要更准确的计算保费,则要选取最佳的分布模型。
从表中可知,是weibull与logistic这两种分布模型能较好的拟合。
3.问题三:
3.1模型的建立利用问题二得到的各省市的最优拟合分布模型,结合matlab中所得到的的各个参数带入分布的密度函数中,得到稻谷在该省的单产所服从的最优分布。
利用纯费率为单产损失率的期望得到公式:
其中表示实际单产,则表示了单产损失率,表示的概率分布密度,为长期平均单产(单产的期望)3.2模型的求解以北京省为例,由问题二的AD检验可知北京最优拟合分布模型为logistic模型,利用matlab软件得到北京市的logistic参数值=416.666,s=21.0204,将参数值代入logistic的概率密度公式得到由长期单产期望公式得到北京市的平均单产=416.67将所得的与代入到纯费率公式中得到最优纯费率为:
得到=0.0349依照上诉方法利用matlab得到各个分布的纯费率:
地区正态分布(%)对数正态分布(%)gamma分布(%)logistic分布(%)weibull分布(%)最优纯费率(%)北京3.934.154.003.494.093.49(L)天津3.906.656.164.844.894.89(W)河北5.075.465.234.724.914.91(W)山西6.908.097.466.216.926.21(L)内蒙古7.5610.489.015.668.035.66(L)辽宁8.5215.5812.116.217.056.21(L)吉林6.587.156.806.386.386.38(W)黑龙江5.266.836.114.124.064.06(W)上海3.904.866.112.562.762.56(L)江苏4.395.885.222.812.862.81(L)浙江3.444.153.822.292.422.29(L)安徽4.174.934.573.122.942.94(W)福建3.514.505.841.921.841.84(W)江西3.754.854.372.212.142.14(W)山东7.069.648.465.195.595.59(W)河南5.486.475.994.484.274.27(W)湖北4.636.555.712.622.612.62(L)湖南3.784.954.442.092.072.07(W)广东3.864.674.292.763.302.76(L)广西4.495.455.003.433.383.43(L)海南2.252.371.381.951.741.74(W)重庆3.293.583.352.592.712.71(W)四川4.095.234.722.732.702.70(W)贵州4.705.264.984.083.713.71(W)云南3.444.113.802.332.572.33(L)西藏12.8411.647.918.0014.668.00(L)陕西4.795.224.984.384.064.06(W)甘肃6.817.627.156.336.836.33(L)宁夏5.226.175.724.143.963.96(W)新疆7.9913.0310.65.897.315.89(L)表三从表三可得到不同分布下的纯费率也不同,根据问题三得到的各省的最佳分布模型,我们进而得出在该分布模型下的最佳的纯费率。
4.问题四4.4,.1纯费率分布特征:
不同分布下厘定出的费率高低具有一致性,费率高的地区,无论哪种分布都计算出相对高的费率,费率低的地区,各种分布计算的费率都比较低。
总体上看非对称的分布厘定出的费率相对要比对称分布厘定出的费率要高。
Logistic分布下的费率有16个省份最低,且整体上明显低于其他四种分布下的费率,此分布平均费率为3.98%;对数正态分布下的费率有27个省份最高,此分布下的平均费率分别为6.52%,其次是gamma,平均概率为5.84%。
4.4.2结果讨论:
第一、本文选择了normal、lognormal、gamma、logistic、weibull五种参数分布模型来模拟水稻的单产分布,通过拟合分布图形的直观比较与AD检验定量比较发现,对于全国30个省(除青海省外)的水稻单产保险来说,weibull与logistic分布拟合出的结果较好,而传统的厘定费率方法正态分布、gamma分布与对数正态分布拟合的结果相对较差。
第2、保险费率的合理厘定有赖于单产分布模型的正确选择。
按照不同分布模型厘定出来的保费是不相同的,有些地区的差距相对还比较大。
例如辽宁省最低的Logistic分布下厘定出的费率为6.21%,与最高的对数正态分布厘定出的费率15.58%,相差了一倍多。
由此可见,农险费率的科学厘定依赖于单产分布模型的正确选择。
第三、通过纯费率与各分布方差(见附录)的比较发现,纯费率在10%左右的方差也较大,这从侧面说明了单产波动大的地区纯费率也高,纯费率能够一定的反映单产量波动情况。
综上所述,每一个地区都有各自所最吻合的单产分布,若想计算出合理的农业保险费率就应当具体研究每一个地区单产分布的具体情况,根据其最吻合的单产分布来计算费率,这样才能厘定出最优费率,否则必然会导致保险提供者的亏损经营。
5.模型的评价与改进5.1模型的优点1.本文选用了二次趋势模型,较线性模型等模型,拟合较为准确,2.采用正态、对数正态、gamma、logistic、weibull分布模型对各省去趋势后的单产量进行拟合,进行AD检验,选取最优分布模型。
模型最大程度地包括了原始数据的信息,使概率分布尽可能地符合当地情况。
5.2模型的缺点1.各省省内单产情况复杂,部分省份与最优分布模型的符合情况仍有一定差距。
2.样本数据量不是很大,在拟合时存在一些误差。
6.模型的推广可以将此模型运用到其他农作物的保险费的定价中,此模型综合考虑了农作物在不同分布下的拟合程度,对于纯费率的计算,具有较高的准确度。
也可将此模型运用于省份内的各地区农作物保费的测定。
7.参考文献[1]刘卫国,MATLAB程序设计与应用,[M],高等教育出版社,2012。
[2]汪晓银,周保平,数学建模与数学实验,[M],北京:
科学出版社,2012。
[3]高惠璇,SAS系统SAS/STAT软件使用手册,[M],北京:
中国统计出版社,1997。
[4]郭兴旭,陶建平,曾小艳,湖北省油菜保险纯费率比较研究,[J],保险研究,2010,
(1):
65-72。
[5]刘锐金,凌远云,王成丽,不同产量分布下湖北省县级水稻产量保险的纯费率厘定,[J],统计与决策,2010,(13):
75-78。
[6]聂建亮,叶涛,王俊,史培军,基于双尺度产量统计模型的农作物多灾种产量险费率厘定研究,[J],保险研究,2012,10:
47-55.[7]周玉淑,邓国,齐斌,张敏,中国粮食产量保险费率的订定方法和保险费率区划,[J],南京气象学院学报,2003,26(6):
.806-814.[8]章刚勇,阮陆宁,基于MonteCarlo随机模拟的几种正态性检验方法的比较,[J],理论新探,2011,7:
17-20.附录:
%%一、以北京省为例,求去趋势值%%导入全国30个省1979-2011年单产值datat=1:
33;ave_data=mean(data,1);Ave_data_1=ave_data(:
1);p1=polyfit(t,data(:
1),2);yy1=polyval(p1,t);qu_data_1=ave_data_1+data(:
1)-yy1;plot(t,data(:
1),t,yy1,t,qu_data_1)title(‘’北京’);legend(实际值,趋势值,去趋势值)%%二、确定normal分布参数mu1,sigma1>>[mu1,sigma1]=normfit(qu_data_1)mu1=414.5820sigma1=40.8497%%确定gamma分布参数a,b>>gamfit(qu_data_1)ans=99.18064.1801%%确定weibull分布参数mu2,sigma2>>q=wblfit(qu_data_1)q=431.966711.6697用distributionfitting工具箱得到对数正态分布参数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 农业 保险 费率 厘定 研究 数模 优秀论文