雾霾时空分布研究13年研究生D题.docx
- 文档编号:11897015
- 上传时间:2023-04-08
- 格式:DOCX
- 页数:23
- 大小:485.02KB
雾霾时空分布研究13年研究生D题.docx
《雾霾时空分布研究13年研究生D题.docx》由会员分享,可在线阅读,更多相关《雾霾时空分布研究13年研究生D题.docx(23页珍藏版)》请在冰豆网上搜索。
雾霾时空分布研究13年研究生D题
参赛密码
(由组委会填写)
第十届华为杯全国研究生数学建模竞赛
河海大学
学校
10294006
参赛队号
1.单彬彬
队员姓名2.胡腾飞
3.付修庆
1
参赛密码
(由组委会填写)
第十届华为杯全国研究生数学建模竞赛
题目空气中PM2.5问题研究
摘要:
本文从PM2.5的相关因素分析、PM2.5的分布与演变及应急处理及PM2.5的空气含量控制管理三个方面对PM2.5进行了相关研究。
在相关性分析中,PM2.5的浓度含量与CO的浓度含量高度相关;与
SO2、NO2、PM10三者中度相关;与O3低度相关。
在PM2.5的分布与演变及应急处理中,考虑天气和季节等影响因素,利用灰箱模型和点源模型,建立多元时空模型,分别对PM2.5的分布与演变及应急情况进行分析,并给出污染评估。
在空气中PM2.5的含量控制管理中,考虑到每年年终平均治理浓度与当年的PM2.5浓度有关,及实际的污染排放情况,建立PM2.5治理模型,并给出每年的的年终平均治理指标分别为:
135.25、124.50、84.27、59.22、41.779(单位gm/3)。
最后根据每年治理指标,采用多元优化模型指定治理计
划,使经费投入较为合理,给出五年总投入经费221.5159百万元及
2
逐年经费投入分别为:
85.25、74.5、35.5072、17.535、8.7237(单位百万元),并进行方案合理性分析。
关键词:
PM2.5相关性扩散预测评估治理指标经费
一、问题的重述
1.1问题由来
2012年2月29日,环境部发布与实施新空气质量监测标准。
在新标准中,首次将产生灰霾的主要因素——对人类健康危害极大的细颗粒物PM2.5的浓度指标作为空气质量监测指标。
由于细颗粒物PM2.5进入公众视线的时间较短,在学术界也是新课题,尤其是对细颗粒物PM2.5及相关因素的统计数据还很少,对细颗粒物PM2.5的客观规律也了解得很不够。
但我们不能因此放慢前进的脚步,我们要千方百计的利用现有的数据开展PM2.5相关问题的研究。
1.2问题要求
(1)依据附附件中的数据或自行采集的数据进行分析。
(2)定量分析AQI中的基本监测指标的相关性。
(3)合理考虑风力、湿度等天气和季节因素的影响。
(4)突发状况为全地区PM2.5浓度最高点处浓度增至2倍,持续2小时。
(4)治理指标达到最终年终平均浓度统计指标35gm/3。
(5)治理计划既能达到减排指标,又能使经费投入较为合理。
1.3问题的提出
(1)利用或建立适当模型,对AQI中的6个基本监测指标的相关与独立性进行定量分析,尤其是对其中PM2.5(含量)与其它5项分指标及其对应的污染物(含量)之间的相关性进行分析。
(2)描述该地区内PM2.5的时空分布及其规律,并结合环保部新修订的《环境空气质量标准》分区进行污染评估。
(3)建立能刻画该地区PM2.5的发生和演变规律的数学模型,并利用该地区的数据进行定量与定性分析。
(4)建立针对突发情况的污染扩散预测和评估的方法,并利用模型针对突发状况进行预测评估,给出重度污染和可能安全区域。
(5)采用适当方法检验模型和方法的合理性,并根据已有成果探索PM2.5的成因、演变等一般性规律。
(6)给出合理的治理计划,即给出每年年终平均治理指标。
(7)给出五年投入总经费和逐年投入预算计划,并讨论该方案的合理性。
二、问题的假设
1、武汉市年PM2.5治理当年的年排放量为60gm/3,在治理过程中每年减少
排放量10gm/3,考虑到排放量不能取幅值,在此只是一个简单的简化。
2、在治理过程中,每年治理的平均浓度与当年的浓度呈正比。
3、将每年的排放量放到年初计算。
4、在突发情况时,假设浓度增大的监测点是一个连续的点源。
5、在突发情况时,假设这个点源是一个地面连续点源。
三、符号说明
IAQIP污染物项目P的空气质量分指数;
CP污染物项目P的质量浓度值;
BPHi文献[2]中表1中与CP相近的污染物浓度限值的最高值;
BPLo文献[2]中表1中与CP相近的污染物浓度限值的最低值;
IAQIHi文献[2]中表1中与BPHi对应的空气质量分指数;
IAQILo文献[2]中表1中与BPLo对应的空气质量分指数;
i:
气体污染物沿i方向上的湍流系数
ui:
气体沿i方向上的速度
Q:
污染源强度
i:
气体沿i方向的扩散系数
xi、si第i年PM2.5综合治理和年终平均治理指标四、问题的分析
4.1对问题1的分析
鉴于西安市环境监测数据系列的不完整性,可能不能全面、客观的反映该地区的环境质量时空分布状况,于是我们从武汉环保中心网站下载相关环境监测数据(部分监测数据见附件1),并根据这些数据进行相关性及独立性定量分析。
监测数据中给出的都是各监测指标的分指数,首先需要对数据进行处理,将各指标的分指数转换成浓度,然后再进行PM2.5与其他指标的相关性分析。
4.2对问题2的分析
描述武汉地区PM2.5的时空分布即给出武汉地区PM2.5在时间和空间上的分布,一个时刻上该地区PM2.5存在一个空间分布特征,一个空间上该地区PM2.5存在一个时间分布特征,在此,我们将时间简化成四个季节,分别给出四个季节该地区PM2.5的空间分布特征图,然后根据分布图及季节描述其时空规律,最后按环保部新修订的《环境空气质量标准》进行分区污染评估。
4.3对问题3的分析
问题3是在问题1和问题2完成的基础上提出的一个刻画该地区PM2.5的发生和演变规律的数学模型。
通常,刻画PM2.5发生和演变的数学模型包括灰箱模型及基于扩散理论和质量守恒的已知污染源和考虑其它影响因素的数学表达式模型。
考虑本地区情况,污染源类型包括很多,如固定源、流动源、无组织排放源等,而且污染源的个数不单一、位置不确定、排放量不易监测,因此仅仅进行点源简单的简化叠加或面源和点源简单的简化叠加不够准确。
基于上述情况,我们考虑采用灰箱模型并考虑多个影响因素,建立多元时空模型,分层次利用该地区的数据进行定量和定性的分析。
4.4对问题4的分析
灰箱模型只能针对已发生的类似情况进行预测,因此针对突发状况,即某监测点的PM2.5浓度突然增至数倍,我们可以将此突发情况简化成已知边界条件的点源扩散模型,将PM2.5监测点浓度最高点作为点源,突发状况发生前各监测点的浓度作为初始条件,并考虑当天的天气影响因素。
最后按环保部新修订的《环境空气质量标准》给出重度污染和可能安全区域。
4.5对问题5的分析
首先阐述了第3问中建立的PM2.5发生演变模拟预测模型相对于多数现有的大气污染预报模型所做出的改进:
考虑了大气中各种污染物发生化学反应的可能性以及量化并在模型中考虑了风向因子。
通过武汉各个监测点的实测值与模型预测值对比,说明了该模型的合理性。
最后通过对天气数据的统计分析,证明了大风天气和降水天气均对PM2.5具有明显的稀释效果,且前者效果较后者显著。
4.6对问题6、问题7的分析
问题6主要是给出符合实际情况的PM2.5治理模型及污染源控制减排模型,然后结合两个模型求解达到追中治理指标需要每年的年终平均治理指标。
问题7是在问题6求解基础上的单目标优化问题。
五、模型的建立与求解
5.1问题1的分析与求解
5.1.1数据处理及相关性定量分析由于监测数据给的是分指标,所以我们需要利用公式(5.1)对数据进行处理,将分指标转换成浓度,然后利用SPSS软件对各个监测点的PM2.5浓度与其他5项分指标对应的污染物的浓度进行相关性分析。
IAQIP
IAQPHiIAQPL0(CPBPLo)IAQPL0(5.1)
BPHiBPLo
式中:
IAQIP——污染物项目P的空气质量分指数;
CP——污染物项目P的质量浓度值;
BPHi——文献[2]中表1中与CP相近的污染物浓度限值的最高值;
BPLo——文献[2]中表1中与CP相近的污染物浓度限值的最低值;
IAQIHi——文献[2]中表1中与BPHi对应的空气质量分指数;
IAQILo——文献[2]中表1中与BPLo对应的空气质量分指数;
5.1.2各指标相关系数及结果分析
利用SPSS计算的PM2.5与其它5项污染物的相关系数见表5.1。
表5.1PM2.5与其他污染物Pearson相关系数
SO2
NO2
PM10
CO
O3
汉口花桥
Pearson相关性
0.697
0.694
0.842
0.820
-0.426
显著性(双侧)
0.000
0.000
0.000
0.000
0.000
沌口新区
Pearson相关性
0.689
0.712
0.754
0.845
-0.300
显著性(双侧)
0.000
0.000
0.000
0.000
0.000
汉阳月湖
Pearson相关性
0.637
0.693
0.739
0.673
-0.336
显著性(双侧)
0.000
0.000
0.000
0.000
0.000
武昌紫阳
Pearson相关性
0.709
0.752
0.703
0.875
-0.356
显著性(双侧)
0.000
0.000
0.000
0.000
0.000
东湖梨园
Pearson相关性
0.552
0.733
0.781
0.828
-0.269
显著性(双侧)
0.000
0.000
0.000
0.000
0.000
青山钢花
Pearson相关性
0.595
0.718
0.772
0.861
-0.298
显著性(双侧)
0.000
0.000
0.000
0.000
0.000
汉口江滩
Pearson相关性
0.722
0.599
0.730
0.865
-0.358
显著性(双侧)
0.000
0.000
0.000
0.000
0.000
东湖高新
Pearson相关性
0.691
0.685
0.756
0.803
-0.329
显著性(双侧)
0.000
0.000
0.000
0.000
0.000
吴家山
Pearson相关性
0.683
0.718
0.847
0.837
-0.357
显著性(双侧)
0.000
0.000
0.000
0.000
0.000
沉湖七壕
Pearson相关性
0.664
0.667
0.701
0.605
-0.244
显著性(双侧)
0.000
0.000
0.000
0.000
0.000
均值
Pearson相关性
0.664
0.697
0.762
0.801
-0.327
显著性(双侧)
0.000
0.000
0.000
0.000
0.000
相关系数ρXY取值在-1到1之间,ρXY=0时,称X,Y不相关;|ρXY|=1时,称X,Y完全相关,此时,X,Y之间具有线性函数关系;|ρXY|<1时,X
的变动引起Y的部分变动,ρXY的绝对值越大,X的变动就会引起Y的变动越大,当|ρXY|>0.8时称为高度相关,当|ρXY|<0.3时,称为低度相关,其他为中度相关。
由表5.1可以看出,在10个监测点的相关系数的均值中,PM2.5的浓度含量与CO的浓度含量的相关系数为0.801,因此两者高度相关;与SO2、NO2、PM10的相关系数分别为0.664、0.697、0.762,因此PM2.5与三者分别中度相关;与O3相关系数为-0.327,因此定义两者低度相关。
由相关性计算结果可以看出,PM2.5的浓度含量与SO2、NO2、CO的浓度含量有一定的相关性,说明SO2、NO2、CO的浓度含量对PM2.5的浓度含量有一定的影响性,这也从侧面验证了之前的相关研究,认为SO2、NO2、CO是在一定环境条件下生成PM2.5前的主要气态物质。
相关研究表明PM2.5的主要成分包括碳合物、硝酸盐、硫酸盐、铵盐及土壤金属元素,这也验证了数据的可靠性及相关性分析的正确性。
5.2问题2的分析及求解利用GIS技术绘出武汉市10个监测点的空间分布,见图5.1武汉市监测点分布图。
图5.1武汉市监测天分布图由于数据有限,将所有数据按季节分成三组,分别为冬季、春季、夏季,然后根据各点的各季节PM2.5平均浓度值及年PM2.5平均浓度值,利用Surfer软件绘出三个季节及该地区年PM2.5平均浓度的空间分布图。
分别见图5.2冬季PM2.5浓度分布图、图5.3春季PM2.5浓度分布图、图5.4夏季PM2.5浓度分布图、图5.5年PM2.5平均浓度分布图。
图5.2冬季PM2.5浓度分布图图5.3春季PM2.5浓度分布图
图5.4夏季PM2.5浓度分布图图5.5年PM2.5平均浓度分布图
从时间分布上看,冬季PM2.5的平均含量明显高于夏季,春季平均含量居中。
这说明季节因素对PM2.5有很大的影响。
从空间分布上看,该地区东南部、东部、东南部及监测点2(沌口新区)周围地区的PM2.5含量明显高于其他地区。
这说明PM2.5的污染源主要分布在这些地区。
另外有等值线分布图看一看出,等值线存在凸出或凹进的部分,在理想状态下,污染源的分布应该随着距离均匀递减变化,所以我们考虑到天气因素和地表状况的影响,认为其主要是由风向和地形及建筑物密度导致的,其中风向占主导因素。
按照环保部新修订的《环境空气质量标准》分区进行污染评估,分区污染评估结果见表5.2分区污染评估图。
表5.2分区污染评估图(PM2.5浓度单位:
μg/m3)
环境类别
监测点
年均PM2.5
年标准
年满足
有效天数
满足天数
天满足率
一类
汉阳月湖
96.38
15
否
269
32
11.90%
东湖梨园
99.49
15
否
269
33
12.27%
沉湖七壕
91.27
15
否
269
39
14.50%
二类
汉口花桥
84.18
35
否
269
164
60.97%
沌口新区
100.81
35
否
269
132
49.07%
武昌紫阳
101.98
35
否
269
126
46.84%
青山钢花
123.9
35
否
269
74
27.51%
汉口江滩
101.43
35
否
269
129
47.96%
东湖高新
105.45
35
否
269
113
42.01%
吴家山
84.88
35
否
269
159
59.11%
5.3问题3的求解
5.3.1风力、湿度等天气和季节影响因素的定量及定性描述通过固定其它因素,改变其中一个因素来定量或定性的描述该因素对PM2.5时空分布的影响。
(1)风向及风力因素影响
图5.6无风时PM2.5空间分布图图5.7有北风时PM2.5空间分布图经对比图5.6(后一天)和图5.7(前一天)可以发现,在有北风的情况下,该地区的PM2.5的浓度相对无风时有所降低,而且由等值线看出在北风下,除了PM2.5的浓度改变外,PM2.5的分布特征也发生了变化,等值线向南方凹进。
由于现有数据的不全面性,通过查阅相关资料了解其它气象因素与PM2.5的关系。
(2)相对湿度的影响
相对湿度和PM2.5的含量两者呈正相关,这主要是因为相对湿度增大,有利于大气中的气体物质转化成为二次粒子,且一些极细的颗粒由于吸湿使本身含液量增加,粒子涨大从爱根核模态转化为积聚核模态,造成空气中PM2.5的质量浓度增加。
(3)风速的影响
在无沙尘暴的情况下,PM2.5质量浓度随风速的增大而降低,这是因为风速越大,大气湍流强度越大,对污染物扩散稀释的能力越强,导致PM2.5质量浓度下降,反之则浓度上升。
然而当速度大于某一值时,风可能卷起更多沉积于城市地表的颗粒物,甚至有可能因高风速使得颗粒物相互碰撞加剧,裂变为细一级的粒子,使得PM2.5质量浓度增大,此时风速与细粒子质量浓度表现出正相关。
总的来说,风速低于某一阈值时,PM2.5的质量浓度与其呈负相关,反之则呈正相关。
(4)降水的影响
因其质量和粒径都很小,PM2.5在大气中停留的时间较长。
细粒子的去除主要通过湿沉降,干沉降作用很小,因此降水能降低空气中PM2.5的浓度。
5.3.2模型的建立与求解
一般大气污染预测可分为潜势预测,统计预测和数值模式预测三类。
数值预测科学性强,但一般都需要较详尽的源强时空分布资料和分辨率很高的气象模式。
我国在统计预测方面已有较好的基础,大部分城市都有较长时间的监测资料,而且简单易普及。
支持向量机利用VC维将经验风险最小化转化为结构风险最小化,有效克服了传统机器学习的缺点和维数灾难,能非常成功地处理回归问题和模式识别等问题。
因此,本节将基于支持向量机建立PM2.5发生演变模拟的统计预测模型。
5.3.2.1支持向量机原理
利用SVM进行回归与预测的基本思想是通过非线性映射将数据映射到高维特征空间Ω中,并在该特征空间进行线性回归:
f(x)((x))b
(5.2)
考虑l个独立分布的学习样本T{(xy1,1),,(xyl,l)}(XY,)l,其中
xlXRn,ylYRi,1,2,l,在高斯特征空间中构造回归超平面。
用于回归分析的SVM主要有ε-SVR和v-SVR。
在ε-SVR中,需要事先确定不敏感损失函数中的参数ε,然而在某些情况下选择合适的ε并非易事。
相比之下,v-SVR不需要用户确定该项参数。
因此本模型采用v-SVR。
v-SVR将回归分析问题转化为求解以下优化问题:
回归超平面的对应优化问题是:
式中:
(*)(1,1*,,l,l*)T,C是惩罚因子,v为控制支持向量机的个数;
ε为不敏感损失函数。
原问题的对偶问题:
所求的最优回归超平面可表示为:
5.3.2.2建立PM2.5发生演变模拟预测模型的步骤
建立基于支持向量机的PM2.5发生演变模拟预测模型,关键问题是输人模式的确定、训练样本的选取以及模型结构参数的选取。
(1)构建有效的影响因子。
PM2.5来源于自然源和人为源,不仅包括排放源直接排放到大气中的颗粒物,还包括通过与大气组成成分发生化学反应后生成的颗粒物,故成分影响因子选取前日平均SO2浓度、前日平均NO2浓度、前日平均CO浓度、前日平均PM2.5浓度;气象影响因子则选取前日平均风速、前日最显著风向、前日平均气温、前日平均温度梯度、前日平均湿度、前日平均气压、前日总云量。
选取的共11个影响因子表5.3。
表5.3PM2.5影响因子选取结果
影响因子类别
影响因子项目
备注
成分影响因子
前日平均SO2浓度
与PM2.5Pearson相关系数均值大于0.6
前日平均NO2浓度
前日平均CO浓度
前日平均PM2.5浓度
气象影响因子
前日平均风速
前日最显著风向
8种风向按1~8量化
前日平均气温
前日平均温度梯度
前日平均湿度
前日平均气压
前日总云量
(2)选择核函数及参数值。
常用的核函数有线性核函数、多项式核函数、径向基函数核函数和sigmoid核函数。
(3)用训练样本训练具有优化参数的支持向量机预测模型,获得支持向量,确定支持向量机的结构。
(4)用训练过的支持向量预测器对PM2.5的发生和演变进行模拟。
5.3.2.3PM2.5发生演变模拟预测模型的具体应用方式
采用武汉市10个监测点的SO2浓度、NO2浓度、CO浓度、PM2.5浓度监测数据(2012.12.27~2013.9.21),以及武汉市历史气象数据(2012.12.27~2013.9.21)作为数据来源,同时为保证数据完整性与连续性,对其中极个别因停电、设备检修等原因而造成数据缺失情况,使用相邻同监测项目监测数据进行线性插值得到。
本节中,以位于武汉市江岸区讲坛市政广场的7号监测点的监测数据作模型训练、验证。
其中,2013.1.1~2013.8.31的监测数据与气象数据作为模拟预测模型训练集,2013.9.1~2013.9.20的监测数据与气象数据作为模拟预测模型验证集。
对于该模拟预测模型,将10个测点的前日平均SO2浓度、前日平均NO2浓度、前日平均CO浓度、前日平均PM2.5浓度,以及前日平均风速、前日最显著风向、前日平均气温、前日平均温度梯度、前日平均湿度、前日平均气压、前日总云量共47个因子作为模拟预测模型的预选输入因子,输出为当日PM2.5浓度。
为了防止数据溢出,同时加快运算速度,对输入数据进行归一化处理,即变换为[0,1]区间的值。
PM2.5发生演变模拟预测模型采用径向基核函数:
xix2)。
模型中(C,σ)参数的选取利用多重交叉验证的方kxx(i,)exp(22
法和粗细网格法寻优。
其原理是:
将训练集分成k个子集(样本数量大致均匀),每个子集分别作为测试集,其余子集样本作为训练集,即建模k次,用k次的平均绝对误差MAE评估模型性能,进而确定模型的最优参数对(C,σ)。
粗细网格法是对网格上的(C,σ)点穷举搜索(先在大区间利用大步长锁定最优解所在区间,后在锁定的小区间上利用小步长精细搜索)。
5.3.2.4PM2.5发生演变模拟预测模型实验结果分析
通过训练集训练,取得模型较优参数C=1.557,σ=0.261。
模型预测结果见表5.4。
表5.4PM2.5发生演变模拟预测模型预测结果对比
日期
实测值(μg/m3)
模型预测值(μg/m3)
相对误差绝对值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 时空 分布 研究 13 研究生