水文模型参数敏感性快速定量评估的方法 精品Word下载.docx
- 文档编号:21188799
- 上传时间:2023-01-28
- 格式:DOCX
- 页数:33
- 大小:419.46KB
水文模型参数敏感性快速定量评估的方法 精品Word下载.docx
《水文模型参数敏感性快速定量评估的方法 精品Word下载.docx》由会员分享,可在线阅读,更多相关《水文模型参数敏感性快速定量评估的方法 精品Word下载.docx(33页珍藏版)》请在冰豆网上搜索。
3)确定不敏感参数,减少参数率定过程中的相关计算量及其不确定性。
通常敏感性分析包括局部敏感性分析和全局敏感性分析,局部敏感性分析只检验单个因子对模型的影响程度,由于
收稿日期:
2011-05-02;
修订日期:
2011-06-08
基金项目:
国家水体污染控制与治理重大专项(2009ZX07210-006);
国家重点基础研究发展计划(973计划)项目(2010CB428403);
中国矿业大学基本科研业务费大学生创新项目[Foundation:
NationalGrandScienceandTechnologySpecialProjectofWaterPollutionControlandImprovement,No.2009ZX07210-006;
NationalKeyBasicResearchProgramofChina(973Program),No.2010CB428403;
ChinaUniversityofMiningandTechnologyStudentInnovationProjectofFundamentalResearchFundsforCentralUniversities]
作者简介:
孔凡哲(1964-),男,江苏徐州人,博士,教授,主要从事流域水文模拟与流域产汇流过程研究。
E-mail:
kongfz3@
通讯作者:
占车生(1975-),男,湖北黄冈人,博士,主要从事遥感水文学和大尺度水文模型模拟研究。
zhancs2006@
1270-1280页
其简单快捷,可操作性强,也被广泛应用,但是由于未考虑因子之间相互影响等因素,致使结
果有一定的局限性;
而全局敏感性分析同时考虑多个因子对模型输出的影响,分析各因子之间的相互作用对模型输出的影响,为全面认识各因子的敏感性程度提供参考,比较适合多参数的水文模型研究。
目前,许多全局敏感性分析方法被广泛应用于水文模型参数的敏感性评价中[9],如多元回归法,LH-OAT方法[10],Morris-OAT方法[5]和傅里叶幅度灵敏度检验法(FourierAmplitudeSensitivityTest,FAST)[11]为主的定性方法和以基于方差分解理论的Sobol方法[7,12]和扩展傅里叶幅度灵敏度检验法(ExtendFAST)[9,13]为主的定量分析方法。
然而对于这些作为“黑箱子”模型的传统分析方法通过直接计算参数的方差计算参数的敏感度,并不能充分利用样本的所有信息。
尽管这些定量方法是可靠的和稳健的,但是由于其需要大量
的计算,数以千次的模型评价都导致其应用的困难[14],特别是对于多参数的复杂水文模型。
随着计算机模拟仿真技术的不断提高与发展,代理模型技术被逐渐应用于复杂模型的不确
定性分析[15-16]、敏感性分析[14-15,17-18]以及参数优化[16,19]等,使快速实现模型不确定性量化成为可能。
当前常用的代理模型技术包括响应曲面方法(ResponseSurfaceMethodology,RSM)[17]和状态相关参数法(Statedependentparameter,SDP)[14],其中响应曲面方法是基于统计理论的数学模型,如多项式回归模型、人工神经网络[17]和支持向量机[17]等。
虽说上述方法已经被成功应用于诸多工程设计问题中,如Sathyanarayanamurthy和Chinnam结合三种代理模型(Kriging模型、径向基神经网络模型和支持向量机模型)和基于方差的定量敏感性分析方法(Sobol方法和FAST方法)分析复杂的工程模型设计的敏感性问题[18],Ratto等[14]提出的SDP方法和Sobol方法结合也取得了较好的应用效果。
但上述方法目前还很少应用于水文模型中。
为此,本文尝试利用代理模型技术评价分布式水文模型的参数敏感性,快速实现多参数复杂模型的定量全局敏感性分析。
利用基于统计学习理论的支持向量机(supportvectormachine,SVM)构建非参数响应曲面作为分布式水文模型的代理模型,结合Sobol方法和SVM的响应曲面法形成一个新的全局敏感性定量评估方法—RSMSobol方法,并将其方法应用于淮河蚌埠闸以上流域的分布式时变增益水文模型中,结果Sobol方法的结果进行比较,从而可以验证方法的有效性。
1研究方法
1.1Sobol方法
Sobol方法最早是由Sobol于1993年提出的[20],该方法的核心将模型分解为单个参数及
参数之间相互组合的函数[7]。
假设模型Y=F(X)=F(x1,x2,…,x),x服从[0,1]均匀分布,则可
ki
分解为:
k
i=1
∑
i=1j>
i
k∑k
F(x,x)+...+F
(x,x,...,x)
(1)
ii
ijij
1,2,...,k12k
式中:
Fi(xi)表示包含xi的函数项,Fij(xi,xj)表示同时包含xi和xj的函数项,依此类推,则总的方
差可以分解成:
V=∑kV+
i=1i=1j>
V+...+V
(2)
i
ij
1,2,...,k
V为总方差,Vi为xi的单因子方差,Vij为xi和xj的双因子方差,V1,2,…,k为所有因子作用的
方差,对上式进行归一化,设:
Vi,...,i
Si,...,i
=
1n
(3)
V
则第i个参数的一阶、二阶和总敏感度Si,Sij和STi分别为:
Vi
Si=V
(4)
地理学报
66卷
1272
Vij
Sij=
(5)
(6)
=∑S(i)
ST
式中,S(i)为所有包含第i个参数的敏感度。
1.2响应曲面方法
本研究结合美国劳伦斯·
利弗莫尔国家实验室开发的PSUADE(ProblemSolving
environmentalforUncertaintyAnalysisandDesignExploration),利用其提供的多种响应曲面方法,将一个大型复杂动力系统模型的复杂输入输出关系概化成一个代理模型,即用此近似表达这种高度复杂高维非线性关系,从而提高模型的计算速度和降低模型的计算量和复杂度,同时在一定程度上保证模型计算精度[3]。
运用响应曲面模型的关键就是合理的样本数据(对应的输入输出数据和空间填充数据)和合理的拟合方法,对于拟合方法经过发展已经形成了包括参数型(如线性回归,Legendre多项式和非线性回归函数等)和非参数型(如多元自适应回归样条方法,人工神经网络,高斯过程,支持向量机等)两大类。
本文采用基于统计学习理论的支持向量机进行响应曲面构建,其方法在工业参数优化中得到部分应用,并取得较合理的效果[21-22]。
支持向量机(SupportVectorMachines,SVM)是一种基于结构风险最小化原则的函数拟合方法,对于回归估计,函数表达式可表示为:
Y=F(X)=aTX+b
(7)
式中,a是权重向量,b是转移向量。
定义以下优化问题:
min1|a|2
(8)
2
T
ì
Yi-aX-b≤ε
s.t.í
î
aTX+b-Y≤ε
当约束调价不满足时,则引入松弛变量Ξi,Ξi和惩罚参数C,对超出e-不敏感区的样本数
据进行惩罚,此时最优化问题变为:
*
l
min1|a|2+C∑(Ξ+Ξ*)
(9)
ii
Yi-aX-b≤ε+Ξi
ï
aTX+b-Y≤ε+Ξ*
Ξi,Ξ*≤0
基于Lagrangian函数条件,线性关系可以转为如下优化问题:
max-1(α-α*)(α-α*)XTX-ε(α+α*)+Y(α+α*)
2∑iij
jij∑i
i∑iii
(10)
i,j=1
∑l
(α*-α)=0
αi-α*∈[0,C]
式中αi,αi是Lagrange因子,非线性关系在给定的核函数K(Xi,Xj)变为:
max-1(α-α*)(α-α*)K(X,X)-ε(α+α*)+Y(α+α*)
(11)
Y=F(X)=∑(αi-α*)K(X,X)+b
对于非线性回归,函数表达式为:
(12)
iij
生成SVM响应曲面的步骤为:
1)选择核函数K(X,X’);
2)生成训练样本,模拟;
3)用训练
样本计算核矩阵;
4)解决以上的优化问题得到αi,αi;
5)计算权重向量a=∑(αi-αi)Xi;
6)利用Karush-Kuhn-Tucker(KKT)条件计算偏置向量b;
7)最终得到函数表达式(12)。
1.3RSMSobol方法
针对模型计算的复杂性,本文采取结合响应曲面的Sobol方法,完成主效应(一阶敏感度)、交互作用(二阶敏感度)和总敏感度计算,具体方法为:
(1)主效应分析主效应分析是基于McKay提出的方差分析方法[23-24],其本质是条件期望方差的统计分析。
根据数理统计方法有方差可分解为:
V(Y)=V(E(Y|Xk))+E(V(Y|Xk))
(13)
V(Y)和E(Y)为输出变量Y的方差和均值,Xk是第k个输入,右边第一项V(E(Y|Xk))是输
出变量条件期望的方差(条件是Xk),可以记作VCE(Xk),表示Xk影响的情况下Y的变化,第二项E(V(Y|Xk))是误差项或剩余项,表示不考虑Xk影响的Y的变异程度。
本研究中采用重复式的拉丁超立方设计样本进行计算。
在样本中,当Xk取xkj(j=1,
2,…,s,其中s是水平数)时,条件期望为:
r
1
Yˉ
j=r∑ij
Y
(14)
sr
sr∑∑
(Y-Yˉ)2
V(Y)=
(15)
方差为:
j=1i=1
r为重复式抽样次数,Yij表示第i次抽样,第j个水平下的输出变量值,Yˉ为所有样本输
出的均值,Yˉ为第j个水平条件下r次重复式抽样输出变量的均值。
j
则在Xk=xkj条件下的条件方差V(Y|Xk)及其期望E(V(Y|Xk))分别为:
V(Y|Xk=xkj)=1(Y-Yˉ)2
r∑
(16)
ijj
(Y-Yˉ)2
E[V(Y|Xk=xkj)]=
(17)
另根据文献[23]中:
s
E(∑(Yˉ-Yˉ)2)≈sV(Yˉ)
j=1
=s{V[E(Yˉ|X
)]}
=x)]+E[V(Yˉ|X=x
(18)
jkkj
=s{V[E(Y|Xk=xkj)]+1E[V(Y|Xk=xkj)]}
VCE(Xk)=1(Yˉ-Yˉ)2-
s∑j
sr2∑∑
(19)
可推导出:
对于分析结果的相关比η2可以定义为:
η2=VCE(Xk)/V(Y)
(20)
(2)交互作用分析针对不相关输入因素的双因素交互作用分析是在主效应分析的基
础上扩展开来[20],假定满足如下公式:
V(Y)=V(E(Y|Xi,Xk))+E(V(Y|Xi,Xk))
(21)
Xi和Xk分别是两个输入因素,右边第一项V(E(Y|Xi,Xk))是双因素相互作用的条件
期望方差,也可以记作VCE(Xi,Xk),第二项E(V(Y|Xi,Xk))为残差项。
则双因素相关比η2(X,X)可由公式计算:
η2(Xi,Xk)=VCE(Xi,Xk)/V(Y)
(22)
ik
高的相关比表示Xi和Xk两个输入因素对输出变异的共同作用很明显,贡献很显著。
那
么基于交互项的方差V(Xi,Xk)可定义为:
V(Xi,Xk)=V(E(Y|Xi,Xk))-V(E(Y|Xi))-V(E(Y|Xk))
(23)
本研究利用重复的正交设计样本计算V(Xi,Xk),其中Xi和Xk分别取值为Xij和Xkl,(j=1,
1274
2,…,S,l=1,2,…,S,S为水平数)。
基于此样本的均值和方差为:
SSR
Yˉ=
S2R∑∑∑iijkkl
Y(r)(X=X,X=X)
(24)
j=1l=1r=1
SR∑∑∑
[Y(r)(X=X,X=X)-Yˉ]2
(25)
iijkkl
Y(r)表示第r组重复样本,则条件期望为:
R
Yˉ(Xi=Xij,Xk=Xkl)=
和条件期望方差为:
R∑
(r)
Y(X=X,X=X
)
(26)
r=1
SS
S2∑∑lj
S2R2∑∑∑(lj,r)lj
(Yˉ-Yˉ)2-
-Yˉ)2
VCE(Xi,Xk)=
(Y
(27)
j=1l=1
j=1l=1i=1
最后可得到V(Xi,Xk)的计算公式为:
V(Xi,Xk)=VCE(Xi,Xk)-VCE(Xi)-VCE(Xk)
(28)
VCE(Xi)和VCE(Xk)分别表示Xi和Xk的条件期望方差,可通过主效应分析计算
得到。
(3)总敏感度分析如果输入是相关的,则以上所说的方差分解方法就不在有效,本研究采用另外一种方法,总敏感度计算法,定义为:
STi=Vi+∑Vij+
∑Vijk+⋯+V12...M
(29)
i≠j
i≠j,i≠k
M是输入因素个数,Vij是输入因素i和j同时作用条件下的方差,依此类推。
STi=E(V(Y|X~i))/V(Y)
(30)
则总敏感度可定义为:
下标~i表示除了第i个因素的其他所有因素。
2实例研究
本文将该方法应用到淮河流域的分布式时变增益水文模型中,重点讨论模型参数的敏
感性。
分布式时变增益水文模型DTVGM是建立在GIS/DEM基础上,通过GIS/RS提取陆地表面单元坡度、流向、水流路径、河流网络、流域边界和土地覆被等信息,将单元TVGM扩展到由DEM划分的流域单元网格上进行非线性产流计算,并利用DEM提取出的汇流网络进行网格汇流演算,从而得到流域出口断面的流量过程。
模型基本原理可参见文献[25-28]。
淮河流域地处长江流域和黄河流域之间,位于东经112°
~121°
、北纬31°
~36°
,流域面积
27万km2。
淮河流域由淮河和沂沭泗两大水系组成,废黄河以南为淮河水系,以北为沂沭泗水系。
淮河水系集水面积19万km2(图1),约占流域总面积的70%。
流域年平均降雨量约
900mm,其中70%~80%的降水集中在夏季,因而径流分布也极不均匀。
淮河的年平均流量为853m3/s,汛期洪峰流量可达11000m3/s以上,而枯季流量几乎为零。
本文选择淮河蚌埠闸以上流域1965-2008年的日降雨量、蒸发量、水文站流量等资料构建淮河流域日尺度分布式时变增益模型,其中分为两个不同时期(1965-2000和2001-2008)进行模型的适应性以及RSMSobol方法的稳健性验证。
土地利用数据采用1995-1996年的全国土地利用数据库中的淮河流域土地利用数据(1:
100万),数据来源为中国科学院资源环境科学数据中心。
DEM数据来自美国地质调查局(USGS)的最新SRTMDEM数据,分辨率为3'
×
3'
。
基于淮河流域实测的二级河网对DEM进行了校正,采用校正后的DEM提取流域信息(坡度、流向、河网、子流域等)。
采用100km的阈值,将蚌埠闸以上淮河流域划分为441个子流域,水文气象数据通过地学统计插值模型拓展到441个子流域上。
图1淮河流域位置图
Fig.1LocationoftheHuaiheRiverBasininChina
由于模型参数较多,实现全部参数的定量化敏感
性分析较难,加之有些参数本身对模型影响较小,因此为了有效降低模型参数的不确定性和计算时耗,在前期对模型研究的基础上,本文选择8个较重要的参数进行全局敏感性分析。
由于研究区各子流域本身空间变异性差异不大,可对不同的子流域部分模型参数采用相同的取值,构建成文件数据库供模型调用,特别对于本文重点讨论的模型参数,为了在计算过程中减少不必要的损耗和模型运行时间以及连续高效地运行模型,本研究中采用统一值。
对于参数的取值范围,在综合考虑模型运行过程中的实际影响和流域具体情况
表1分布式时变增益水文模型参数
取值范围
Tab.1Parametersandrangesofdistributedtimevariantgainmodel
参数
物理意义
参数范围
g1g2
Kr
KawRoughRssWmi
WM
ThickU
时变增益因子
时变增益因子壤中流出流系数蒸发权重系数曼宁公式糙率系数最小土壤湿度上层饱和土壤湿度上层土壤厚度
[0.01,1.0][0.01,5.0][0.01,1.0][0.01,1.0][0.001,0.1][0.01,0.40][0.40,1.0]
[400,800]
外,基于最不利原则采用相对较大的参数范围,为此本文确定的8个参数的取值范围见表1,
且假定所有参数均服从均匀分布。
本文采用正交拉丁超立方OALH采样方法[29-30],样本个数为1024组,并采用3个不同目标函数值,即水量平衡系数WB,Nash-Sutcliffe效率系数NS和相关系数RC,具体目标函数为:
n
WB=∑Qs,i
∑Qo,i
(31)
NS=1-∑(Qo,i-Qs,i)2
∑(Qo,i-Qˉo)2
(32)
RC=∑(Qo,i-Qˉo)(Qs,i-Qˉs)
∑(Qo,i-Qˉo)2∑(Qs,i-Qˉs)2
(33)
Qs和Qo分别是模拟流量和观测流量,Qˉ是相应流量的均值,n为时间序列长度。
本文选择Gauss径向基函数K(Xi,Xj)=exp(-γ||Xi-Xj|
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 水文模型参数敏感性快速定量评估的方法 精品 水文 模型 参数 敏感性 快速 定量 评估 方法
![提示](https://static.bdocx.com/images/bang_tan.gif)