学术报告.docx
- 文档编号:1033543
- 上传时间:2022-10-15
- 格式:DOCX
- 页数:11
- 大小:35.67KB
学术报告.docx
《学术报告.docx》由会员分享,可在线阅读,更多相关《学术报告.docx(11页珍藏版)》请在冰豆网上搜索。
中南大学研究生学术报告
姓名
***
学号
***
学院
数学与统计学院
专业
概率论与数理统计
学位
理学硕士
专题讲座或学术报告题目
Amean-varianceoptimalityproblemforDiscountedMarkovDecisionProcesses
报告人
郭先平教授
时间
2013/5/17
地点
世纪楼13楼报告厅
在郭先平教授的报告中,我主要学习了马尔可夫决策过程的概念及其策略指标。
1、马尔可夫决策过程:
是指决策者周期地或连续地观察具有马尔可夫性的随机动态系统,序贯地作出决策。
即根据每个时刻观察到的状态,从可用的行动集合中选用一个行动作出决策,系统下一步(未来)的状态是随机的,并且其状态转移概率具有马尔可夫性。
决策者根据新观察到的状态,再作新的决策,依此反复地进行。
马尔可夫性是指一个随机过程未来发展的概率规律与观察之前的历史无关的性质。
马尔可夫性又可简单叙述为状态转移概率的无后效性。
状态转移概率具有马尔可夫性的随机过程即为马尔可夫过程。
马尔可夫决策过程又可看作随机对策的特殊情形,在这种随机对策中对策的一方是无意志的。
马尔可夫决策过程还可作为马尔可夫型随机最优控制,其决策变量就是控制变量。
2、马尔可夫策略指标:
策略是提供给决策者在各个时刻选取行动的规则,记作,其中πn是时刻n选取行动的规则。
从理论上来说,为了在大范围寻求最优策略πn,最好根据时刻n以前的历史,甚至是随机地选择最优策略。
但为了便于应用,常采用既不依赖于历史、又不依赖于时间的策略,甚至可以采用确定性平稳策略。
衡量策略优劣的常用指标有折扣指标和平均指标。
采用折扣指标的马尔可夫决策过程称为折扣模型。
已经证明,若一个策略是β折扣最优的,则初始时刻的决策规则所构成的平稳策略对同一β也是折扣最优的,而且它还可以分解为若干个确定性平稳策略,它们对同一β都是最优的。
中南大学研究生学术报告
姓名
***
学号
***
学院
数学与统计学院
专业
概率论与数理统计
学位
理学硕士
专题讲座或学术报告题目
Markovdecisionprocessesbanditprocessesandtheirapplicationsinfinance
报告人
王熙逵教授
时间
2013/6/24
地点
世纪楼13楼报告厅
在本次报告中,王熙逵首先介绍了金融数学发展的三个重要阶段和主要研究的问题与方法;随后,他重点讲解了马氏决策规划和部分可观察型马氏决策规划在金融数学中的应用,包括最优投资和消费问题以及产品动态定价问题;最后,他介绍了目前正在研究的问题:
部分可观察型马氏决策规划的风险敏感控制、用部分可观察型马氏决策规划研究动态风险测度和最优控制破产概率。
王熙逵深入浅出的讲解,用逻辑的思维带来前沿的信息,让在场的学生和老师受益匪浅。
我主要了解了bandit过程以及马尔可夫决策过程在金融领域的应用。
Rothschild和Schimalesee分别在1974年和1975年将bandit过程应用在产品价格的最优化方面。
解决的问题是在用户需求函数未知的情况下如何决定一个产品的最优价格。
如果产品收费低于市场价格,那么我们就会损失客户和营收,相反就会得到更多的客户和更多的营收。
另外bandit过程的思想和模型也被广泛应用在最优排队网络和机器学习中,在股市研究领域也非常热门。
通过此次学术交流我体会到了概率论知识在现实生活中的作用,也体会到了数学的应用价值,数学是一门工具,我们应该好好利用这个工具为整个社会服务。
报告结束后,王熙逵与数学与统计学院的老师们进行了学术交流,对数学与统计学院“统计实务”专业的课程设置提出了建议。
中南大学研究生学术报告
姓名
***
学号
***
学院
数学与统计学院
专业
概率论与数理统计
学位
理学硕士
导师签名
专题讲座或学术报告题目
FiniteelementanalysisforstochasticCahn-Hilliard-Cookequation
报告人
邹永魁教授
时间
2013/10/22
地点
世纪楼13楼报告厅
在邹教授的报告中,我主要学习了随机Cahn-Hilliard-Cook方程及其有限元分析方法。
Cahn-Hilliard方程是一类重要的四阶非线性扩散方程,最初是有Cahn和Hilliard在1958年研究热力学中两种物质(比如合金、玻璃、聚合物等)之间相互扩散现象时提出来的,后来也应用在生物种群的竞争与排斥现象、河床迁移工程、固体表面上微滴的扩散等方面。
关于Cahn-Hilliard方程的数值解法也有过一些研究工作,例如张瑞凤研究过Cahn-Hilliard方程的显格式差分法,黄传辉研究了Cahn-Hilliard方程的谱方法。
邹教授主要是利用有限元方法对Cahn-Hilliard方程进行求解。
有限元方法的主要步骤为:
1、定义问题及求解区域;
2、将求解区域进行离散化;
3、确定状态变量以及控制方法;
4、单元推导;
5、总装求解
6、联立方程组求解;
简言之,有限元方法可分成三个阶段:
前处理、处理和后处理。
前处理是建立有限元模型,完成单元格划分;处理是提供有限元方程的有效解法,上机求解;后处理则是采集处理分析结果,使用户能简便提取信息,了解计算结果。
在邹教授的文章中,变量离散化方法用的是Argris有限元方法,最后的实验结果用数值试验来说明。
中南大学研究生学术报告
姓名
***
学号
***
学院
数学与统计学院
专业
概率论与数理统计
学位
理学硕士
导师签名
专题讲座或学术报告题目
Network-basedSystemsBiology
报告人
陈洛南教授
时间
2014/2/28
地点
数学院一楼报告厅
在陈洛南教授的“基于网络的系统生物学”报告中,我了解了系统生物学的基本概念以及网络方法在系统生物学中的应用。
系统生物学是一个试图整合不同层次信息以理解生物系统如何行使功能的学术领域。
通过研究某生物系统各不同部分之间的相互关系和相互作用,系统生物学期望最终能够建立整个系统的可理解模型。
系统生物学大量使用数学的和计算技术的模型。
近年来随着数学工具以及计算机技术的迅速发展,人们开始了对系统生物学网络整体性和动态性的研究。
陈洛南教授通过一些例子,强调以网络、相互作用、动态行为等整体论观点,并结合数据与方法论的整合性观点探索如何对复杂生命现象进行不同层面的理解和诠释。
例如与单细胞系统有关的主要研究结果有以下内容:
1、基于单调动力系统的基因开关和基因振动子设计方法和理论;
2、通过探索网络结构中的正反馈和负反馈环来设计通用的人工合成基因调控网络;
3、基因调控网络建模,以及基于非线性动力学理论和控制理论对其动态行为分析;
4、考虑生物体内细胞周期影响的生物分子网络建模的统一通用框架和理论。
总体来说,基于网络的机器学习算法在系统生物学中的应用越来越广泛,这类应用主要是以实际分类问题和系统生物学中的一些应用为驱动背景,对基于网络的学习算法进行深入研究。
中南大学研究生学术报告
姓名
***
学号
***
学院
数学与统计学院
专业
概率论与数理统计
学位
理学硕士
专题讲座或学术报告题目
ClassicalTheoryofRunge-KuttaMethodsforNon-stiffGeneralVolterraFunctionalDifferentialEquations(VFDEs)
报告人
李寿佛教授
时间
2013/3/13
地点
世纪楼十三楼会议室
在李寿佛教授的报告中,我主要学习到了非刚性Volterra泛函微分方程,以及解决此类方程问题的经典龙格库塔方法。
首先介绍Banach空间中非刚性Volterra泛函微分方程:
设X是实或复Banach空间,符号∥∙∥表示其中范数,对任意给定的闭区间I⊂R,以符号CX(I)表示由一切连续映射x:
I→X所构成的Banach空间,其中范数定义为∥x∥∞=maxt∈I∥x(t)∥。
考虑初值问题:
y't=ft,yt,ya≤t≤byt=φta-τ≤t≤a
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 学术报告
![提示](https://static.bdocx.com/images/bang_tan.gif)