自然进化与气候影响模型.docx
- 文档编号:8236832
- 上传时间:2023-01-30
- 格式:DOCX
- 页数:12
- 大小:234.63KB
自然进化与气候影响模型.docx
《自然进化与气候影响模型.docx》由会员分享,可在线阅读,更多相关《自然进化与气候影响模型.docx(12页珍藏版)》请在冰豆网上搜索。
自然进化与气候影响模型
承诺书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):
B
我们的参赛报名号为(如果赛区设置报名号的话):
所属学校(请填写完整的全名):
西安电子科技大学
参赛队员(打印并签名):
1.李栋
2.王晓辉
3.叶鑫林
指导教师或指导教师组负责人(打印并签名):
冯海林周杰
日期:
2010年月日
赛区评阅编号(由赛区组委会评阅前进行编号):
2009高教社杯全国大学生数学建模竞赛
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用):
评
阅
人
评
分
备
注
全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前进行编号):
目录
自然进化与气候影响模型2
一问题重述3
二问题分析4
三模型假设与符号说明5
3.1模型假设5
四模型建立6
4.1问题一模型6
4.2问题二模型6
五模型求解7
5.1一个初始值情况7
5.2不同初始值情况8
5.3模型解释11
六模型误差和模型改进12
七参考文献13
自然进化与气候影响模型
摘要
模型采用矩阵计算和孟德尔遗传定律结合的方法,通过计算机迭代,计算出基因频率的稳定比例以及基因型和表现型的比例。
分析温度升高0.5℃的问题二可知,其实质和问题一一样,只需计算过程中改变存活率这个参数。
针对转移概率矩阵的元素可变、状态转移存在非线性函数关系这一情况,模型中放弃马尔科夫链这一经典模型。
而是采用了迭代的计算机数值求解。
迭代的过程是这样的:
step1:
由第k代的基因频率U(k)算出下一代初始基因型结构P0(k+1);
step2:
将P0(k+1)和存活率L相乘,得出第k+1代的基因型结构P(k+1);
step3:
通过矩阵乘法,算出第k+1代的基因频率U(k+1);
step4:
重复step1-step3,直到第300次迭代。
具体的,step1中的算法用到了孟德尔遗传定律,可以通过多项式乘法简单算出。
其它两步的算法中,各个需要的矩阵可以根据线性关系求出。
之所以要300次循环,是考虑到稳定需要的时间和计算机运算时间两方面。
实际计算中,效果很好。
得到稳定的基因型结构后,按照表现型将基因型分类,求出表现型的比例。
另外,模型中设立了多组初始值。
设立了均匀变化的10组,通过多次试验,验证稳定性和稳定点的唯一性。
问题二中,只是改变了step2中的存活率L,算法和问题一一样。
计算出两问都有唯一的稳定点,但是两问中的稳定点数值上不相等。
说明环境的改变影响了这个昆虫种群的进化。
关键词遗传定律矩阵运算迭代
一问题重述
昆虫学家在对某种昆虫的研究发现,昆虫身体颜色特征由常染色体基因决定;决定该颜色的基因有三种:
记为A,B和C,A和B均为显性基因,C为隐性基因。
具有AA和AC基因的昆虫表现为白色,BB和BC基因的表现为灰色,CC表现为透明,而AB表现为黑白相间。
6A)[4}9t+M,X ]:
v1m H在正常的年份时(年平均气温正常),具有不同基因的子代个体成活率有一些差异,比如AA基因的子代个体有63%的个体能成年并繁殖后代,对于BB基因这一数据为65.3%,CC为68.6%,AC为73.5%,BC为71.6%,AB为74.2%。
n*H2N-G4j6^"C*P5H
(1)建立适当的数学模型,研究在正常的天气情况下,各种颜色的昆虫所占的比例能否到达稳定的比例状态,给出该理论结果。
(2)5?
%T6?
5p5t'l9h*i由于全球气温的升高,研究者发现各种颜色的昆虫比例发生了一些变化,白色昆虫数量增加而灰色昆虫在减少。
通过仔细的研究发现,含有A基因的个体易于在高温环境下存活,含有B基因的个体适合在较低的温度下存活。
平均气温增加0.5度时含有一个A基因的个体存活率增加0.8%,含有一个B基因的个体存活率减少0.6%,含有的C基因没有观察到明显的变化。
分析如果该地区在年平均气温增加0.5度时导致各种颜色昆虫比例发生的变化。
二问题分析
对于第一问,首先想到马尔科夫链模型。
每一代都只可能有六种基因型,代与代之间各基因型的比例不同。
每一代的基因型比例在遗传学中称作基因型结构,它可以算作马尔科夫链的一个状态。
接下来,在分析概率转移矩阵时,发现矩阵中的各个元素不是固定的,而是种群基因型结构的函数。
且当考虑不同基因型之间的杂交情况时,这个函数又不是线性关系。
每一代的基因型结构在稳定之前是变化的,转移矩阵中的元素也跟着变化,所以没有固定的概率转移矩阵,也无法用一个转换矩阵直接代替状态转移的函数关系。
由此,我们换用多步求解的方法。
先用矩阵知识,根据第k代基因型结构求出该代的基因频率。
再利用平方关系式(孟德尔遗传定律),算出不考虑成活率的基因型结构。
再将它乘以成活率,得出k+1代的基因型结构。
以后迭代求解,直到种群的基因型结构稳定。
这只是得到了一个初始值点的结果,还要多次改变初始值,观察是否稳定在同一个状态。
并依此给出第一问的解答。
第二问的方法和第一问相同,只是在迭代的过程中改变成活率这一个参数。
同样采用多个初始值试验,最后给出解答。
三模型假设与符号说明
3.1模型假设
1假设每个个体只能存活一代;
2假设随机交配很均匀,不存在特殊情况;
3假设性别均匀;
3.2符号说明
U(k):
第k代基因频率列向量,元素为x、y和z;
x:
A基因的基因频率;
y:
B基因的基因频率;
z:
C基因的基因频率;
P0(k):
不考虑存活率时,第k代的基因型结构;
P(k):
第k代的基因型结构,p1…p6为列向量P的元素;
p1(k):
AA基因型的数量占第k代总数的比例;
p2(k):
BB基因型的数量占第k代总数的比例;
p3(k):
CC基因型的数量占第k代总数的比例;
p4(k):
AB基因型的数量占第k代总数的比例;
p5(k):
AC基因型的数量占第k代总数的比例;
p6(k):
BC基因型的数量占第k代总数的比例;
q1(k):
白色表现型占该代总体的比例;
q2(k):
灰色表现型占该代总体的比例;
q3(k):
透明表现型占该代总体的比例;
q4(k):
黑白相间表现型占该代总体的比例;
L:
存活率对角阵;
四模型建立
4.1问题一模型
假设第k代总体中,已知各种基因型的比例,即种群的基因型结构P(k)已知。
那么可以由
(1)式求出该代A、B、C三种等位基因的基因频率。
(1)
三种等位基因组合成六种基因型的数学表示为
(2)
所以知道第k代基因频率向量U(k)之后,代入
(2)式便求出第k+1代各种基因型的出生比例P0(k),再乘以相应的存活率L即得到P(k+1)。
(3)
这样循环迭代一定次数后,通过画出的图像,观察P(n)是否有明显变化趋势。
如果趋于在某个值,说明是稳定的;如果没有渐近线,说明是不稳定的。
第一代的基因型结构P
(1)自己设立,它就是迭代的初始值。
为排除一次试验的偶然性,可以设立多组不同的初始值,分析结果来说明稳定性的必然性。
求出稳定的P之后,在和矩阵R相乘即可求出各种表现型的比例Q.
(3)
因为P稳定,所以Q也就稳定。
问题的关键就是分析U的稳定性。
知道U之后,其它两个量通过矩阵乘法可以很容易求出。
4.2问题二模型
只需修改存活矩阵L,便可按问题一求解。
五模型求解
问题一求解
5.1一个初始值情况
假设初始时三种基因的基因频率相同,都为1/3。
代入
(2)直接求解P
(2),并迭代出结果。
迭代的过程如下:
图5.1.1三种基因的基因频率变化
由图可知,等位基因变化最后都趋于直线。
而且C的频率最大,A次之,B最小。
由于基因频率固定,根据孟德尔遗传定律,可以算出推出基因型比例和表现性比例都是稳定的。
图5.1.2六种基因型比例变化图5.1.3四种表现型比例变化
当U
(1)=[1/31/31/3]T时,可以得到表现型比例为:
白色(0.3401)、灰色(0.3005)、透明(0.2174)和相间(0.1421),即Q=[0.34010.30050.21740.1421].下面讨论不同初始值下的稳定分布。
5.2不同初始值情况
设立10组不同的初始值,第一组和第一问中相同,作为参照,其它组均不同。
数据如下表所示:
1
2
3
4
5
6
7
8
9
10
A
1/3
2/3
1/6
1/6
1/6
1/3
1/6
1/3
1/2
1/2
B
1/3
1/6
2/3
1/6
1/3
1/6
1/2
1/2
1/6
1/3
C
1/3
1/6
1/6
2/3
1/2
1/2
1/3
1/6
1/3
1/6
迭代过程用图像表示如下:
图5.2.1A基因变化图图5.2.2B基因变化图
图5.2.3C基因变化图
如图所示,虽然初始基因频率向量U
(1)不同(图中纵轴截距表示),但是同一个基因在繁衍300代后,都收敛到某一个稳定值。
为了更准确地分析,我们将10组不同初始值对应的第300代基因频率提取出来。
用表格表示如下:
1
2
3
4
5
6
7
8
9
10
A
0.2804
0.2804
0.2804
0.2803
0.2804
0.2803
0.2804
0.2804
0.2804
0.2804
B
0.2534
0.2535
0.2537
0.2530
0.2533
0.2531
0.2534
0.2537
0.2533
0.2536
C
0.4662
0.4661
0.4659
0.4666
0.4664
0.4665
0.4662
0.4659
0.4664
0.4660
通过图可知n等于300时,各组基因频率已趋于稳定。
计算10组稳定点的均值和方差可知:
U(300)的平均值是(0.28040.25340.4662),相对误差是(0.0116%0.0914%0.0566%)。
在误差允许范围内,可以当作是同一种稳定。
再根据
(2)式,求出六种基因型的比例,结果为PT=(0.07000.05930.21080.14910.27170.2392)。
再将PT代入(3)便得到Q.结果是QT=(0.34170.29850.21080.149).
因此我们可以以此回答,在正常天气条件下,第一问的理论解为Q,即白色(0.3417)、灰色(0.2985)、透明(0.2108)和相间(0.1491)。
图像表示如下:
图5.2.4不同初始值的稳定比较
问题二求解
这里只需将存活对角矩阵L变化一下,变化的结果为:
(4)
设立的10组初始值同问题一,得到的等位基因频率变化图和稳定数据如下:
图5.3.1A基因变化
图5.3.2基因变化
图5.3.3C基因变化
10组初始值的稳定点:
1
2
3
4
5
6
7
8
9
10
A
0.3443
0.3443
0.3443
0.3443
0.3443
0.3443
0.3443
0.3443
0.3443
0.3443
B
0.1736
0.1738
0.1743
0.1726
0.1733
0.1729
0.1737
0.1743
0.1732
0.1741
C
0.4821
0.4819
0.4814
0.4831
0.4824
0.4828
0.4819
0.4814
0.4825
0.4815
同上分析等位基因的稳定值是UT(0.34430.17360.4821),相对误差为(0.0034%0.3352%0.1231%)。
在误差允许范围内,为同一种稳定。
下面分析两种稳定点的变化:
温度上升0.5摄氏度后,种群的稳定基因频率(0.34430.17360.4821)和问题一的(0.28040.25340.4662)相比,A基因频率上升,B基因频率降低,C变化相对较小,但也在增加。
得到的结果很符合问题中的适应力的变化。
代入(3)式,算出稳定的表现型分布QT(0.45540.19460.22460.1253)。
同问题一得到的稳定时表现型分布(0.34170.29850.21080.149)相比,白色型和透明型增加,而灰色和相间减少。
用图对比如下:
图5.3.4问题一二的对比
5.3模型解释
问题中代入不同的初始值,稳定时得到的基因频率一样。
说明种群稳定时的基因频率和初始值没有关系。
这也是表现型有稳定值的必然要求。
对于一个种群,这意味着无论目前种群的各种表现型的数量如何,经过一定的繁衍代数之后,总可以达到同一个稳定点。
种群有一定的抗数量变化能力。
在对比问题一和二的稳定基因可知,稳定点发生了变化。
这个变化是适合高温的A基因增大,而不适合的B基因减小,C基因也稍稍增大。
说明环境对种群的影响是根本性的。
它会影响种群最终的表现型分布。
六模型误差和模型改进
模型中的误差存在于理论值的确定。
模型中迭代了300次,并用迭代出的结果近似了理论值。
因为不能用极限的方法求解,这种误差是不可避免的。
只可能通过增加迭代的次数,使误差减小。
另外,10组不同的初始值到达的10个稳定点还是有不同的。
这种误差也可以通过增加迭代的次数减小。
但是,还有一种误差是增加迭代次数不能减小的,它就是初始值的设置。
模型中用了10组,具有一定的代表性,但是这也只是离散的几个点。
实际中的初始值个数可以有无限个,是一个连续的面。
模型的初始值设置和迭代次数会带来误差。
模型的改进就是,增加初始值的组数和迭代的次数。
七参考文献
[1]周义仓,赫孝良.数学建模实验[M],西安:
西安交通大学出版社,2005.12第九版
[2]刘承平.数学建模方法[M],北京:
高等教育出版社,2002.7第一版
[3]王阅、高学东、武森、陈敏。
时间序列周期模式挖掘的周期检测方法,1000-3428(2009)22-0032-03。
[4]XX文库--时间序列,
[5] 郭志刚,社会统计分析方法——SPSS软件应用, 中国人民大学出版社,1999。
[6]魏鑫,张平, 周期图法功率谱估计中的窗函数分析《现代电子技术》2005年03期
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 自然 进化 气候 影响 模型