生物数学第四章.docx
- 文档编号:5840996
- 上传时间:2023-01-01
- 格式:DOCX
- 页数:60
- 大小:643.85KB
生物数学第四章.docx
《生物数学第四章.docx》由会员分享,可在线阅读,更多相关《生物数学第四章.docx(60页珍藏版)》请在冰豆网上搜索。
生物数学第四章
第四章生物演化的数学模型
这一章将讨论生物的演化。
对生物演化理论、方法及其应用的研究构成一门新的分支领域,称为分支分类学(Cladistics),或者称为分支系统学。
分支分类学是一门与生物系统学和生物分类学联系十分密切的分支学科,从理论与方法的角度考虑,是数量分类学的一个分支领域。
生物学家对生物演化的认识产生了表征与分支两个不同的理论和观点,相应于这两种不同的理论与观点形成数量分类学两种不同的数学理论与方法。
即定量的表征分类与定量的分支分类。
因此分支分类学作为数量分类学的分支领域,它以定量的观点和数学方法研究生物的演化。
采取何种数学模型来描述生物的演化过程呢?
本书完全采纳了目前分支系统学中理论上最完整的演化集合理论体系。
该体系吸取了部分抽象代数中有关格的理论(latticetheory)和图论中有关赋权有向图的理论,使得它的数学理论十分严谨;该体系又充分考虑到生物演化的特点,提出了适应于生物演化的四条基本数学性质和真实演化过程必须具备的四条公理。
满足这四条性质的演化集合,和四条公理的补充,构成了整个分支演化理论的基础。
下面开始演化集合理论的论述。
限于篇幅,本章的定理证明全部省略。
第一节演化集合及其基本定理
在分支分类中代表生物演化的实体或单位称为分支分类单位(cladistictaxonomicunit)简作分支单位(CTU)。
这个名词与其他分支分类文献中的演化单位(evolutionaryunit,简作EU)意义完全相同。
分支单位是为科学家研究生物演化而设的概念,根据研究对象不同,分支单位可以代表个体、居群、种、属、科……等等,也可以是分支分类学中的分类单位(OTU)或假设分类单位(HTU)。
分支单位是研究生物演化的最基本单位。
为了表述方便,有时也把分支单位称为分支点(cladisticpoint),或者称为点。
所有分支点集合记作X={x1,x2,…,xi,…}。
集合X中所包含分支点的个数理论上是可以无限的,但在实际问题中都是有限的。
本书的论述都限定在有限情形。
两个分支单位x与y如果完全相同,用x=y表示;如果不相同,以x≠y表示。
如果具有演化关系,比如分支单位x是y的祖先,我们用x≤y(或者y≥x)表示。
x是y的祖先,也称y是x的后裔。
演化关系也可以用符号“→”来表示,x≤y可写成x→y。
这个符号在图论方法的表述中常常使用。
定义4.1分支单位集合X,在X的部分分支单位间建立的演化关系如果满足以下四条性质,则称该分支单位集合X为演化集合。
性质1任何分支单位x是其自身的祖先,即x≤x(自反性);
性质2三个分支单位x,y与z,若x≤y,且y≤z,则x≤z(传递性);
性质3如果分支单位满足x0≤x1≤x2=x0,则x0=x1(反对称性);
性质4任意两个分支单位x与y,若存在分支单位z∈X使x≤z,y≤z,则x与y可比较(comparable),即要么x≤y或者y≤x(可比较性)。
图4-1演化的逆转形成循环演化
性质1和性质2是演化概念本身所要求的特征,无需论证它的必要性。
从性质1说明关系x≤y有x=y或x≠y两种可能性,如果x≠y,我们也可把如此关系表示成x<y。
性质3的结果如果不成立,即x0≠x1,将得到如图4-1。
所示循环逆转的演化关系。
自然界循环逆转式的演化关系不可能存在,因而性质3必须成立。
性质3的表示方式是为了推广成更一般的形式:
性质3(附)演化集合中多个分支点若满足
x0≤x1≤x2≤…≤xn=x0,则x0=x1=x2=…=xn
利用演化关系的传递性不难证明性质3与性质3(附)的等价性。
生物演化的分支性,这个基本特征反映在性质4中,它说明生物演化过程中不可能出现融合,而产生网状进化。
因为性质4如果不成立,将会出现两个不可比较的分支点x与y,z是它们共同的后裔。
演化集合X的任一子集Y,如果在集Y上仍然保留X中的演化关系,显然在Y集上所有演化关系的4条性质亦保持正确,故Y亦是一个演化集合。
称Y为X的演化子集(evolutionarysubset),记作
或Y
X。
把树图的顶点视作分支单位,有向树可以看作在共祖条件下的演化集合;反过来,演化集合虽是一个有向图,但并不一定能看作有向树。
后面将进一步讨论二者的关系,并指出演化集合与有向树图可以建立同构关系。
本书对分支分类的论述常常交互使用这两个概念。
因此演化集合有时也被称为演化图(evolutionarygraph),演化集合中的分支单位有时被称为分支点(cladisticpoint),甚至更简称为点。
图中的弧有时也被称作分支线(cladisticline)或分支边(cladisticedge)。
下面举出几个演化集合的例子。
例1n+1个非负整数N(n)={0,1,2,…,n},在通常不等式的意义下,把普通不等式符号“≤”看作演化关系,集合N(n)构成演化集合。
例2图4-2所示有向树图,所有顶点集合{a,b,c,d,e,f,g,h}
在图示的方向上,如果从一个顶点
可以到达另一个顶点y或x=y,规定演化关系x≤y,则该顶点集合构成演化集合。
例3提供演算例子的桔梗科6个种(6个OTU的描述见第三章),分支分类运算得出它们之间的演化关系,如图4-3所示,按照例2对演化关系的理解,图的所有顶点集合{h0,h1,h2,OTU1,OTU2,…,OTU6}构成演化集合。
图4-2有向树图构成的演化集合
图4-3桔梗科6个种的演化关系图
前面几个例子属于演化集合,容易验证演化关系的4条性质得到满足。
对于例2和例3,还可以推广到一般情形,见下面的例子。
例4有向树图T,把图T的所有顶点视作分支点,如果两顶点x和y,从x可到达y,则规定演化关系x≤y,于是图T的所有分支点构成演化集。
熟习图论的读者容易验证,如此确立的演化关系满足演化关系4条基本性质,故图T是演化集合。
有向树图对生物演化研究十分重要,我们还要详细讨论。
例5以如下集合{e},{f},{g},{h},{e,f},{g,h},{e,f,g,h}为元素构成的集合类,并规定演化关系:
如果A
B作为B≤A,则该集合类构成演化集合。
演化关系4条性质对于例5亦容易验证。
下面又给出例5的一个推广,它对演化的和谐性讨论很有意义。
例6一个集合的一切子集类G,除去空集,且满足条件:
若A∩B≠
,则要么A
B要么B
A。
把子集合看作分支单位,并定义演化关系若A
B,作为B≤A,则该子集类构成演化集。
要说明上述集合类G是演化集合,演化关系的前3条性质留给读者自己验证。
这里验证性质4。
假如集合类
中两集合A与B,又存在集合C∈G,有关系A≤C,B≤C,即C
A,C
B。
无空集,C非空,故A∩B≠
。
根据已给条件立即可得,要不A≤B就是B≥A,性质4被验证。
当我们研究生物的谱系关系时,每一个生演化的实体看作一个分支分类单位,许多分支单位构成一个分支单位集合,在这些分支单位间,按照演化的先后次序,即如果x是y的祖先,确定为演化关系x≤y。
显然此关系满足演化关系的4条性质。
演化集合是一个从生物演化规律中总结抽象出来的数学概念,任何一个演化集合未必能在实际生物世界中找到与之相应的生物演化过程。
但是前面的分析说明,生物演化的真实过程一定符合演化集合条件。
那些参与演化过程的演化实体必定构成一个真实的演化集合。
演化集合作为数学模型是一个抽象的概念,当我们把演化集合的数学性质分析清楚以后,有助于认识演化的基本规律。
当我们面对解决分支分类实际问题,需要构造相应的演化集合,这些构造出来的演化集合并不都是真实的。
我们把能够反映生物演化真实历史的演化集合称作真实演化集合(tureevolutionaryset)。
如何从众多的具有可能性的演化集合中,把真实演化集合区别出来呢?
如何把真实演化集合以容易理解的形式显示给生物学家呢?
这正是分支分类所需要解决的问题。
为了解决这个问题还需要借助一些基本原则,这些原则无法从数学逻辑的推导中得到,它只能从生物演化实际现象的观察研究中,把那些最本质的因素作为公理提出来。
这些公理成为研究分支分类和重构生物演化历史的根本依据。
分支分类的基本公理如下:
公理1对任意一个生物类群,在生物实际演化关系下,存在把该类群包含在内的一个基本演化集,使该类群在此基本演化集上共祖且类群的实际演化关系在基本演化集上得到表达;
公理2生物真实演化集合到分支性状状态集合的映象是演化保序的;
公理3生物真实演化集合的演化图中,同一演化路径上表示演化关系的演化系数满足可加性;
公理4生物真实演化集合其加权演化图的演化长度,取可能达到的最小值。
这些公理的叙述使用了一些尚未说明的名词和概念,因此我们尚不能立即对这些公理进行讨论,随着本章对演化理论的展开,将逐一对这些公理进行说明。
定义4.2在演化集合X中,有这样一种分支单位x,除x外不存在另一个分支单位y∈X,y是x的祖先,即y<x,则称如此分支单位x为演化集合的祖源(ancestralsource)。
又若除x外不存在另一个分支单位y∈X,x是y的祖先,即x<y,则称x是演化集合的终裔(endofdescendent)既是祖源又是终裔的分支单位称为孤立分支单位(isolatedcladisticunit)简作孤立单位。
定理4.1有限演化集合必定存在祖源与终裔。
本节讨论演化集合的一个重要概念,即共祖性,然后依据共祖关系的等价性将演化集合分解,获得演化集合的基本定理——分解定理。
定义4.3演化集合X中,两个分支单位x与y,若存在z∈X,有z≤x且z≤y,则称x与y在X中共祖(coancestral),z是x与y的共同祖先(commonancestor)。
又若在演化集X中,z是x与y的共同祖先,不再有另一个共同祖先z,z≠z,且z<z,则称z是x与y的最近共同祖先(nearestcommonancestor),记作z=x∧y。
特殊情形,若x≤y,根据最近共同祖先的定义,和演化关系的性质2,不难明白x=x∧y。
关于共祖性有下面两条定理。
定理4.2演化集合中两共祖分支单位必存在唯一最近共同祖先。
定理4.3在演化集合X中,x1和x2共祖,x2又与x3共祖,则x1与x3共祖。
这个定理的意义在于说明演化集合中共祖关系可以传递。
共祖的可传递性把不同类群依照系统发育的演化历史联系在一起,因而共祖是认识生物谱系关系的依据,在演化集合中是一个十分重要的概念。
除传递性以外,共祖还具有自反性和对称性。
这三者联合在一起就是数学上的等价关系,所谓等价关系,就是指依据这种关系可以把研究的对象归属于不同的等价类。
在演化集合上,分支单位的共祖性具有以下三条所谓等价关系:
(1)任意分支单位与自身共祖(自反性)。
(2)若x与y共祖,则y与x共祖(对称性)。
(3)若x与y共祖,且y与z共祖,则x与z共祖(传递性)。
这三条关系的前两条从共祖的定义容易明了,传递性关系即定理4.3。
依据这三条关系可以把研究的对象等价地归属于不同种类。
在本节的基本定理中将要利用共祖的等价关系对一般演化集合进行分类。
在引出基本定理之前,让我们把共祖的概念扩展到一般集合上。
定义4.4对于演化集X有演化子集Y
X,若存在分支单位x∈X,使得任何y∈Y都以x为祖先,即x≤y,则称Y在X上共祖,x是Y的共同祖先。
特殊情形,当Y=X时,称演化集X自身共祖,简称作演化集X共祖。
这里共祖的概念被推广到集合上。
类似地,最近共同祖先这一概念也可以推广到集合上。
继续前面的讨论,如果x是Y的共同祖先,在X中不存在另一个共同祖先
≠x,且x<
,则称x是Y在X上的最近共同祖先,记作x=∧Y。
上述推广以后的概念,定理4.2保持其正确性。
将它作为一个新的定理叙述如下:
定理4.4演化集合X的子集合Y,若Y在X上共祖,必存在唯一的最近共同祖先∧Y。
如何判断一个分支单位集合的共祖性呢?
下面的定理提供一个途径。
定理4.5演化集合X的子集Y,Y在X上共祖的充分必要条件为Y中的分支单位在X上两两共祖。
若X=Y,定理4.4的结论成为:
自身共祖的演化集合存在唯一最近共同祖先。
实际上,这里的最近共同祖先也就是祖源。
以定理的形式又可写出如下:
定理4.6自身共祖的演化集合X存在唯一的祖源,就是最近共同祖先∧X。
前面已经论证了共祖的演化集合有唯一的祖源,即最近共同祖先。
但是一般情形,演化集合不一定自身共祖,这时结果将怎样呢?
下面演化集合的基本定理回答了这个问题。
定理4.7基本定理(分解定理)凡演化集合X可分解为m个(1≤m)演化子集Xi,并且有以下性质:
性质1
,其中
;(4.1)
性质2演化子集Xi(i=1,2,…,m)无论在
上或对自身都共祖,且有唯一的祖源Si(i=1,2…,m);
性质3不同演化子集的分支单位在X上非共祖。
在此,数m称为演化集合的分支数(cladisticnumber)。
Xi(i=1,2,…,m)称为X的分支演化集(cladisticevolutionaryset)。
为叙述方便还给出一个名词,对于X的演化子集Xi和Xj,如果不存在x∈Xi与y∈Xj使x与y在X上共祖,则称Xi与Xj在X上非共祖。
现在证明基本定理。
如果X=(x1,x2,…,xn),先把演化子集X构造出来。
,且
与
在
上共祖
(4.2)
考虑到共祖的传递性,Xi无论在X上或者对自身都是共祖的,根据共祖的三条等价关系,如果xi与xj共祖,集合Xi与Xj包含的分支单位相同,视为等价,凡等价者归并于同一个集合类,全部Xi可归属于有限个(m个)等价集合类。
从每一集合类取出一个演化子集为代表,m个演化子集不妨就是:
X1,X2,…,Xm
这些演化子集彼此都非共祖,性质3真。
因为彼此非共祖,显然有Xi∩Xj=Ф,当i≠j。
X中的任意分支点x,依(4.2)属于该点的演化子集,该子集又属于某等价集合类。
存在某一演化子集Xi,x∈Xi,因而有
,性质1亦真。
至于性质2的真确性,考虑Xi的构造,知Xi共祖,再利用定理4.6,祖源的存在性与唯一性立即可得。
如果x与y是演化集合X中的两个共祖分支单位,其最近共同祖先可表示成x∧y。
在下一节将要利用最近共同祖先定义假设分类单位,并建立导出演化集,为解决分支分类打下基础。
因而求最近共同祖先的运算十分重要。
我们可以把符号“∧”视为演化集中两共祖分支单位之间的一种运算符号。
该运算的性质值得我们研究。
基本性质如下:
性质1x=x∧x;
性质2若x与y共祖,则x∧y=y∧x;
性质3若x,y和z互相共祖,则
(4.3)
性质3和等式(4.3)可以推广到任意多个分支单位情形。
考虑到性质2的可交换性,它说明n个分支单位间的运算∧,与运算的排列次序无关。
形式为
的运算可写成
并且运算结果就是{x1,x2,…xn}的最近共同祖先∧{x1,x2,…xn},
(4.4)
所谓分支分类问题,让生物学家表述就是要求把生物演化的真实过程重新显示出来,从而认识当今生物类群的谱系关系。
为了解决生物学家提出的问题,需要把所提的问题具体化,以数学语言对问题进行描述并说明解决问题的途径。
与表征分类一样,分支分类也是从一群被分类的生物对象(称为分类单位)开始。
如果有t(3≤t)个分类单位xi(i=1,2,…,t)构成一个分类单位集合,记作O,全部分支分类工作从集合O开始。
分支分类的目的就是找到一个包含集合O在内的演化集合,通过它认识与分类单位有关的生物演化真实过程。
这样的演化集合无疑应该把分类单位集合O包括在内。
但是仅仅这些集合还不够,为了表示演化发展过程还必须把那些不属于O的有关生物种类也包括在内,比如为了阐明鸟类与哺乳类的演化历史,必须把爬行类也包括在演化集合中,因为爬行类是鸟类与哺乳类的演化起源。
这就是分支分类中的所谓假设分类单位。
在分支分类实际工作中,代表生物演化历史的演化集,它的全部分支单位往往不可能事先都给出。
除集合O中的分类单位以外,某些分支单位所代表的生物种类可能已经灭绝;可能被分类学家所遗漏;可能由分类学家的主观认识所拒绝;……但是为了展示整个演化过程,应该把这些生物种类当作假设分类单位予以恢复,置于演化集合中。
如果x与y是分类单位集合O中的任意两个元素,作为分支单位其最近共同祖先
可以看作前述的假设分类单位,它不一定在分类单位集合O中,可是为了说明x与y的演化历史,须要指出在演化过程中什么位置开始分化。
而最近共同祖先是它们演化分支的开始,因此分支单位x∧y是认识演化的关键,应该把x∧y作为假设分类单位包括在演化集合中。
根据最近共同祖先的存在性与唯一性定理,为了得到x∧y,必须要求x与y在某演化集合下共祖。
x与y的共祖性是存在最近共同祖先的先决条件,也是我们探求x与y演化关系的前提。
为了能够表示集合O中每一对分类单位之间的演化关系,就要求存在某一演化集合,在该集合下O中每一对OTU是共祖的。
定理4.5又告诉我们这个概念与整个集合O的共祖等价。
实际上要求存在一个演化集合,使分类单位集合O在其上共祖。
如果不能说明分类单位集合O的共祖性,分支分类问题解的存在性就值得怀疑,整个分支分类理论的研究,逻辑上也是不严谨的。
图4-4演化集合的扩大分类单位集合O的共祖性反应了我们研究问题的范围,比如我们研究桔梗科下沙参属中种的演化关系,在沙参属的范围内,属中的种共祖,把它们的最近共同祖先也包括在属内,演化过程在属内得到表达。
如果要研究沙参属与其他属种间的演化历史,在属的范围内,它们不共祖,无法构成一个演化集合表示它们演化的全过程。
为了解决这个问题,把我们的研究范围扩大到包括该属的桔梗科,在科的范围下所有分类单位是共祖的,演化问题可以解决。
如果科还不够,可以把研究的范围置于比科更高的分类等级上,由此看来要解决集合O的共祖性,须要把范围充分扩大,让被研究分类单位都包括在内。
也就是说,对于任意分类单位集合O是否存在充分大的演化集合U,集合O在U上共祖。
如此集U称为集O的基本演化集(fundamentalevolutionaryset)。
基本演化集的存在性,从数学理论考虑是做得到的。
事实上,依据演化集的基本定理,对于任意分类单位集O,如果构成演化集合,可分解为m个演化子集Xi(i=1,2,…,n),有m个相应的祖源si(i=1,2,…,m)。
作支单位so,并建立从so到si的演化关系so≤si(i=1,2,…,m)。
如此确立了一个演化集合S={si|i=0,1,…,m}将O与S两个演化集合并在一起,记作U,不难证明,U是一个演化集合,并且O在U上共祖。
从理论上我们已经说明基本演化集总是存在的。
基本演化集理论上的存在并不一定具有实际意义。
为了解决分支分类问题,必须要求分类单位集合O在基本演化集上不仅共祖,并且符合真实情况的演化关系在基本演化集上得到表达,如此基本演化集在客观世界亦是存在的。
这一要求无法从逻辑的推论中证实,只能作为客观存在的事实,以公理的形式在分支分类的理论中引进。
公理1对任意一个生物类群,在生物实际演化关系下,存在把该类群包含在内的一个基本演化集,使该类群在此基本演化集上共祖且类群的实际演化关系在基本演化集上得到表达。
有了公理1就可以对假设分类单位给出严谨的定义。
定义4.5对于分类单位集合O,依据公理1存在基本演化集U,因为O在U上共祖,对任意x1和x2∈O,存在x∈U有x=x1∧x2,称x1与x2的最近共同祖先x为分支分类问题的假设分类单位(hypotheticaltaxonomicunit),简称假设单位(HTU)。
假设分类单位构成的集合
,对于任意
(4.5)
称为假设分类单位集合(hypotheticaltaxonomicunitset)。
集H与O的并集
称为分类单位集合O的导出集(inducedset)。
如果将基本演化集U中的所有演化关系都引入导出集中,获得一个新的演化集合,称为分类单位集合O的导出演化集合(inducedevolutionaryset),亦简称导出集。
定理4.8导出演化集无论对基本演化集或对自身都共祖。
推论:
导出演化集存在唯一的祖源。
分支分类的最后结果都以一棵树的形式出现,即具有一个祖源然后不断分化成多个分支的树状结构。
所有分支树谱图也是这种形式。
何以采取这种形式?
定理4.8及其推论为我们给出比较严谨的论证,从而为分支分类提供坚实的基础。
定义4.6对于演化集X中的任一分支单位x,如下演化子集
(4.6)
称为x的演化可达集(evolutionaryreachableset),演化可达集R(x)的分支数称为分支单位x的分歧数(branchnumber),记作BN(x)。
演化可达集可能是空集,例如当x是X的终裔时,此时规定空集的分歧数为0,于是BN(x)=0。
从演化可达集和终裔的定义不难明白,演化集中的分支单位x是终裔的充分必要条件是BN(x)=0。
对于分支单位x∈X,有了分歧数BN(x)的概念,我们就可以对演化集中所有的分支单位进行分类,按照分歧数的多少得到下面的集合
(4.7)
B(i)称为分歧数为i的集合,分歧数为0的集合B(0)显然就是演化集合X的一切终裔集合。
分歧数为1的集合B
(1)是什么样的集合呢?
我们看前面所举演化集例3,在该例中OTU1(党参)和OTU6(石沙参)两个分支点的分歧数为1。
如此两个分类单位就是该演化集合的集合B
(1)。
该例中其余的分类单位都属于B(0)。
为了显示生物类群的演化关系,作出的树状演化图,取出其中的任意一个分支线,考虑到自然界原来的演化过程,或者这样说,在基本演化集合中相应于该分支线那一段演化过程,可能又经过许许多多不同的演化进程,如果这些演化的中间进程都表示在分支线中,就会得到多个属于B
(1)的点集。
这样的分支数为1的点,它所代表的生物类群如果与我们的研究内容没有多大关系,一般情形我们都把这样的分支点从演化图中删除,删除之后也并不影响整个演化图的基本结构。
作为我们构造的导出演化集,构造的目的是为了展示被分类群的演化关系,分歧数为2以上的分支点为了显示分化的位置应保留在演化图中。
B
(1)的点属于原分类单位也应保留,否则将是多余。
当然我们希望把那些与研究内容不相干的分支点从演化图中删除出去。
那么所构造的导出演化集是否满足这样的要求呢?
回答是肯定的。
随后我们定义产生集并建立有关产生集的定理4.9论证这个结论。
对于一个分支分类问题,导出演化集的B(0)与B
(1)之并称为产生集(productset),表示如下:
的导出演化集
(4.8)
定理4.9对于一个分支分类问题,分类单位集合O的产生集P(O)是分类单位集合O的子集。
即:
第二节分支性状与性状编码
表征型分类曾经把性状看作是分类单位集合到性状状态集合的映象。
分支分类也自然沿用这个基本概念。
如果Y表示被研究的分支单位集合,此集合属于演化集合,如果对于Y中的分支单位y,依据性状映象M都有一个状态x=M(y),集合X={x|x=M(y),y∈Y}是状态集合。
于是我们说代表性状的映象M把集合Y映象到性状状态集合X上。
它们的关系表示如下:
(4.9)
据此我们对分支分类的性状给出定义
定义4.7从代表生物的演化集合Y到性状状态集X上的一个性状映象M,如果X对自身是共祖演化集,则称映象M为Y的分支性状(cladisticcharacter)。
下面举例,反映脊椎动物进化过程的两个性状,生殖方式性状M1和肢趾类型性状M2,这两个性状的状态集合分别是X1和X2,从演化集合Y(部分脊椎动物)到状态集合X1与X2的映象M1与
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 数学 第四