从统计物理学看复杂网络研究.docx
- 文档编号:23416386
- 上传时间:2023-05-16
- 格式:DOCX
- 页数:30
- 大小:34.19KB
从统计物理学看复杂网络研究.docx
《从统计物理学看复杂网络研究.docx》由会员分享,可在线阅读,更多相关《从统计物理学看复杂网络研究.docx(30页珍藏版)》请在冰豆网上搜索。
从统计物理学看复杂网络研究
从统计物理学看复杂网络研究
第24卷第1期
2004年3月
物理学进展
PROGISSINPHYSICS
V01.24.No.1
Mar.,2004
文章编号:
1000-0542(2004}01-0018—29
从统计物理学看复杂网络研究
吴金闪,一,狄增如
(1.北京师范大学管理学院系统科学系,北京100875
2.北京师范大学物理系,北京100875)
摘要:
从统计物理学来看,网络是一个包含了大量个体及个体之间相互作用的系统.
本文从统计物理学的角度整理与总结了复杂网络目前的主要研究结果,并对将来的研究工作
傲了一个展望.文章把网络分为三个层次——无向网络,有向网络与加权网络,对不同网络
的静态几何量研究的现状分别做了综述,并结合网络机制模型设计与评价的需要,提出了新
的有待研究的静态几何量;对网络机制模型做了总结与分析,提出了有待解决的关于双向幂
律网络的机制模型的问题;部分地概括了网络演化性质,网络的结构稳定性以及网络上的动
力学模型的研究.然后,以我们目前正在进行的两个方面的工作—科学家网络和产品生产关
系网络一为例,粗略地介绍了网络研究在一些实际问题中的应用.最后,作为一个简单的补
充和索引,我们整理了复杂网络研究中部分常用的解析与数值计算的方法.
关键词:
统计物理学;复杂网络;综述;随机图;幂律;无标度网络
中图分类号:
O414.2文献标识码:
A
0引言
近年来,关于复杂网络的研究正处于蓬勃发展的阶段Ll~3J.其研究者来自图论,统
计物理学,计算机网络,生态学,社会学以及经济学等各个不同领域.网络研究的文章主
要发表于Phys.Rev.Lett.,Phys.Rev.E,PhysicaA,PNAS等物理类期刊,Nature,
Science等综合期刊,以及EcologyLetter,ACM等专业期刊.2002年Rev.Mod.Phys.的
综述文章《复杂网络的统计物理学》L1]在历史,基础与前沿等各个方面都写的非常之好,
得到了非常高的引用率,已经在SIS被评为由突出影响的文章之一L4J.但是这一年多以
来,网络研究的飞速发展,新的理论研究,新的应用领域的发展和开辟,使得我们有必要重
新整理与总结这一领域的研究,以促进复杂网络研究的发展.同样是网络的统计物理学,
本文更多的从复杂网络研究的不同方向进行总结,在保证一定的广度的基础上突出深度,
阐述不同方向之间的联系,并据此提出新的研究问题.
收稿日期:
2003—10-25
基金项目:
国家自然科学基金(No.79990580)和(No.6o0o3o18)资助
1期吴金闪等:
从统计物理学看复杂网络研究19
网络可以用来描述人与人之间的社会关系,物种之间的捕食关系,词与词之间的语义
联系,计算机之间的网络联接,网页之间的超链接,科研文章之间的引用关系,以及科学家
之间的合作关系,甚至产品的生产与被生产关系.网络还可以作为现象的背景舞台,例如
在社会关系网络上讨论舆论的传播,接触关系网络上讨论传染病的传播,计算机病毒在
Internet网络或邮件网络上的传播,在引文网络上研究新思想的提出与传播,在科学家网
络上研究科学家之间的相互影响等.网络与现象结合还可以用来讨论网络的稳定性等结
构与功能关系,例如在食物链网络上讨论个别或部分物种灭绝对整体生态系统的影响,在
不同的网络上讨论传染病传播的控制,在科学家网络中讨论某个领域中不同的科学家的
影响力对网络演化的影响.此外,网络本身的演化过程也是一个有趣的问题,例如
Internet网络的形成被认为是无限定原则的,但是它却展现了一些重要而普适的结构特
征与稳定性,再比如,对于某一个学科内的引文网络与科学家网络的演化机制的研究,有
可能给出促进科学发展的新的方案与模式.
每一个系统中的网络都有其自身的特殊性质,有其紧密联系在一起的独特现象,有其
自身的演化机制,但是由于都可以使用网络分析的方法,所以有其共性.例如关于顶点度
值,介数的分析方法以及大量不同网络中存在的相同的统计特征,再如随机去点与选择性
攻击对网络结构的影响及其分析方法.研究网络的几何性质,网络的形成机制,网络演化
的统计规律,网络上的模型性质,以及网络的结构稳定性,并把它与具体系统结合起来是
复杂网络研究的中心内容.
统计物理与图论都是研究这种共性的有力工具.网络G=(,E)作为图论的概念
是指由一个点集(G)和一个边集E(G)组成的一个图,且E(G)中的每条边ei有
V(G)的一对点(U,)与之对应.记顶点数为N=I,,,I,边数为L=IEI.如果任意
(U,)与(,U)对应同一条边,则称为无向网络,否则为有向网络;如果任意IeI=1,则
称为无权网络,否则为加权网络.从统计物理学的角度来看,网络是一个包含了大量个体
以及个体之间相互作用的系统,是把某种现象或某类关系抽象为个体(顶点)以及个体之
间相互作用(边)而形成的用来描述这一现象或关系的图.统计物理学是从微观到宏观的
桥梁.研究网络中顶点与边的度值与权值等微观性质与网络的几何性质,效率与稳定性
等宏观性质之间的关系正是复杂网络研究的核心内容.因而,与图论的研究有所不同,统
计物理学研究网络更侧重于从各种实际网络的现象之上抽象出一般的网络几何量,并用
这些一般性质指导更多实际网络的研究,进而通过讨论实际网络上的具体现象发展网络
上模型的一般方法,最后讨论网络本身的形成机制.统计物理学在模型研究,演化机制与
结构稳定性方面的丰富的研究经验是统计物理学在复杂网络研究领域得到广泛应用的原
因;而图论[5]与社会网络分析[]提供的网络静态几何量及其分析方法是复杂网络研究的
基础,并得到了充分的发展.
我们把个体与相互作用直接抽象为顶点与边的系统称为网络,例如www网络,
合作者网络【66,67】,并把网络的统计性质称为网络静态几何量;把关于实际网络演化的统
计规律的分析称为网络演化性质的研究,例如www网络中网页数量的时间演化规律,
而把关于具有特定几何性质的网络的形成机制的探索称为网络演化机制模型,例如探讨
ScaleFree网络的形成;把建立在网络上的其他模型,例如传染病[挖J,渗流模型【DJ的动态
物理学进展24卷
过程称为网络上的动力学性质;把网络的各种攻击方式与响应称为网络的结构稳定性,例
如选择性隔离对于传染病流行的控制作用.
本文是按照前面所述的逻辑来组织的,首先我们对三种网络的静态几何量研究的现
状做了总结,并提出了一些新的研究对象;接着我们同样对网络机制模型做了回顾和展
望,提出了有待解决的问题;随后部分地概括了网络演化性质与网络上的动力学性质的研
究,并探讨了它们与网络研究的关系;接着总结了网络的结构稳定性研究,尤其是基于网
络的传染病控制与食物链网络的鲁棒性的研究.最后,由于其特殊的重要地位,我们用科
学家网络为例,做了一个包含以上几个方面的研究思路,并提出了产品生产关系网络
(PION)的研究思路与计划.研究产品生产关系网络可以不仅把握经济学领域大量现象
与关系,并且,由于这种网络结构有其特殊性,还可望促进网络研究的发展.最后一节,我
们整理了在解析和数值计算中经常使用的一些技术,便于大家参考以及查找相应的文献.
1网络上的静态几何量
在本节中我们将对网络的静态几何性质做一小结,并按照为网络机制模型的研究服
务的思想提出了新的静态几何量.静态几何量指的是给定网络G=(,E)的微观量的
统计分布或者宏观统计平均值.由于有向网络与加权网络有其特有的几何量,我们将分
开讨论无向网络,有向网络与加权网络.
1.1无向网络
目前已得到研究的典型无向网络包括:
Intemet网络,电影演员合作网络,科学家合
作网络,人类性关系网络,蛋白质互作用网络,语言学网络,蛋白质折叠关系网络.
无向网络的基本几何量l1.2]有:
度及其分布特征,度的相关性,集聚程度及其分布特
征,最短距离及其分布特征,介数(Betweenness)及其分布特征,连通集团的规模分布.
一
个顶点的度是指与此顶点连接的边的数量,即
d=∑
(1)
其中记号取值为1当路径l包含顶点q,否则为零,即
=
d—n
;
同时为了以后表述方便,我们定义其他两种类型的记号,与分别表示顶点相
邻与边相连,对于有向网络,≠,推广为,,.对于加权网络
用记号w代替就可以完整地描述.
V∈V我们都可以得到其度d.度值的分布特征是网络的重要几何性质.规则网
络各顶点度值相同,因而符合分布,随机网络符合泊松分布(见(2.1)节),大量实际网
络存在幂律形式的度分布l1.2J,称为无标度网络(ScaleFreeNetworks),包括Intemet网
络[43,44],电影与电视剧演员合作网络[17,31,45],科学家合作网络[66,67],人类性关系网
络[,蛋白质互作用网络[47],语言学网络[48]等,同时还存在高斯型,如蛋白质折叠网
1期吴金闪等:
从统计物理学看复杂网络研究21
络L4,和指数衰减型的幂率分布,如电视剧演员合作网络[45].
进一步的问题是,是否度分布可以完备地描述网络的特征呢?
如果度分布与网络一
一
对应,我们就说度分布可以完整地描述网络,网络也只需要用度分布来描述.试想对于
一
给定的度分布,通过抽样,我们可以给对应网络的每一个顶点一个度值,保持度值的任
意一种连接方式都构成一种网络.如果任意一种连接对应的其他几何量都一样,则我们
认为实际上为同一网络.但是显然不能保证其他几何量也都一样.那么,保持度值不变
的随机连接,即度与度之间没有相关性,是否可以成为大多数网络的代表呢?
所以度分布
之间的相关性是另一个重要的几何量.Newman把它称为"匹配模式"5_,意思是考察度
值大的点倾向于和度值大的点连接,还是倾向于和度值小的点连接.具体的方法是,通过
任意一条边都可以找到两个顶点,进而得到两个度值,这样通过所有的边我们就得到了两
个序列,分析这两个序列的相关性即可.研究表明实际网络存在一定程度上的匹配模式,
有的网络正向匹配,也有的网络反向匹配.但是,由于是无向网络,把哪一个顶点的度放
人序列口,把哪一个顶点的度放人序列b是任意的,这一点对于相关性分析的影响并没有
得到研究.实际网络的分析表明,不同的网络存在不同的匹配模式,有正相关也有负相
关.
集聚程度的意义是网络集团化的程度,即考察连接在一起的集团各自的近邻之中有
多少是共同的近邻.一种定义是对于每一个顶点,找到其近邻集合N,记=INI,
N中存在的边的数量为
M=∑(3)
z∈E',yE
则
=
M(4)
于是我们可以得到所有顶点的集聚程度,它的统计分布是刻画网络的一个重要几何量,其
平均值称为平均集聚程度C.
两点的最短路径z"定义为所有连通(i,)的通路中,所经过的其他顶点最少的一条
或几条路径.记(i,)之间最短路径的集合为s¨相应的路径长度为d:
I.如果
(,)之间不存在通路,那么记df=N.于是我们可以得到一个N×N的矩阵
(d)ⅣⅣ.其分布特征是一个重要的全局几何量,其平均值称为平均最短路径d.
另一个重要的全局几何量是介数(Betweenness)[16].顶点的介数含义为网络中所
有的最短路径之中,经过U的数量.它反映了顶点的影响力.记(i,)之间最短路径
的集合为S顶点U的介数定义为
B=(5)
由此可以得到每一个顶点的介数B.实证研究表明,大量实际网络的介数分布也拥有共
同的统计特征[16_.类似地,可以定义边的介数,Newman等人发现,边的介数可以用于分
析顶点的聚类[.其基本思想是在包含不同集团的网络中所有最短路径经过次数最多
的边,也就是介数最大的边,必然是联接两个集团之间的边.当然,建立在联接赋权基础
物理学进展24卷
上的HierarchicalClustering聚类算法也能给出网络上顶点的分类.
连通集团是指G的一个子图,在这个子图内,任意两点之间都存在通路.一个网络
可能存在多个相互独立的连通集团.在渗流模型中,当系统处于临界状态时,连通集团的
规模呈现出幂律分布.实证研究表明,对于大量的Scale—free网络,连通集团的规模也存
在幂律分布[1l.
关于无向网络的度分布还存在另外一种形式.计算近邻顶点的数目得到度值,然后
把所有顶点的度值归一化后再把近邻顶点的度值相加得到顶点的二次度值,重复这一过
程,直到得到稳定的度值J.这样得到的每一个顶点的度值实际上是邻接矩阵的最大本
征值对应的本征向量,上述过程实际上就是矩阵本征值的最速下降法.但是这样的度分
布具有的几何意义目前没有得到研究.
1.2有向网络
目前已得到研究的典型有向网络包括:
wWw网络,细胞内化学反应网络,食物链网
络,引文网络,电力网络,神经网络.
当我们忽略边的方向的时候,或者反过来看认为任何一条边都是双向的时候,有向网
络就成为无向网络.因此,关于无向网络的所有几何量都可以在有向网络中研究.有向
网络的特殊静态几何量包括:
In度和Out度的分布特征,基于顶点的In-Out度关联性,基
于边的(In-Out,In-In,Out—In,Out—Out)度关联性,双向比,In集团和Out集团的集聚程
度.
把无向网络的度推广为In度和Out度,
dt=∑(6)
∈y
以及
d:
∑,(7)
∈y
可分别研究In度和Out度的分布特征.实证研究表明,有向网络中存在In度和Out度
的双向幂律分布,如wWw网络[25,49,26],细胞内化学反应网络[50,51;但是也存在只有In
度幂律分布的网络,如引文网络[65;以及符合指数衰减的网络,如电力网络[]与神经网
络[45;此外,由于受顶点数规模限制,食物链网络的度分布特征仍然没有确定[~5.
由于每一个有向网络的顶点都存在In与Out两个度值,研究这两个度值之间的关联
将是有向网络的另一个重要特征.与无向网络的度相关类似,我们可以研究有向网络基
于边的度相关.任意选取一条边,在边的两端存在4个度值,起点的In度和Out度,终点
的In度和Out度,所以存在4种关联性,分别是In-In,In-Out,Out—In,Out-Out关联.尽
管关联性复杂了,可是同时去掉了上一小节所提到的无向网络度相关分析的任意性.那
么这样的度度相关的研究是否仅仅是无向网络中度关联性分析的平庸推广呢?
不是.我
们提到,所有新提出的几何量都是为了网络机制模型服务的,在下一节中大家可以看到在
机制模型中,反馈机制是一个重要的因素,而有向网络的度相关性正是建立反馈机制的重
要参考.
边的双向比,即双向的边占所有边的比例,也是一个重要的概念,可以为设计双向幂
1期吴金闪等:
从统计物理学看复杂网络研究
律分布的机制模型提供参考.
1.3加权网络
目前,关于加权网络的实证研究不多,只有在Newman的工作[66]中提到了一点关于
科学家加权合作网络的研究.
首先,我们需要讨论加权网络的加权的必要性与方式.把一个实际问题抽象为加权
网络的过程并不都是平庸的.当然,对于邮递员问题等包含距离关系的网络,直接把距离
作为权就可以了,但是对于其他包含相似关系,亲密程度等社会关系的网络,如何加权就
值得讨论了.尤其是,当系统当中包含多个层次的同一属性的关系的时候,就必须仔细研
究其加权方式了.以下,我们以某一学术领域内的科学家网络[66,68]为例,介绍加权网络.
为了研究某一学术领域的发展变化,某一个新的思想在此领域内的产生,传播,我们
构造了一个科学家之间通过文献相互联系影响的网络.我们认为,对于研究此问题而言,
科学家之间的合作关系[66],引文关系[65,68]以及讨论或书信交往(经常体现在致谢中)属
于同一属性的关系,但是所起作用的程度有所不同.对于交流思想而言,合作是最直接的
影响,其次是引文,再次为致谢.而且,在同为合作的关系内,合作的次数的不同,对于交
流思想的影响也是不一样的.因此,在这个科学家网络中,每一条边代表了综合考虑了以
上三个方面两个层次的相互作用以后的影响力程度.并且由于引文和致谢的有向性,此
网络是一个加权有向网络.
加权网络的静态几何量包括:
度及其分布特征,权及其分布特征,权的相关性,权与度
的相关性,最短距离及其分布特征,介数及其分布特征与隧道现象,与相应无权网络的对
比,距离关系与类聚分析,以及在加权网络上集聚程度的定义及其统计性质.
首先加权并不改变度与集聚程度等局域几何量,所以无权网络的局域几何量分析都
可以在加权网络上实现.权的分布反映的是本领域内学术交流的活性,如果我们认为所
有学术研究都将表现为文献发表与学术交流的话,那么它反映的是此领域内学术研究的
活跃程度.
类似于无向网络的度相关性,权的相关性考察的内容是是否活跃的科学家倾向于和
其他活跃的科学家合作,还是倾向于提携后进.一种可行的方法是把某一个点的权定义
为从该点出发的所有的边的权重之和,即
t=∑wout(8)=w(8)
以及所有到达该点的边的权重之和,即
w=∑W(9)
其中,合作关系作为无向部分同时记人w与w.
权与度的相关性研究,考察的是科学家合作交流的广泛性与深入性的关系.用上一
小节有向网络的度的定义,每一格点的有两个度值d,d,两个权值,w.m,存在四
种相关性一d,w,wmd,Wndm.忽略有向性,可以定义
』Wu=+.wI"ll(1o)
【d=dOUt+d
物理学进展24卷
也可以讨论无向化网络的权与度相关性.
加权网络另一个有意思的特征量是单位权,即
=
…)
它表示顶点每一个连接的平均权重.有关单位权的统计分布以及关联性的研究将是一个
有趣的问题.
加权网络中的最短路径是指在两点之间所有连通的路径中,权数之和最小的一条或
几条路径.在科学家网络中,它和新的思想在网络上的传播密切相关.与无权网络的顶
点数最小相比,加权会改变最短路径.而且由于最短路径的改变,介数也将发生变化.在
科学家网络中,介数反映了在本领域内,某位科学家影响力的大小.某一顶点的近邻顶点
介数分布的两极分化性质称为隧道现象[,全部顶点的介数分布反映的是科学家影响力
的层次.边的介数反映的是不同科学家之间的交流对学科发展的影响力的不同.同时,
利用边的介数也可以对科学家做聚类分析.所有以上局域或全局几何量都需要与相应的
无向网络或无权网络做对比研究.
最后,我们可以用两两顶点之间的距离来度量由于加权带来的顶点之间的亲密程度
的不同.并且有了距离关系以后,我们就可以做聚类分析,给出科学家之间的交流集团.
这种聚类分析还可以和基于边的介数的聚类分析对比.加权网络目前仍然是一块有待开
发的沃土.
2网络机制模型
上一节我们主要总结了对于实际网络的静态性质的统计研究,这一节我们去看一看
什么样的网络模型会展现这些特定的统计性质.这是研究网络上的动力学模型的基础.
如考虑不同网络上的传染病模型,用来描述接触性传染病的传播,谣言在人群中的传播等
现象,或者不同网络上的渗流模型.对于这些问题,我们可以选择用微分方程来描述.例
如以下Logistic模型,
=一z)z(12)
我们把看成是健康人与受感染人之间发生接触并获得传染的几率.所以在此模型中,
所有个体是均匀混合的,没有局域近邻的概念,就好像是溶液中发生的化学反应一样.或
者我们这样来理解,把疾病看作只要接触就传染,那么的意义是平均来看每一个体
的近邻数目占所有人口的比例.因此,可见Lo~stic模型的背景是完全随机网络.作为
补充,我们可以在规则网络上用模拟或者重整化群的方法来研究同一问题.而作为模型
真实背景的是人的社会交往的网络,这样一些网络可以通过实证研究获得对其静态性质
一
定的认识.但是对于研究这些网络上的动力学模型来说,更加广泛的研究还需要网络
模型,而不仅仅是实际网络数据.例如,人类相互认识的网络是SmallWorld网络,那么当
我们研究这样的网络上的动力学模型的时候,我们就需要一个相应特征的网络来作为我
们的背景.当然,我们可以收集这个网络的实际信息,然后在这个实际网络上进行分析.
1期吴金闪等:
从统计物理学看复杂网络研究
但是这有很大的局限性,尤其对于理论研究.如果我们能够设计一个具有这些性质的网
络演化机制模型,那么我们进一步对网络上动力学模型的研究就可以以这些机制模型为
基础.当然,如果发现现有的机制模型不能展现已有的几何性质,我们就需要修改模型.
本节中,我们将分别介绍规则网络和完全随机网络[5](以下简称随机网络),Smallwlorld
网络[]与ScaleFree网络[17]的机制模型.
2.1规则网络与随机网络
我们把一维链,二维正方晶格等称为规则网络.规则网络是指平移对称性晶格,任何
一
个格点的近邻数目都相同.当然这只是一个习惯用法,不是下定义,比如CarleyTree显
然不是随机网络,但是也没有规定说它属于规则网络.随机网络是另一个极端,由N个
顶点构成的图中,可以存在c条边,我们从中随机连接M条边所构成的网络就叫随机
网络.还有一种生成随机网络的方法是,给一个概率P,对于c2~中任何一个可能连接,
我们都尝试一遍以概率P的连接.如果我们选择M=pc2~,这两种随机网络模型就可以
联系起来.对于如此简单的随机网络模型,其几何性质的研究却不是同样的简单.随机
网络几何性质的研究是由PaulErd6s,Alfr6dR6nyi和B61aBollob~s在五十年代到六十年
代之间完成的.为了强调随机网络研究与统计物理学的联系,我们从系综理论的角度重
新表述了随机网络统计性质的研究结果.但是,为了在这一节中突出模型的统计性质而
不是处理方法,我们把这一表述放在最后专门介绍方法与技术的一节中...
规则网络与随机网络的典型几何性质包括:
度分布,平均集聚程度与平均最短距离.
规则网络所有顶点都相同,因此其度值相同,度分布为(k一惫0),其平均集聚程度也只需
要在一个点计算C:
(>=,其最短距离可以也只从某一个顶点开始计算从它到所有
lrvr
其他顶点之间的距离之和L~N2,然后计算其平均值d=~N.对于随机网络G
^乙-N
(N,P),包含了从空图到完全图的所有可能情况,因此随机图的几何性质需要对每一种
可能图做平均,例如我们计算每一种可能图的最短距离,然后按照各自出现的几率做平
均.一般公式与详细的计算见第7节.研究结果表明随机网络顶点的度值符合平均值为
N的泊松分布,其集聚程度约等于P,最短距离d~ln(N).
对比规则网络与随机网络,我们发现,平均集聚程度与平均最短距离,这两个静态几
何量能够很好地反映规则网络与随机网络的性质及其差异.规则网络的特征是平均集聚
程度高而平均最短距离长,随机网络的特征是平均集聚程度低而平均最短距离小.规则
网络的平均最短距离d~N,而其集聚程度可以通过改变近邻数目k0来调整,例如在如
1
图1所示的规则网络中,k0=4,集聚程度分别为寺.而在随机网络中,平均集聚程度非常
的小,在图1所示的随机网络中,顶点数与边数都与规则网络相同,但集聚程度为0.02.
然而正是由于其集聚程度非常地小,所以其平均最短距离小.考察一个顶点的近邻,
假设其近邻数为a,那么在a个近邻的近邻之中相互重复的个数非常少,所以从出发
经过两次近邻关系我们可以找到正比于a的新顶点,最多经过logan个近邻关系,我们
就可以穷尽整个网络.所以,其最短距离满足d~InN.可见,对于规则网络,也正是由
物理学进展24卷
图1SmallWorld网络模型.图中所示的Sma
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计物理学 复杂 网络 研究