书签分享收藏举报版权申诉 / 11

立即下载加入VIP,免费下载

当前位置：首页 > 幼儿教育 > 育儿理论经验 > 浅谈最大熵原理和统计物理学.docx

浅谈最大熵原理和统计物理学.docx

文档编号：26208320
上传时间：2023-06-17
格式：DOCX
页数：11
大小：23.31KB

浅谈最大熵原理和统计物理学.docx

《浅谈最大熵原理和统计物理学.docx》由会员分享，可在线阅读，更多相关《浅谈最大熵原理和统计物理学.docx（11页珍藏版）》请在冰豆网上搜索。

浅谈最大熵原理和统计物理学.docx

浅谈最大熵原理和统计物理学

摘要

在本文中我们将分别从物理和信息论角度简单讨论熵的意义并介绍由E.T.Jaynes

所奠立基础的最大熵原理的原始理解。

透过研究理想气体，我们将阐述如何运用最大熵

原理研究真实问题。

同时藉由简短分析统计物理学研究方法的问题，本文会给出最大熵

原理更深层涵义及其应用。

我们将称之为最大熵原理第二延伸。

最后透过真实气体的研

究，我们将描绘出如何运用第二延伸来帮助我们思考及研究热力学系统。

一、前言

长时间以来人们对于熵有物理上的理解也有二、最大熵原理

（Informationtheory）上的理解。

物理上l、什么是最大熵原理信息论

的熵可以说明热力学系统的演化方向、热平衡的达相信物理系学生和物理研究人员都很熟悉成与否亦或是代表系统的混乱程度等[1-3]。

在信Clausius的经验准则-热力学第二定律[1,2]。

该定息论里，信息熵则代表量测信息系统的可信度或者律说明当一个热力学系统达到最后热平衡状态时，是忽略度[3,4]。

然而不管物理或是信息论上对熵该系统的熵会达到最大值。

进一步的研究指出当系的理解，实际上仍局限于将熵视为一个量测的工统的熵最大时，其自由能将会成为最小。

在此一具。

正如我们可藉由系统能量的量测来了解系统状特性的影响下人们惯性的倾向于将熵视为类似能态稳定与否。

然而由于E.T.Jaynes的贡献，熵可量的巨观物理量。

此一物理量成为描述系统乱度的

依据。

此后由于Gibbs引入ensemble观念，开视为一种研究问题的推理工具，这一层意义才为人

所知[5,6]。

时至今日，我们虽然仍无法全盘了解启微观角度的研究方法因而奠立近代统计力学理熵的真正意含，但是我们也渐渐掌握熵在物理学尤解熵的理论基础。

在统计力学的观念中，观察者所其是统计物理中所能扮演的角色。

通过本文浅显的量测到该系统热力学性质之巨观物理量诸如系统介绍，我们将从过去Jaynes对于熵的认识到今日内能或压力，基本上只能以平圴值来表现。

原因在我们的新发现，掀开熵的神秘面纱。

于观察者无法明确掌握系统微观状态。

此种不确定

性可以藉由机率分布如canonicalensemble来量定义为忽略度（degreeofignorance）或者描述化表示。

古典系统熵便可由此机率分布来定义出不了选取系统信息的倾向程度，称之为倾向度

（degreeOflikelihood）。

通过Cox和Skilling连续表示，

完全不同的论证[5,7]，信息熵的机率分布型式类

似于热力学熵。

所不同者在于热力学熵含有波兹曼，

（1）S,,kPlogP,biii常数。

这样的相似性直到Jaynes在1957年的研式中代表波兹曼常数而为观察者量测到kPbi究才证明这个相似其实是相等[5]。

信息熵和热力系统处在状态时的机率分布。

或者是连续表示，i学熵实际上具有相同的含意。

Jaynes更进一步指出

且证明最大熵原理（maximumentropyprinciple）

，，，，S,,kdqPqlogPq，

（2）并不只是单纯的热力学第二定律。

他的研究指出，bNNN,

最大熵原理不具任何物理意义仅是一个推论的工

具。

藉由此原理，观察者所拥有的相关系统信息可式中，，代表空间和动量参数且q,r,pN以公正客观的被编入特定机率分布中来描述观察，，表示观察者量测到系统微观状态在PqdqNN者量测到系统微观状态的机会。

下一小节中我们将范围之机率份布。

对于量子统计系统，vondqN以理想气体为例具体说明在Jaynes的理解下，如Neumann发现也同样存在着类似形式来描述系统何运用此一原理重现统计力学的结果并且通过这乱度。

他给出熵密度矩阵（densitymatrix）型样的方式我们将更能了解熵及最大熵原理在物理式，，，，,qN上的含义和功用。

，，，，S,,kdq,qlog,q，（3）bNNN2、实例一:

理想气体,

假设一含有N个气体分子的理想气体已达热

平衡状态，观察者可量测到该气体之总内能平均值。

不过这些熵的微观知识，只让我们了解到熵和用

为以描述热力学系统物理量平均值的机率份布之间

存在一个关联性。

除此之外，我们并未获得更多观

念上的突破。

熵仍只是一个量测工具。

，，E,dqPqH（4）NN,

在1940年代Shannon等人所发展的2communicationtheory[4]也就是后来渐趋成熟且NpiH其中,代表系统的汉米顿量,多元化的Informationtheory中，也同样存在一2m,1i

相似特性的量。

Shannon也称之为熵，该量被视（Hamiltonian），对于理想气体而言仅有动能而无为量测噪声如何影响系统中有用信息的程度，我们，，分子间相互作用能而Pq代表我们量测到系N

统微观能量状态等于时的N个分子机率分H

布。

关系式（4），我们称之为能量约束方程。

它描接着利用上两约束方程，我们可分别决定拉格朗日

因子和。

最后我们可得到最合适描述此,,述了我们对于理想气体有关能量部分信息的了解。

无庸至疑的，我们也知道机率分布需要满理想气体的机率分布，，，，，PqPqNN

足下列约束方程，

1,,H（8），，Pq,eNZ，，dqPq,1（5）NN,

为N个理想气体分子分配函数（partitionZ

。

现在function）其值为，所有系统可能状态的机率分布总合要等于1

的问题是我们如何找到合适的，，可以同时PqN

N满足此二约束方程。

因为唯有知道确实的机率分V,,,,H（9）Z,dqe,,,N,3布，我们才有办法继续研究此一系统的其它物理牲,,,质。

根据Jaynes的研究，最大熵原理告诉我们，

当此系统达到热力学平衡时，最有可能的机率分布122，，将会使熵达到最大值。

具体来说，最大熵Pq,,N2,,,,其中为大家所熟知的热力学波,,,,mkT原理说明在约束方程（4）和（5）的条件考虑下B,,最大化熵。

此最大化过程可由变分原理来达成。

首长。

通过分配函数，系统的Helmholtz自由能可先我们分别针对式（4）和（5）引入两拉格朗日由下推导得出因子（Lagrangianmultipliers）和，我,,

们得到以下变分方程，V（10）F,,kTlogZ,,NkTlogbb3,,,S,dqPq,1,，，，，NN,（6）此理想气体的各种物理性质如压力变化、相图都可,，，，，,,dqPqH,E,0NN,

以由此依序获得。

这也就是统计力学中的

canonicalensemble方法。

若我们获取更多关于，，将式

（2）代入上式后对Pq变分，我们可以N此一理想气体的信息，如观察者所量测之总粒子数，，得到PqN平均值可由粒子数密度来关联时

1,,,,H，，Pq,eN（7），，，，N,dqPqnr（11）NN,

如此一来一个具有最小偏差的研究理论可于焉诞其中代表N颗气体分子密度分布。

我们则，，nr生。

可得到grandcanonicalensemble

三、统计物理学的问题

3ˆ，，，，,,H,,drnr1,根据上述分析，使用最大熵原理作为统计力学（12），，Pqe,NZN的研究方法基本上可以区分成两部分讨论。

第一部

份为物理部份，唯有具备正确且相关于待研究系统

N的物理信息，恰当约束方程才能给定。

第二部分为V,,,,分配函数而化学能可由,Z,e,,N3处理物理信息部份，亦即利用最大熵原理将相关,,,

信息做最佳编码以得机率分布。

上一节中，理想气约束方程（11）决定之。

体的研究便是最佳典范。

当理想气体的物理特性由通过此一例子，我们可了解不管是从物理理论如气约束方程（4）和（5）来描述后，canonical体运动方程的推论而得到的canonicalensemble

ensemble的决定则单纯的由最大熵原理来进行。

或者grandcanonicalensemble实际上与我们在

其过程完全与物理无关。

很明显的因为最大熵原理考虑与系统相关约束方程下最大化熵的结果一致。

恒真，canonicalensemble是否恰当描述理想气这样的结果揭示一个解决物理问题不一样的思维。

体则完全取决于约束方程的适当与否。

而正如前所也就是当我们将所知的物理知识当作是一种信息

述由于约束方程的决定需要相关的物理知识协助来处理，则”如何解决物理问题“这个课题可以

来决定。

如何抉择有助系统研究的物理信息是统计重新解读为如何有效诚实处理这些信息。

在这样的

力学所需面对的第一个问题。

不幸的是目前为止，解读下最大熵原理已提供了最公正的解答。

换言

并不存在一个系统化的方法来解答这个问题。

大多之，若我们拥有一系统充份相关的物理知识，如实数时候，人们还是只能依赖着尝试错误法或是从经验结果，我们便可给出与之相关的约束方程。

之后

验、实验结果来判断。

这样的课题关连到所谓“观经由最大熵原理，我们便可公正客观的决定关于这

念形成”的探讨，有待进一步研究来回答。

因此本些物理知识最佳的机率分布。

经由Jaynes的证

文将不会针对此问题来进行深入讨论。

明，最大熵原理所扮演的角色不再仅是量测忽略度

我们所关心的是除此之外，统计力学进一步所而已，它更是系统化将我们所知信息编码的推理工需面对的问题。

当机率分布如canonical具。

而且其应用不局限于canonicalensemble或ensemble由最大熵原理给定后，我们如何去解读者是grandcanonicalensemble而是取决于我们

这些机率分布以计算关于系统物理性质的期望值。

能获得何种信息。

正因如此过去人们处理如统计物

换句话说，我们如何计算分配函数。

对于理想气体，理学的既定观念和方式将变为有所依循而且可避由于气体间不存在任何相互作用力，方程式（9）免许多针对特别问题由研究者所给定的人为假设。

中分配函数的计算是易如反掌。

但事实上由于复杂

的相互作用力，真实系统的机率分布是难以计算。

要输入系统初始信息比如关于排斥力和吸引力信对于这样的机率分布我们称之为不可计算器率分息便可以产生恰当的近似法。

从信息论的角度审

视，理论上的确存在这样一个方法[11]。

下一节中布。

因此当我们面对真实热力学系统时，如何处理

复杂多体相互作用力成为统计力学中一必要课题。

将针对我们的发现做一讨论。

换句话说只有当我们理解如何有效处理复杂多体

相互作用力，我们才可能发展合适的近似法来计算四、最大熵原理之第二延伸

1、基本概念分配函数。

例如因为短距离排斥力和长距离吸引力

的相互竞争造成流体不同于固体的物理性质，让我从信息论的角度来看，利用近似法来计算真实们知道要计算含有这些相互作用力的分配函数可系统分配函数这个方向，等同于利用一可计算且近

似描述真实系统的机率分布族群取代真，，Pq以利用如平均场近似法来进行。

0N

实不可计算的机率分布，，。

更明确的说法Pq简单说，长久以来统计力学的研究有大部分的N

是，我们希望找到一个，，其含有的信息最Pq努力便是在寻找合适的近似方法。

因此人们针对其0N想要研究的课题发展出各类型近似法。

如凡德瓦接近真实系统而利用此族群可以最佳回答我们有（vanderWaals）引入平均埸概念用以取代气体中兴趣的问题。

复杂的多体相互作用力，因此而得到著名的凡德瓦要具体化的从这个方向进行可以分做两步骤方程，真实气体方程式[8]。

然而虽然凡德瓦方程来达成。

第一步骤为寻找可资利用的族群，这个步成功显示三态变化的相图和预测流体临界点，可是骤类似于前一节中我们所面临到的统计力学第一却无法成功预测且描述液体或者固体物理性质如个问题。

目前仍停留在利用错误尝试法或是经验法微观结构等。

问题在于除了平均场法的粗糙外，还则来寻找而并无一系统化的方法。

第二步骤则是在根源于凡德瓦人为引入假设气体分子为坚硬球体我们寻找到数个可计算的近似机率分布族群而这来描述相变所需的额外条件-短距离排斥力。

结果些族群我们称之为试验族群（trialfamilies）都基于这额外条件太过粗糙并无法精细的重现真实可部份正确描述我们所关心的系统后，我们该选择短距离排斥力，使得这近似无法成功使用于需详细那一个族群能最接近真实族群。

我们如以这样的方短距离排斥力信息的液体和固体的研究。

在此之式重新诠释，我们发现最大熵原理提供了最客观最

，，小偏差的解答。

基本概念如下假设族群PqN后，由于了解到短距离排斥力这项信息对于研究液体或固体的重要性，人们发展出许多以此信息为基代表真实系统但我们无法计算，础的近似法如易行模型（Isingmodel）或液体理

3论Ornstein-Zernike方程[2,9,10]。

这些的努力Hqdrrnrˆ,,，，，，，，;,，,N,e（13），，Pq;,dqdq,基本上都是为了有效处理分配函数中短距离相互NNNZ作用。

在检视这些近似法后，我们质疑是否存在一

个系统性且不需额外人为假设的方法。

该方法只需

其不可计算的分配函数为们可得到最大熵，

3,,,,，ˆHqdrrnr，，，，，，;N,,,（18）,,SPP,,,,,,H,HZq,edq，，;,0000NN,（14）,,,,e

（式中下代表期望值以试验族群为基底来？

0最大熵原理告诉我们最好的试验族群可，，Pq0N

用以取代真实族群，将会最大化系统的，，PqN计算）。

因为，最大化熵等同于在含,,SPP,00熵，

盖试验族群中所有可调整参数，，下最小化，,

Pq，，，也就是N,,,，H,H000U0（15）SPPkdqPq,,，，,,logbNN00,，，PqN

（19）,,min,假设关于试验族群的汉米顿量为，，，Hq;,,UU0N,,,代表不同试验族群的参数，该参数可用以取代复杂

的相互作用力使得分配函数的计算成为可行如平如此我们便可找到最佳参数，，可使得Pq,0N均场。

根据最大熵原理，描述该族群的机率分布为以取代，，。

下一节我们便以真实气体为例PqN

子做一简单说明如何利用此原理产生可信度最高3ˆ;Hqdrrnr,,，，，，，，,，,N0,e的近似法来研究真实气体并指出其成功与失败之，，Pq;,dq,dq0NNNZ0处。

2、实例二:

真实气体（16）

正如我们所知，我们无法理论解真实气体的原

因就在于气体间相互作用力过于复杂使得真实气试验族群的分配函数为

体分配函数的计算难以进行。

通过我们对真实气体

3的理解，我们知道长距离吸引力是真实气体之所以,,,,，ˆHqdrrnr，，，，，，;0N,Zq,edq，，;,NN0,（17）为气体的主因。

同时我们的物理知识告诉我们，恰,,,0,e，，当的平圴场vr为最简单且能正确重现长距0

离吸引力的近似表示。

基于这些信息，当我们以平

，，式中,r为拉格朗日因子用以限制在空间中任均场为参数，最大熵原理（18）告诉我们最佳,

何一位置关于期望密度的约束方程为方程式（11）。

的平均场为将（13）和（16）代入（15），利用变分原理，我

3代气体间相互作用力结果却显示此最佳试验族群，，，，，，（20）vr,dr'ur,r'nr'0,

只能用以描述稀薄气体行为。

因为最大熵原理恒

真，我们的方法导致此不完全正确结果仅可以理解式中代表真实分子间相互作用位能而，，ur,r'为由于初始信息的不完整--平均场只适合描述长代表在空间中位置r最佳的气体密度分，，nr距离吸引力并无法恰当的代表短距离排斥力，因此

我们的方法，最大熵原理将无法给出含有此排斥力布。

藉由计算最佳的Legendre,U

信息的最佳族群。

换句话说，若我们尝试研究短距transformation，我们可找到最佳气体密度分布关离排斥力扮演重要角色的稠密气体或是液体，除了系式，平均场这一参数外我们将需要另一关于短距离排

斥力参数。

3log,nr，，3，，，，，，，，,,,,,vr,,r，dr'ur,r'nr',五、结论

本文简略的陈述出人们对熵的观念从单纯的（21）

系统乱度乃至于推论工具的演变和成型。

通过理想

气体的简单计算，我们知道了如何运用最大熵原理利用Percus-Yevick近似[9]，我们可将密度分布

来解决统计物理问题。

然而当我们面对真实系统形式转换成放射分布函数（radialdistribution

时，我们发现最大熵原理的第一应用仅是将我们所function，该函数被视为一洽当形式来研究流体

无法处理的物理信息如分子间相互作用力公正客热力学问题）。

最后可经由self-consistency法

观的编码成另一不可计算的机率分布型式。

解决之数值解式（21）。

我们的数值计算结果和实验数据

道再于我们如何找到最佳近似表示，最大熵原理第的比较显示式（21）正如我们预测可正确描述稀

二延伸的发现则提供别于传统方法，较为客观有系薄气体结构。

由于本文重点仅在于介绍最大熵原理

统的方法产生最佳近似法。

正如文中所提只要我们在统计物理学所扮演的角色及意义，在此将不再详

输入正确相关的初始信息，最大熵原理将公正客观细叙述所有的研究分析、结果。

有兴趣者请参考

的给出最佳近似。

但是这方法存在着和统计力学第[11]。

一问题相同的困难，我们如何抉择那一个信息有这样的使用最大熵原理寻找最好的可计算族

我们用、相关且可计算。

在真实气体的例子当中,群来正确取代真正的族群，从我们的研究显示这样

可看到利用经验法选取平均场理论作为初始信息，的推理过程将会是最诚实的方法。

因为整个过程只

虽然成功描述稀薄气体行为，但我们却丧失描述液有初始信息的建立扎根于物理知识。

只要我们输入

体的能力。

若我们有兴趣研究液体物理性质，新的正确的信息，最大熵原理将给我们最正确关于该信

含有短距离排斥力初始信息则需要加入考虑。

虽然息的表述。

在我们的研究中，我们输入平均场来取

关于最大熵原理第二延伸在统计物理上的适用性

仍然在检验及建立当中[12]，但我们仍然可以相BayesianMethodsinScienceandEngineering

vol.1,byKiuwerAcademicPublishers（1988）.信，熵不但可以是热力学系统的乱度可以是信息系

[8]J.D.vanderWaals,Onthecontinuityofthe统的可信度也同样的可以是我们在研究问题时一

GaseousandLiquidState,ed.byJ.S.Rowlinson个公正客观的推理方法。

至于这样的推论结果是否

（1988）.正确则取决于初始相关信息是否关联至我们有兴

[9]JeanPierreHansenandIanR.Mcdonald,趣的课题而与此方法完全无关。

在不久的未来，相

TheoryofSimpleLiquids,byAcademicPress信我们可以更加确信这一思考方式在帮助我们做

（1986）.物理研究时的可行性及客观性。

届时我们也将更了

[10]V.I.Kalikmanov,StatisticalPhysicsof解什么是熵。

Fluids,bySpringer（2001）.

[11]Chih-YuanTsengandArielCaticha,in致谢

BayesianInferenceandMaximumentropy作者要特别感谢纽约州立大学Albany分校物理系

教授ArielCaticha，藉由通过与他的讨论和在他methodsinScienceandEngineering,Ed.by

ChrisWilliams,AIPConf.Proc.659,73（2002）.的指导下而导致本文中许多观念的突破和建立。

同

[12]目前我们正在进行的深入研究再探索最大熵时对于林怡倩小姐的多方帮忙一并致上感谢之意。

原理第二延伸的完整架构及适用性。

主要可包含两

部分，第一、在利用热力学微扰理论[9,10]将短距参考数据:

[1]L.D.LandauandE.M.Lishitz,Statistical离排斥力适当的引入情况下，如何使用最大熵原理Physics,byAddison-Wesleypublishing第二延伸产生近似法及其适用性。

第二、当第一部company（1969）.分的研究正确的考虑长短距离相互作用力的所造[2]HerbertB.Callen,Thermodynamicsandan成的流体行为，是否我们的理论可正确无误的显示introductiontoThermostatistics,byJohn并解释流体相变现象或临界现象。

WielyandSons（1985）.

[3]HarryS.Robertson,Statistical

Thermophysics,byPTRPrenticeHall（1993）.[4]C.E.ShannonandW.Weaver,The

MathematicalTheoryofCommunication,byUniv.ofIllinoisPress,Urbana（1949）.

[5]E.T.Jaynes,Phys.Rev.106,620（1957）.[6]E.T.Jaynes,Phys.Rev.108,171（1957）.[7]JohnSkilling,MaximumEntropyand