NAMD入门教程一Word文档格式.docx
- 文档编号:18644184
- 上传时间:2022-12-30
- 格式:DOCX
- 页数:32
- 大小:1.10MB
NAMD入门教程一Word文档格式.docx
《NAMD入门教程一Word文档格式.docx》由会员分享,可在线阅读,更多相关《NAMD入门教程一Word文档格式.docx(32页珍藏版)》请在冰豆网上搜索。
1.分子动力学模拟概论
分子动力学模拟(MolecularDynamicsSimulation)是指利用计算机软件,根据牛顿力学的基本原理,模拟大分子的相互作用和运动变化的研究方法。
生命科学的研究往往离不开各种仪器,试管和活的有机体,通过实验手段研究生命现象背后的规律。
那么,为什么我们要将生命大分子抽象成二进制数据,由计算机软件模拟其行为呢?
首先,从理论基础上讲,我们能够使用计算机模拟生物大分子的行为。
生物体系非常复杂,但生物大分子如蛋白质,脂肪,多糖等也是许多原子由化学键连接起来形成的,所有原子的运动规律都符合量子力学方程,在较大尺度上也近似符合牛顿力学方程,它的行为是要受物理学基本规律支配的。
因此我们可以将利用纯数学的手段,近似模拟生物大分子的行为.
其次,从研究需要上讲,我们不仅希望从宏观上研究生命大分子溶液体系的行为,还想直接研究单个生物大分子在原子尺度上的行为,而这是目前的实验仪器难以达到的。
比如,我们希望直接研究蛋白质从伸展的肽链折叠成球形的具体过程,使用仪器手段只能收集到间接的数据,但使用软件模拟则可以形象直观的模拟出整个折叠过程,可以具体求算每个键能、键角的变化,研究某几个氨基酸残基之间的相互作用,以及对蛋白质折叠的意义。
总之,目前的生物学研究需要我们利用计算机模拟生物大分子的行为,以弥补实验手段的限制,希望能自下而上地阐明生物大分子结构和功能的关系。
最后,从实际意义上讲,分子动力学模拟可以用来指导实验,提供思路和理论依据;
分子动力学模拟所得结果的正确性也需要回到实验验证。
这样,我们可以将分子动力学模拟和实验研究结合成一个整体,从而能够全面地,深入地研究生命现象的本质规律。
*暂缺相关文献
随着分子动力学模拟技术的飞速发展,逐步形成了一些商品化的软件。
应用于生物大分子领域的商品化分子模拟软件主要有InsightⅡ以及Sybyl,分子模拟是其中的一个重要的模块。
InsightⅡ中分子动力学模块使用的是由美国哈佛大学MartinKarplus研究小组等开发的CHARMM(ChemistryatHarvardMacromolecularMechanics),同时它本身也是一个商品化的软件。
而Amber(AssistedModelBuildingwithEnergyRefinement)则是另一个非常有名分子动力学模拟软件,它是由美国UCSF的Kollman教授的课题组开发的,商业化程度和易用性要好于CHARMM,当前版本9.0。
以上两个研究小组都为其软件开发了相应的力场,并且现在已经成为分子动力学模拟的经典力场。
此外免费和部分免费的软件有NAMD,Gromos,Gromacs,DL_POLY,Tinker等。
在上述软件中,我们选择NAMD作为本章的示范软件。
NAMD是由美国伊利诺斯大学理论与计算生物物理研究组开发的一套分子动力学模拟软件,适用于计算生物大分子,并行计算效率非常高,可以使用Amber,CHARMM,X-PLOR,GROMACS,OPLS等多种力场,而且可以兼容Amber,CHARMM的文件格式。
NAMD支持几乎所有操作系统,而且免费获取,开放源代码。
如配合分子可视化、结果分析软件VMD以及格点计算软件BioCoRE则可使用更多、更强大的功能,进行更大规模的计算,可以说集众多优势于一身。
不仅如此,利用NAMD还可以进行极具特色的IMD(InteractiveMolecularDynamics,交互式分子动力学模拟)和SMD(SteeredMolecularDynamics,可控式分子动力学模拟)。
在本教程中,我们将首先讲解使用NAMD进行分子动力学模拟的基本流程,然后讲解经典的结果分析方法,最后我们将简单介绍SMD的基本思想和过程。
2.NAMD分子动力学入门
2.1软件基本设置
NAMD的最新版本是2.6版,可以从http:
//www.ks.uiuc.edu/Research/namd/免费得到(需要进行免费注册)。
此外,我们还需要VMD作为分子可视化和辅助分析软件,可以从http:
//www.ks.uiuc.edu/Research/vmd/免费得到,最新版本是VMD1.85。
NAMD安装方法:
事实上NAMD是不需要安装的。
请新建文件夹namd-tutorial,在该目录中新建文件夹NAMD,下载完成NAMD2.6软件包后,将压缩文件解压到文件夹NAMD中,就可以使用。
下文中为了叙述方便,我们将默认读者的NAMD主程序位于../namd-tutorial/NAMD目录中(安装VMD程序时可以安装到任意目录,不影响教程操作)。
此外,本教程还需要一系列教程文件。
所需文件均可以从http:
//www.ks.uiuc.edu/Training/Tutorials/下载(图)
下载完成教程所用文件后,请把所有内容解压到namd-tutorial目录下,此后的部分我们将默认教程所用文件位于../namd-tutorial目录中。
完成上述准备之后,请打开Windows资源管理器,namd-tutorial目录的结构应该如下:
(如果目录形式不一致,请务必进行调整)
该文件夹中有我们进行动力学模拟所需的所有文件。
最后,还需要交代的是,NAMD不同于我们所熟悉的大多数Windows软件:
它不具有图形界面。
打个比方说,我们平常使用Word,Excel,Photoshop等有图形界面的软件,好像是面对面聊天;
而现在使用不具有图形界面的NAMD就像是书信往来:
动力学模拟的所有参数设定都需要用户通过一个文本文件通知NAMD,NAMD进行处理计算,然后再通过许多输出文件输出结果。
不借助其他软件,用户无法直接看到NAMD的工作状态。
由于进行动力学模拟的准备和结果的可视化分析,必不可少的软件是VMD,下面的讲解中也将大量用到VMD。
我们假定读者已经对VMD的基本操作有一定的了解。
VMD的入门教程可参见本章附录。
下面,我们将使用NAMD进行简单的分子动力学模拟,并进行初步的分析。
我们将要进行动力学模拟的分子是一个76个氨基酸的小肽:
泛素。
知识连接:
泛素——“死亡之吻”
泛素是一个由76个氨基酸组成的高度保守的多肽链,因其广泛分布于各类细胞而得名。
泛素共价地结合于底物蛋白质的赖氨酸残基,被泛素标记的蛋白质将被特异性地识别,并在蛋白酶体中迅速降解。
泛素因此得名——“死亡之吻”。
因为被其标记的蛋白都摆脱不了被降解的厄运。
随着研究的进一步深入,蛋白质降解过程中泛素的枢纽作用越来越得到重视。
蛋白质降解异常与许多疾病(恶性肿瘤,神经退行性疾患等)的发生密切相关。
而泛素在蛋白质降解中的作用机制如能被阐明,将对解释多种疾病的发生机制和有重要意义。
Hershko、Ciechanover、Rose三名杰出科学家在泛素标记的蛋白质降解方面做出了突出贡献,他们荣获2004年度诺贝尔化学奖。
使用NAMD进行分子动力学模拟之前,我们需要为NAMD准备好各种必须的数据文件,以供NAMD使用。
这些文件包括:
♦蛋白质分子的PDB文件。
该文件负责储存蛋白质中所有原子的坐标。
在后续课程中我们还会了解到,PDB文件还可以储存原子运动的速度等信息。
♦蛋白质分子的PSF文件。
该文件负责储存蛋白质的结构信息。
注意PDB文件只记录原子的空间位置,并不储存蛋白质中原子之间的成键情况。
成键情况由PSF文件负责记录。
♦力场参数文件(forcefieldfile)。
力场参数文件是分子动力学模拟的核心,文件中的数学方程决定了原子在力场中的受力如何计算。
常用的四种力场是CHAEMM,X-PLOR,AMBER和GROMACS。
NAMD可以使用以上任何一种力场进行分子动力学模拟。
♦配置文件(configurationfile)配置文件的目的是告知NAMD分子动力学模拟的各种参数,比如PDB文件和PSF文件的储存位置,结果应当储存在哪里,体系的温度等等
上述四种文件中,PDB文件通常是从蛋白质结构数据库(ProteinDataBank)中获得。
力场参数文件也可以从网上下载,而PSF文件和用户配置文件是用户根据具体要求自己生成的。
下面我们将首先制作蛋白质结构文件(PSF)。
1、单击开始菜单→程序→VMD,打开VMD窗口
2、在VMD主窗口中,单击File→NewMolecule打开MoleculeFileBrowser对话框;
单击Browse…按钮,在弹出的文件浏览中找到namd-tutorial/1-1-build文件夹,在此文件夹中选择1UBQ.pdb,单击Load按钮载入1UBQ.pdb。
提示:
关于文件后缀名
如果浏览文件时看不到“.psf”“.pdb”等后缀名,可以在“我的电脑”中选择“工具”→“文件夹选项”,在“查看”选项卡中取消“隐藏已知文件类型的扩展名”。
强烈推荐读者取消这一项,因为这还涉及到下文中的许多操作。
载入之后在图形窗口(VMD1.8.5.OpenGLDisplay)中应当可以看到下图(图):
可以看到,所有的氧原子用红色表示,碳原子以天蓝色表示(碳原子所连的键也是天蓝色,所以整个蛋白骨架为天蓝色),硫原子以黄色表示。
注意到没有出现氢原子,这是因为此结构是由X射线晶体衍射得来的,而X射线衍射一般得不到氢原子的精确位置。
注意:
蛋白周围的红点实际上是水分子,由于没有氢,所以仅显示出一个一个的氧原子。
我们只需要蛋白质分子的结构,因此下面我们将首先除去pdb文件中带有的水分子。
4、单击Extension→TKConsole菜单项,弹出VMDTkConsole窗口。
首先用cd命令改变当前目录到namd-tutorial/1-1-build下。
然后输入下列命令:
setubq[atomselecttopprotein]
$ubqwritepdbubqp.pdb
(每输入一行命令后按回车键,下同。
另外,尤其要注意空格的有无和空格的位置,否则空格位置不对可能造成命令执行错误)
VMDTKConsole(VMD控制台)中改变当前目录的方法
在Windows命令行模式中和VMDTKConsole中都是用cd命令改换当前目录的。
但是注意二者的使用方法不同。
这里简单说明VMDTKConsole中改变当前目录的方法,Windows命令行改变目录的方法将在后面说明。
在VMDTKConsole中,改变目录的命令十分简单。
无论是改变到哪一个目录,只需要输入:
cd目标目录
比如本例中,假设需要改变目录到E:
/namd-tutorial/1-1-build,无论当前目录是什么,只需要在VMDTKConsole中输入以下命令即可:
cde:
/namd-tutorial/1-1build
输入以上命令之后,VMD已经在1-1-build目录下生成了文件ubqp.pdb。
这一PDB文件仅包含泛素蛋白,不含水分子。
5、在VMD主窗口中单击1UBQ.pdb,选择Molecule→DeleteMolecule菜单项删除当前分子。
6、下面我们将生成泛素蛋白的psf文件。
VMD组件中实际上提供了一个全自动的psf文件生成器(选择Extensions→Modeling→AutomaticPSFBuilder菜单项)。
但我们将人工制作所需要的psf文件,以让读者明白制作的详细流程。
制作时,需要使用VMD提供的psfgen软件包。
7、首先,打开写字板,输入以下内容:
packagerequirepsfgen
topologytopall27_prot_lipid.inp
pdbaliasresidueHISHSE
pdbaliasatomILECD1CD
segmentU{pdbubqp.pdb}
coordpdbubqp.pdbU
guesscoord
writepdbubq.pdb
writepsfubq.psf
8、输入完成之后,保存文件。
注意文件保存在1-1-build目录中,文件名为ubq.pgn,文件类型选择文本文档。
然后退出写字板。
这样我们便制作了pgn文件,这一文件可以被psfgen软件包所识别,并处理成我们想要的psf文件。
我们需要在VMD中使用该文件调用psfgen数据包
下面我们详细介绍一下刚刚输入的每一行命令的意义:
packagerequirepsfgen:
通知VMD我们将要调用psfgen数据包
topologytopall27_prot_lipid.inp:
载入拓扑文件top_all27_prot_lipid.inp
pdbaliasresidueHISHSE:
改变组氨酸残基名,使得残基名称能够和拓扑文件中的一致。
在pdb文件中组氨酸残基名是HIS,而在拓扑文件中组氨酸残基名为HSE,HSD,HSP三种。
分别对应组氨酸的三个不同的带电荷形式。
pdbaliasatomILECD1CD:
改变异亮氨酸中的原子名。
pdb文件中异亮氨酸δ碳的名称为CD1,而拓扑文件中原子名应该为CD。
segmentU{pdbubqp.pdb}:
生成一个集合(segment)U,包含ubqp.pdb中的所有原子。
coordpdbubqp.pdbU:
从ubqp.pdb中读取坐标,比较各个原子的名称是否对应,然后旧的集合名被改换成新的名称“U”。
guesscoord:
根据拓扑文件推测缺少的原子(氢原子)的空间位置。
writepdbubq.pdb:
生成新的pdb文件,包含所有原子的坐标,包括刚刚推测出的氢原子。
writepsfubq.psf:
生成psf文件,该文件包含蛋白结构的全部信息。
知识链接:
组氨酸的三种离子模式
PDB文件中原子的命名方式
9、如果刚刚关闭了VMD,则重新打开,改变目录至1-1-build。
然后输入以下命令:
sourceubq.pgn
这样我们就成功得到了含有氢原子的psf文件。
同时,可以看到VMDTKConsole中显示出系统返回的信息。
信息显示我们的系统中有1231个原子,631个原子的坐标是推测的(图)。
现在在你的1-1-build文件夹下应当有ubq.pdb和ubq.psf两个文件。
到此为止,我们已经成功制作了下一步分子动力学模拟所需的psf文件。
2.2蛋白质的溶质化
显然在真实情况下,蛋白质不是在真空中存在下面。
所以我们需要把蛋白质放入一个水环境中,以更真实的模拟生物体内的环境。
我们可以使用两种水体环境进行动力学模拟:
♦球状水体(watersphere)。
水体包围蛋白质,四周则是真空,动力学模拟时没有周期性边界条件(periodicboundarycondition)
♦立方水体(waterbox)。
立方水体是正六面体形状的水体(不一定是正立方体)。
使用立方水体需要我们设定周期性边界条件。
2.2.1生成球状水体(watersphere)
我们将使用一个脚本文件建立球状水体。
脚本文件在1-1-build目录下,文件名是wat_sphere.tcl。
1、如果刚刚关闭了VMD,则重新打开,改变目录至1-1-build。
sourcewat_sphere.tcl
输入之后VMD将会调用脚本文件,之后VMD会反馈一系列信息(图),
2、由所给的信息我们可以看出,VMD生成了两个文件:
ubq_ws.pdb文件和ubq_ws.psf。
在最后两行还给出了生成的球状水体的质心坐标(centerofmassofsphere)和球状水体的半径(radiusofsphere),精确到小数点后第十位。
记下这些数字,以后我们还会用到。
这时在图形窗口中却会出现一个立方水体包围的蛋白质分子(图)。
不过没有关系,在VMD主窗口中可见分子名为del_water,并不是我们所要的结果。
我们的最终结果已经储存在1-1-build中,文件名分别为ubq_ws.pdb和ubq_ws.psf。
3、下面我们将看一下生成的球形水体究竟是什么样子的。
在主窗口中单击del_water分子,选择Molecule→DeleteMolecule菜单项删除该分子;
然后选择File→NewMolecule,单击Browse按钮,在1-1-build目录下找到ubq_ws.pdb文件,单击Load载入该蛋白,可以看到球状水体包围的蛋白(如图)。
说明我们已经成功地生成了球状水体包围的泛素分子。
2.2.2生成立方水体(waterbox)
下面我们将把泛素放入一个立方体状的水环境中。
我们使用的是VMD提供的solvate软件包。
该软件包位于VMD的/plugins/noarch/tcl目录下。
不过我们不需要自己找到它。
只要通知VMD我们将使用该软件包,VMD就会载入它。
1、打开VMD,选择Extensions→TKConsole菜单项,在VMDTKConsole窗口中输入:
packagerequiresolvate
这时VMD就会载入solvate软件包。
窗口返回数字:
1.2说明我们所使用的软件包是solvate1.2。
确保当前目录是1-1-build,否则用cd命令改变当前目录至1-1-build,然后输入:
solvateubq.psfubq.pdb–t5–oubq_wb
等待运行结束,VMD就调用solvate将ubq.pdb和ubq.psf所储存的蛋白放入一个立方水体中。
在图形窗口可以见到一个立方形的水体包围蛋白(如图)。
参数–t5通知程序如何确定立方体的各边长。
方法是在每个坐标方向上选择坐标最大的那个原子,然后再延伸5A,即为该方向立方体面的边界。
生成的立方水体并不一定是正立方体。
各边长取决于坐标最大(距离原点最远)的原子的位置。
还有一个参数–oubq_wb是为了通知程序生成的文件名。
运行结束后我们得到的两个文件就是ubq_wb.psf和ubq_wb.pdb。
2、在VMDTkConsole中输入:
seteveryone[atomselecttopall]
measureminmax$everyone
这时返回的数值是整个体系中离原点最近的点和最远的点的坐标。
我们需要的是整个立方体的中心,可以自己计算也可以用下面的命令:
measurecenter$everyone
这时返回的三个数值就是体系的中心。
记下这三个数值,我们以后还会用到。
返回值如图:
在开始下一节之前,我们要将生成的文件拷贝到common公用目录下以方便访问。
在Windows资源管理器中找到1-1-build目录,按Ctrl选择以下六个文件:
ubq.pdb,ubq.psf,ubq_ws.pdb,ubq_ws.psf,ubq_wb.pdb,ubq_ws.psf,然后把它们拷贝到namd-tutorial/common目录下。
此处生成的立方水体事实上过小了。
在实际应用时,应当保证水体足够大,以防止蛋白在拉伸运动时超出水环境。
也要避免在使用周期边界条件时蛋白和四周各个单元的蛋白镜像相碰撞。
周期边界条件的详细知识见下文。
此外,还应当注意的是在实际应用时应当在水环境中放入离子。
特别是当蛋白质的净电荷不为0时,更应当设定离子数目以使得整个体系是中性的。
在放入离子时应当将它们放在体系中静电势能的最低点,以节省计算时间。
因为离子总会向势能最低点自发运动。
2.3球状水体中泛素(Ubiquitin)的分子动力学模拟
在这一节中,我们将要对球状水体的泛素分子进行最简单的动力学模拟。
首先,我们要进行的分子动力学模拟的目的是什么?
我们将泛素放入球状水体中,水体周围是真空,然后NAMD会根据我们设定好的温度值按照Boltzmann-Maxwell分子速率分布给各原子赋予一定的初始速度,接下来就是要根据牛顿力学方程,求解个水分子以及蛋白质中各原子的运动轨迹。
我们得到的结果,就是模拟泛素这一小肽在溶液状态下的运动状态。
能量最小化和能量平衡(MinimizationandEquilibration)
本次动力学模拟实际包括两个过程:
能量最小化和能量平衡(MinimizationandEquilibration)。
能量最小化时,NAMD设定各原子的速度为0,然后不断改变各个原子的相对位置并计算体系总能量,搜索最低势能点,作为分子动力学模拟的初始状态。
这一过程是不记录原子运动轨迹的。
因为原子的位置改变只是因为NAMD需要搜索最低能量状态,而不是真实的相互作用引起的运动。
能量平衡是让蛋白质和水分子在设定好的环境温度(即原子的速度)下相互作用,达到能量平衡分配,整个体系达到稳定状态(熵达到极大值)。
为什么需要首先进行能量最小化?
这是因为我们提供的体系有可能包含极度扭曲,拉伸或压缩变形的键和键角。
它们是解析结构或同源模建时引入的错误结构,含有很高的能量。
如果不首先进行最小化,直接进行能量平衡,蛋白质会和水分子相互作用,恢复伸展状态,释放掉这些错误结构中的高能量。
这一过程是没有意义的——因为它是错误结构引起的反应,并不是蛋白质在溶液中的真实状态。
从而就浪费了计算时间。
不仅如此,能量释放引起的剧烈运动和相互作用最终可能使得蛋白质的行为不符合溶液中的真实行为。
所以有必要在能量平衡之前,首先人为搜索能量最低点,作为分子动力学模拟的初始状态。
一般地,分子动力学模拟包括多个能量最小化和平衡过程。
通常我们会首先将蛋白质固定而仅允许水分子运动,进行能量最小化和能量平衡;
然后允许蛋白质和水分子同时运动,再次经历能量最小化和能量平衡这一循环。
第一步的目的是使水分子达到能量最小,这通常是一个很快的过程。
然后再放开蛋白质,使整个系统达到能量最小。
这样可以减小计算量,并防止由于一开始蛋白结构很不稳定而结果产生假象。
在上一节中我们已经获得了所需要的ubq_ws.pdb和ubq_ws.psf两个文件。
对照本章开始提到NAMD所需的四个文件知,还需要有配置文件就可以提交NAMD进行动力学模拟了。
(力场参数文件在common文件夹中)。
下面我们将首先得到配置文件。
2.3.1配置文件
前面我们把使用NAMD比作写信,这里的“信”就是指的配置文件。
配置文件记录了进行动力学模拟所需的全部参数和设置,NAMD只要得到这一文件就可以按照相应指令进行操作。
对于本
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- NAMD 入门教程