生物信息学 复习Word文件下载.docx
- 文档编号:20086775
- 上传时间:2023-01-16
- 格式:DOCX
- 页数:10
- 大小:23.60KB
生物信息学 复习Word文件下载.docx
《生物信息学 复习Word文件下载.docx》由会员分享,可在线阅读,更多相关《生物信息学 复习Word文件下载.docx(10页珍藏版)》请在冰豆网上搜索。
1.
什么是生物信息学?
(狭义和广义)
生物信息学广义的概念是指应用信息科学的方法和技术,研究生物体系和生物过程中信息的存贮、信息的内涵和信息的传递,研究和分析生物体细胞、组织、器官的生理、病理、药理过程中的各种生物信息,或者也可以说成是生命科学中的信息科学。
生物信息学狭义的概念是指应用信息科学的理论、方法和技术,管理、分析和利用生物分子数据。
2.
生物信息学的发展历史。
⏹
20世纪50年代,生物信息学开始孕育。
20世纪60年代,生物分子信息在概念上将计算生物学和计算机科学联系起来。
20世纪70年代,生物信息学的真正开端。
20世纪70年代到80年代初期,出现了一系列著名的序列比较方法和生物信息分析方法。
20世纪80年代以后,出现一批生物信息服务机构和生物信息数据库。
20世纪90年代后,HGP促进生物信息学的迅速发展。
3.人类基因组计划和基因组信息学的相互作用。
人类基因组计划简介:
人类基因组计划准备用15年时间,投入30亿美元,完成人类全部24条染色体的3×
109脱氧核苷酸对(bp)的序列测定,主要任务包括作图(遗传图谱、物理图谱的建立及转录图谱的绘制)、测序和基因识别。
其中还包括模式生物(如大肠杆菌、酵母、线虫、小鼠等)基因组的作图和测序,以及信息系统的建立。
作图和测序是基本的任务,在此基础上解读和破译生物体生老病死以及和疾病相关的遗传信息。
基因组:
一个物种中所有基因的整体组成。
人类基因组构成——24条染色体和线粒体。
建立四张图谱:
遗传图谱;
物理图谱;
序列图谱;
转录图谱。
相互作用:
4.用狭义的方式来诠释核酸序列和蛋白质结构序列。
5.生物信息学的目标和任务
收集和管理生物分子数据;
数据分析和挖掘;
开发分析工具和实用软件:
生物分子序列比较工具、基因识别工具、生物分子结构预测工具、基因表达数据分析工具。
6.生物信息学主要研究内容。
(1)生物分子数据的收集与管理;
(2)数据库搜索及序列比较;
(3)基因组序列分析;
(4)基因表达数据的分析与处理;
(5)蛋白质结构预测。
7.生物信息学所用的方法和技术。
(1)数学统计方法;
(2)动态规划方法;
(3)机器学习与模式识别技术;
(4)数据库技术及数据挖掘;
(5)人工神经网络技术;
(6)专家系统;
(7)分子模型化技术;
(8)量子力学和分子力学计算;
(9)生物分子的计算机模拟;
(10)因特网(Internet)技术。
Chapter2PPT2
生物大分子构成的三条基本原则:
(1)构成生物体各类有机大分子的单体在不同的生物中都相同;
(2)生物体内一切有机大分子的构成都遵循共同的规则;
(3)某一特定生物体所拥有的核酸及蛋白质分子决定了它的属性。
2.真核细胞和原核细胞的区别:
比较项目
原核生物
真核生物
实
例
细菌、蓝藻、放线菌、衣原体、支原体(支原体细胞最小,且无细胞壁)
酵母菌等真菌、衣藻、
高等植物、动物
细胞大小
较小(1~10微米)
较大(10~100微米)
细胞
结构
细胞壁不含纤维素,主要成分是肽聚糖;
细胞器只有一种,即核糖体;
细胞核没有核膜(这是最主要的特点)、没有核仁、没有染色质(体),但有核物质,叫拟核
细胞壁的主要成分是纤维素和果胶;
有核糖体、线粒体、内质网、高尔基体等多种细胞器;
细胞核有核膜、核仁、有染色质(体)
主要细胞
增殖方式
二分裂
有丝分裂、无丝分裂、减数分裂
代
谢
类
型
同化作用多为异养型、少数为自养型(包括光合作用和化能合成作用自养型),异化作用多为厌氧型、少数为需氧型。
光合作用的部位不是叶绿体而是在光合片层上;
有氧呼吸的主要部位不在线粒体而是在细胞膜
同化作用有的是异养型、有的为自养型,异化作用有的为厌氧型、有的为需氧型。
光合作用的部位是叶绿体;
有氧呼吸的主要部位是线粒体
生殖方式
无性生殖(多为分裂生殖)
有性生殖、无性生殖
遗传方面
遗传物质
DNA
DNA分布
拟核(控制主要性状);
质粒(控制抗药性、固氮、抗生素生成等性状)
细胞核(控制细胞核遗传),线粒体和叶绿体(控制细胞质遗传)
基因结构
编码区是连续的,无内含子和外显子
编码区是不连续的、间隔的,有内含子和外显子
基因表达
转录产生的信使RNA不需要加工;
转录和翻译通常在同一时间同一地点进行(在转录未完成之前翻译便开始进行)
转录产生的信使RNA需要加工(将内含子转录出的部分切掉,将外显子转录出的部分拼接起来);
转录和翻译不在同一时间同一地点进行(转录在翻译之前,转录在细胞核内、翻译在细胞质的核糖体)
遵循遗传规律
不遵循基因分离定律和自由组合定律
细胞核遗传遵循基因分离定律和自由组合定律,细胞质遗传不遵循基因分离定律和自由组合定律
可遗传变异的来源
基因突变
基因突变、基因重组、染色体变异
进化水平
低
高
生态系统的成分
生产者、消费者、分解者
生产者、消费者、分解
3.遗传定律(孟德尔)
4.蛋白质和DNA的构成单元。
■
氨基酸(aminoacid)是蛋白质的基本结构单位。
核苷酸是DNA的基本结构单位。
5.中心法则。
6.DNA是怎样编码的?
基因是DNA上一段特定的碱基序列,携带遗传信息,一条DNA上有几个基因并不确定,因DNA不同而不同。
三个碱基编码一个氨基酸,不同的碱基序列编码不同的氨基酸序列(即蛋白质的一级结构),氨基酸间脱水形成肽,肽经一定的盘旋折叠形成具有空间特异性结构的蛋白质,形成不同的蛋白质,即蛋白质的翻译过程。
7.蛋白质的一二三级结构。
蛋白质的一级结构是指多肽链中氨基酸的序列
蛋白质的二级结构主要有以下几种形式:
(i)螺旋;
(ii)折叠–平行折叠反平行折叠;
(iii)—转角–连接作用
(iv)无规卷曲-没有确定规律性的肽链构象,但仍然是紧密有序的稳定结构。
(v)无序结构。
蛋白质的三级结构(tertiarystructure)在二级结构基础上的肽链再折叠形成的构象。
型—主要是由螺旋所构成;
型—主要由反平行的折叠所构成,折叠片之间以转角连接;
/型—由螺旋包裹的以平行链为主的——花样所构成。
Chapter3PPT3
序列分析的任务和目的。
序列比较的根本任务是:
(1)发现序列之间的相似性;
(2)辨别序列之间的差异
目的:
相似序列相似的结构,相似的功能
判别序列之间的同源性
推测序列之间的进化关系
基本打分表。
打分矩阵(WeightMatrices)
▪
(1)核酸打分矩阵设DNA序列所用的字母表为
={A,C,G,T}
a.等价矩阵
b.BLAST矩阵
c.转移矩阵(transition,transversion)
(嘌呤:
腺嘌呤A,鸟嘌呤G;
嘧啶:
胞嘧啶C,胸腺嘧啶T)
(2)蛋白质打分矩阵
▪(i)等价矩阵
其中Rij代表打分矩阵元素
i、j分别代表字母表第i和第j个字符。
▪(ii)氨基酸突变代价矩阵GCM
▪(iii)疏水矩阵
▪(iv)PAM矩阵(PointAcceptedMutation)
▪(v)BLOSUM矩阵
(BlocksAminoAcidSubstitutionMatrices)
Chapter4PPT4
为什么要构建生物分子数据库。
(1)生物分子数据高速增长
(2)分子生物学及相关领域研究人员迅速获得最新实验数据。
2.一二级数据库(怎样查?
)Page56
一级数据库
v
数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释
二级数据库
对原始生物分子数据进行整理、分类的结果,是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立的。
3.国际上权威的核酸序列数据库
(1)欧洲分子生物学实验室的EMBL。
(2)美国生物技术信息中心的GenBank。
(3)日本遗传研究所的DDBJ。
Chapter5PPT5
1.关于密码子
(1)密码子的使用是非随机的
如果密码子的第一、第二位碱基是A、U,那么第三位将尽可能使用G、C;
反之亦然。
如果三位都用G、C,则配对容易,分解难;
三位都用A、U,则相反。
一般地说,高表达的基因,要求翻译速度快,要求密码子和反密码子配对快、分手也快。
(2)密码子的使用有一定的统计规律
对同义密码子的使用存在着偏爱
不同种属偏爱的密码子不同
人类基因组:
密码子第三位取A、U的情况占90%
而第三位取G、C仅占10%
密码子的使用偏性与基因功能、蛋白质结构相关
(3)密码子中的密码
三个碱基的位置与所编码的氨基酸性质存在着联系
例如:
•
芳香族氨基酸——以U作为第一位碱基
中间位置碱基的性质与氨基酸是亲疏水性相关
疏水氨基酸的密码子,其第二位碱基是U
亲水氨基酸的密码子,其第二位碱基是A
第二位碱基是G、C的密码子所编码的氨基酸亲水性、疏水性居中。
2.基因分析中所关注的?
原核基因识别:
重点在于识别编码区域
非翻译区域(untranslatedregions,UTR)
编码区域两端的DNA,有一部分被转录,但是不被翻译,这一部分称为非翻译区域
5’UTR---基因上游区域的非翻译区域;
3’UTR---基因下游区域的非翻译区域
对于任何给定的核酸序列(单链DNA或mRNA),根据密码子的起始位置,可以按照三种方式进行解释。
这三种阅读顺序称为阅读框(readingframes)
一个开放阅读框(ORF,openreadingframe)是一个没有终止编码的密码子序列。
原核基因识别任务的重点是识别开放阅读框,或者说识别长的编码区域。
Chapter6PPT6
什么是系统发生、系统发生学、系统发生树?
系统发生(phylogeny)——是指生物形成或进化的历史。
系统发生学(phylogenetics)——研究物种之间的进化关系。
系统发生树(phylogenetictree)——表示形式,描述物种之间进化关系。
有根数、无根树的构建。
系统发生树的构建方法分为两大类:
(1)基于距离的构建方法:
非加权组平均法;
邻近归并法;
Fitch-Margoliash法
最小进化方法
(2)基于离散特征的构建方法:
最大简约法;
最大似然法;
进化简约法;
相容性方法
Chapter7PPT7
为什么要对protein进行预测?
Page181寻找一种从蛋白质的氨基酸线性序列到蛋白质所有原子三维坐标的一种映射。
蛋白质预测的思路和方法。
思路:
蛋白质结构预测主要有两大类方法:
(1)理论分析方法
–
通过理论计算(如分子力学、分子动力学计算)进行结构预测。
(2)统计的方法
对已知结构的蛋白质进行统计分析,建立序列到结构的映射模型,进而对未知结构的蛋白质根据映射模型直接从氨基酸序列预测结构。
包括:
经验性方法
结构规律提取方法
同源模型化方法
Chapter8PPT8
生物芯片定义。
基因芯片(genechip),又称DNA微阵列(microarray),是由大量cDNA或寡核苷酸探针密集排列所形成的探针阵列,其工作的基本原理是通过杂交检测信息。
基因芯片把大量已知序列探针集成在同一个基片上,经过标记的若干靶核酸序列通过与芯片特定位置上的探针杂交,便可根据碱基互补匹配的原理确定靶基因的序列。
基因芯片(genechip),又称DNA微阵列(microarray),是由大量cDNA或寡核苷酸探针密集排列所形成的探针阵列,其工作的基本原理是通过杂交检测信息。
2、基因芯片对于生物分子信息检测的作用和意义
在生命科学领域中,基因芯片为分子生物学、生物医学等研究提供了强有力的手段。
利用基因芯片技术,可研究生命体系中不同部位、不同生长发育阶段的基因表达,比较不同个体或物种之间的基因表达,比较正常和疾病状态下基因及其表达的差异。
基因芯片技术也有助于研究不同层次的多基因协同作用的生命过程,发现新的基因功能,研究生物体在进化、发育、遗传过程中的规律。
生物信息学在基因芯片中的应用:
生物信息学在基因芯片中的应用主要体现在三个方面:
确定芯片检测目标
芯片设计
实验数据管理与分析
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物信息学 复习 生物 信息学