病毒细菌基因组结构与功能Word格式文档下载.docx
- 文档编号:18944375
- 上传时间:2023-01-02
- 格式:DOCX
- 页数:45
- 大小:68.98KB
病毒细菌基因组结构与功能Word格式文档下载.docx
《病毒细菌基因组结构与功能Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《病毒细菌基因组结构与功能Word格式文档下载.docx(45页珍藏版)》请在冰豆网上搜索。
HIV如何感染免疫细胞并复制
捆绑――当HIV病毒的gp120蛋白捆绑到T-helper细胞的CD4蛋白时,HIV病毒附着到机体的免疫细胞上。
滤过性病毒核进入到T-helper细胞内部,并且病毒体的隔膜融合进细胞壁;
逆转录――滤过性病毒酶,即逆转录酶,将病毒的RNA转化为DNA;
集成――新产生的DNA被病毒整合酶运送到细胞核中,并嵌入到细胞的DNA。
HIV病毒被称之为前病毒;
复制――细胞核中的病毒DNA利用细胞自己的酶分裂产生信使RNA(mRNA)。
mRNA含有制造新的病毒蛋白的指令序列;
翻译――mRNA由细胞的酶运送出细胞核。
然后病毒就利用自然蛋白生成机制来生成病毒蛋白和酶的长链分子;
组装――RNA和病毒酶在细胞边缘聚集。
一种被称之为蛋白酶的酶将多肽切成病毒蛋白。
发育――新的HIV病毒粒子从细胞壁中收缩出来并打破环绕他们的细胞壁。
这就是封装的病毒从细胞中分离出来的过程。
HIV的基因结构特点
遗传变异率高是一个多态性病毒(结构表现出一定的差异),病毒在传播过程中突变、缺失或插入所引起
高度变异区在env基因内,相当于gp120的五个区段,gag和pol基因较少变异,是基因组的保守区域
目前已知HIV有两个型:
HIV-1:
欧洲和美洲分离的毒株的总称,亚洲地区的流行株也基本上为HIV-1
HIV-2:
西部非洲的妓女中分离的毒株
HIV-1与HIV-2的核苷酸有60%同源性
HIV-1与HIV-2的感染不同
HIV-1是主要毒株,一旦感染终身携带,进展快,预后差
HIV-2感染的潜伏期长,致病性低
没有人真正死于艾滋病
大部分的艾滋病感染者都是死于其他的传染病,这是因为他们的免疫系统已经被彻底破坏了。
艾滋病人死于感冒和死于肺癌对他们来说是一样的容易,由于身体不能与一般的疾病作斗争,最后他们会因一些小小的病症而死去
*性接触;
*受感染的静脉注射;
*母乳喂养(母亲对婴儿);
*受感染的母亲在怀孕和生产时传递给胎儿;
*输血传播(在一些对血液中的艾滋病抗体进行检测的国家这种情况很罕见)。
乙肝病毒基因组的结构和功能
乙肝病毒(hepatitisBvirus,HBV)是目前已知的感染人类的最小的双链DNA病毒
HBV的基因组结构显得特别精密浓缩,基因组DNA结构奇特
环状的部分双螺旋结构,长约3.2kb。
其中的2/3为双螺旋结构,1/3为单链,DNA中的两条链不等长
长链为负链,短链为正链
长链:
5’端与3’端无共价连接,而是与一种蛋白质共价相连
短链:
长度视病毒而异,一般长约1.6-2.8kb,约为长链的2/3。
短链之间的空隙可由病毒颗粒中的DNA聚合酶充填
为充分利用其遗传物质,通过基因重叠使病毒在很小的基因组中容纳大量的遗传信息。
因而HBV的基因组结构显得特别精密浓缩
1.重叠的基因序列比较多
2.调节序列位于基因内部
HBV节约使用遗传物质的一种方式
启动子存在于编码蛋白质序列内
增强子位于聚合酶基因中
polyA附加信号位于ORFC中
GRE(皮质激素敏感因子)位于ORFS和聚合酶基因中
GRE是与激素受体结合的DNA片段,结合后能使某一已知基因转录水平增加
GRE具有增强子特征
[1]顺式作用元件
[2]在转录的两个方向均有作用
[3]在距其调节的基因不同距离处均可起作用
细菌基因组结构与功能
细菌染色体基因组结构的特点
1.形成类核(nucleoid):
由一条环状双链DNA分子组成细菌的染色体,并相对聚集在一起,形成一个较为致密的区域
类核无核膜与胞浆分开,类核的中央部分由RNA和支架蛋白组成,外围是双链闭环的DNA超螺旋
2.染色体DNA通常与细胞膜相连:
连接点的数量随细菌生长状况和不同的生活周期而异
在DNA链上,与DNA复制、转录有关的信号区域与细胞膜优先结合
3.具有操纵子结构:
结构基因为多顺反子,若干个功能相关的结构基因串联在一起,受同一个调节区的调节
数个操纵子还可以由一个共同的调节基因(regulatorygene)即调节子(regulon)所调控
4.结构基因都是单拷贝,rRNA基因为多拷贝,基因组DNA中不编码的部份所占比例比真核细胞基因组少得多,比病毒基因组多。
5.不出现基因重叠现象:
基因组中,编码顺序一般不会重叠
具有同基因(isogene):
编码同工酶(isoenzyme)
在大肠杆菌基因组中:
两个编码分支酸(chorismicacid)变位酶的基因
两个编码乙酰乳酸(acetolactate)合成酶的基因
7.DNA分子中具有各种功能的识别区域
如:
复制起始区(OriC)复制终止区(TerC)转录启动区转录终止区
这些区域往往具有特殊的顺序,并且含有反向重复顺序
8.具有终止子(termintor):
基因或操纵子终末的特殊顺序
可使转录终止、RNA聚合酶从DNA链上脱落
终止子有强、弱之分
强终止子含有反向重复顺序,可形成茎环结构,其后面为polyT结构,无需终止蛋白参与即可使转录终止
弱终止子也有反向重复序列,但无polyT结构,需要有终止蛋白参与才能使转录终止
9.结构基因中无内含子
基因序列是连续的,因此在转录时不需要剪接加工,与真核生物不同
大肠杆菌Ecoli
大肠杆菌基因组含有3500个基因,已被定位的有900个左右,900个基因中,有260个基因已查明具有操纵子结构,定位于75个操纵子中,已知的基因中,8%的序列具有调控作用
大肠杆菌染色体基因组中已知的基因多是编码酶类的基因,合成代谢酶类基因:
氨基酸、嘌呤、,嘧啶、脂肪酸和维生素,分解代谢酶类基因:
碳、氮化合物
另外,核糖体大小亚基中50多种蛋白质的基因也已经鉴定了
具有双向复制,但不能同时进行,顺时针复制时,逆时针复制被抑制,逆时针复制时,顺时针复制被抑制
具有相关功能的基因在一个操纵子内,由一个启动子转录
大多数基因的相对位置是随机分布的如:
控制小分子合成和分解代谢的基因,大分子合成和组装的基因分布在大肠杆菌基因组的许多部位,并不集中在一起,再如:
有关糖酵解的酶类的基因分布在染色体基因组的各个部位
细菌染色体上的基因似乎没有固定的格局,相对位置的改变不会影响其功能
大肠杆菌和与其分类关系上相近的其他肠道菌,如志贺氏杆菌属(Shigella)、沙门氏菌属(Salmonella)等具有相似的基因组结构
伤寒沙门氏杆(Salmonellatyphimurium)菌与大肠杆菌的基因组结构几乎相同,有10%的基因组序列和大肠杆菌相比发生颠倒,但其基因的功能仍正常
在大肠杆菌染色体基因组中,基因都是单拷贝基因
在某种特殊环境下,需要有多拷贝基因来编码大量的基因产物
例如:
在有极少量乳糖或乳糖衍生物的培养基上,乳糖操纵子的多拷贝化可以使大肠杆菌充分利用的乳糖分子。
但是,一旦将大肠杆菌移到有丰富的乳糖培养基上,多拷贝的乳糖操纵子便没有存在的必要,相反,由于需要较长的复制时间,这种重复的多拷贝基因会重新丢失
基因组上的各个基因的位置与其功能的重要性可能有一定的联系
大肠杆菌染色体基因组中,大多数rRNA基因集中于基因组的复制起点(oriC)的位置附近。
这一位置有利于rRNA基因在早期复制后马上作为模板进行rRNA的合成以便进行核糖体组装和蛋白质的合成
真核细胞基因组结构与功能
染色体的主要化学成分
DNA蛋白质RNA
生化研究表明:
上述三类组成染色体的化学成分中,蛋白质含量约为DNA的二倍,根据组成蛋白质的氨基酸特点分为组蛋白和非组蛋白两类。
RNA含量很少,还不到DNA量的10%。
真核生物细胞中的DNA连接蛋白
组蛋白:
数量巨大,每个细胞中约6千万个拷贝,几乎与DNA等量
非组蛋白:
数百种,每种蛋白质的功能不相同
组蛋白(histones)——染色体中的碱性蛋白质
特点:
富含二种碱性氨基酸(赖氨酸和精氨酸)
根据这两种氨基酸在蛋白质分子中的相对比例将组蛋白分为五种小类型
组蛋白的等电点(pI)在7.5-10.5之间,所含的强极性氨基酸使组蛋白带上大量电荷,成为组蛋白与DNA结合及蛋白质之间的相互作用的主要化学力之一
根据所含碱性氨基酸的相对比例划分为三种类型:
富精氨酸组蛋白(H3和H4),稍富赖氨酸组蛋白(H2A和H2B)及极富赖氨酸组蛋白(H1)
五种组蛋白的氨基酸全顺序均已确定。
H3和H4的序列在各种属之间极少有差异,这种生物进化上的高度保守性预示着其功能的重要性。
其它三种组蛋白在不同种属之间存在着较大的差异
组蛋白对染色体中DNA的包装有十分重要的作用
非组蛋白(non-histoneprotein,NHP)
染色体中组蛋白以外的其它蛋白质,是一大类种类繁杂的各种蛋白质的总称,估计总数在300-600之间
分子量范围为7-80kD,等电点为3.9-9.2
高迁移率蛋白群(highmobilitygroup,HMG)
是非组蛋白中一群较丰富而不均一的蛋白,富含Asp、Glu等酸性氨基酸,为酸性蛋白质
分子量一般≤3.0×
104,在聚丙烯酰胺凝胶电泳中迁移率很高
在高等真核生物中,HMG可以分为3大类,即HMG-1/2、HMG-I(Y)和HMG-14/17
已经明确其中的一些蛋白质(如HMG14/17)在转录活性区含量丰富,可以认为是参与转录调控的蛋白质
非组蛋白功能
1.参与并调控基因表达
参与基因复制、转录及核酸修饰的酶类(如各种DNA和RNA聚合酶等)
参与转录调控的蛋白质
2.维持染色体的高级结构
非组蛋白中的核基质蛋白对于维持染色体的高级结构是必不可少的
从DNA到染色体的四级结构模型
一级结构:
核小体串珠结构二级结构:
螺线管三级结构:
超螺线管四级结构:
染色单体
核小体(nucleosome)1974年,Kornberg发现核小体核小体是所有真核生物染色体的基本结构单位
电镜观察破裂的间期细胞流出的染色质,可见染色质纤维呈非连续性颗粒状,就像一条细线上串联着许多有一定间隔的小珠状颗粒(核小体)
用小球菌核酸酶处理提取的染色质,可得到单个的核小体颗粒
对染色质进行酶解处理,通过凝胶电泳鉴定,发现:
产物是一系列不同长度的DNA片段,且这些片段之间有一个200bp左右的“阶差”
对核小体多聚体的研究,获得的结果是:
相邻多聚体之间的DNA“阶差”等于核小体单体中的DNA长度(200bp左右),且多聚体分子量总是单体分子量的整倍数
以密度梯度离心法制备核小体单体,对其中的蛋白质进行化学分析得知,每一个单体中含有H2A、H2B、H3和H4各二分子(它们构成一个八聚体),H1一分子
核小体结构
核酸酶酶解实验结果:
核小体由核心颗粒(coreparticle)和连接区DNA(linkerDNA)二部分组成
核小体单体被小球菌核酸酶处理后,随着时间延长,其降解产物(DNA片段)会逐渐缩短,从200bp降至146bp至此变为很难进一步降解的稳定状态
对此稳定降解产物进行分析,证明它是由146bp的DNA片段和H2A、H2B、H3和H4各二分子组成,这种结构称为核心颗粒(coreparticle)
H1总是随着核心颗粒的形成而消失,通常是在DNA被降解至160bp以后,提取物中H1丢失,提示H1位于“裸露”DNA与核心颗粒的毗邻区
核心颗粒外,“裸露”的DNA长度为60bp左右,
称为连接区DNA(linkerDNA)
染色体的形成——超螺旋结构
染色体的形成实际上是细胞核DNA在核小体
的基础上经多层次的进一步结构变化,形成更高层次的超螺旋结构
核小体:
染色体DNA的一级包装
由直径2nm的DNA双螺旋链绕组蛋白形成直径11nm的核小体“串珠”结构,若以每碱基对沿螺旋中轴上升距离为0.34nm计,200bpDNA(一个核小体的DNA片段)的伸展长度为68nm,形成核小体后仅为11nm(核小体直径),其长度压缩了6-7倍
螺线管纤维(solenoidalfiber)——染色体DNA二级包装
由6个核小体盘绕形成一种中空螺线管,其外径为30nm,因此,螺线管的形成使DNA一级包装又压缩小6倍
若以充分伸展的DNA双螺旋论,每个螺线管包含了408nm(6×
68nm)长度的DNA链,而每圈螺线管的长度几乎等于核小体直径,即11nm,故染色体的二级包装相当于将DNA长度压缩了近40倍
环状螺线管:
染色体DNA的三级的包装
电镜显示,由螺线管纤维缠绕在一个由某些非组蛋白构成的中心轴(centralaxis)骨架上形成的。
这显然使螺线管纤维得到了较大程度的压缩
三级包装后,DNA链被压缩的程度仍远远不足以形成能被细胞核容纳的染色体,因此,环状螺线管纤维需进一步包装
经各级包装后染色体DNA总共被压缩了数千倍(8100多倍)
真核生物基因组特点
1.基因组远远大于原核生物的基因组,具有许多复制起始点,而每个复制子的长度较小
2.真核生物基因组DNA与组蛋白结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因的基因组是双份的(即双倍体,diploid),即有两份同源的基因组
3.真核细胞基因转录产物为单顺反子。
一个结构基因经过转录生成一个mRNA分子,再翻译生成一条多肽链
4.大部分基因含有内含子,因此,基因是不连续的(断裂基因,splitgene)
5.基因组中不编码的区域多于编码的区域,存在大量重复序列,重复次数可达百万次以上
真核生物基因组DNA序列的类型
单拷贝序列中度重复序列高度重复序列多基因家族与假基因自私DNA
单拷贝顺序(低度重复顺序)
单拷贝顺序在单倍体基因组中只出现一次或数次,因而复性速度很慢
单拷贝顺序在基因组中占50-80%,如人基因组中,大约有60-65%的顺序属于这一类。
单拷贝顺序中储存了巨大的遗传信息,编码各种不同功能的蛋白质
目前尚不清楚单拷贝基因的确切数字,在单拷贝顺序中只有一小部份用来编码各种蛋白质,其他部份的功能尚不清楚
中度重复顺序
中度重复序列:
在基因组中重复数十至数万(<
105)次的重复顺序中度重复顺序。
在基因组中所占比例在不同种属之间差异很大,一般约占10-40%,在人约为12%
大多不编码蛋白质。
其功能可能类似于高度重复顺序。
但有些中度重复顺序则是编码蛋白质或rRNA的结构基因,如HLA基因,rRNA基因,tRNA基因,组蛋白基因,免疫球蛋白基因
中度重复序列middlerepeatedsequence
Alu家族KpnⅠ家族Hinf家族rRNA基因多聚dT-dG家族组蛋白基因
短分散片段(shortinterspersedrepeatedsegments,SINES)
重复顺序的平均长度:
约为300bp
在基因组中排列方式:
与平均长度约为1000bp的单拷贝顺序间隔排列
拷贝数:
10万左右
Alu家族Hinf家族,等
长分散片段(Longinterspersedrepeatedsegments,LINES)
重复顺序的长度:
大于1000bp,平均长度为3500-5000bp
与平均长度为13000bp(个别长几万bp)的单拷贝顺序间隔排列
1万左右
KpnⅠ家族,等
中度重复顺序——Alu家族
是哺乳动物基因组中含量最丰富的一种中度重复顺序家族,平均每5kb就有这样的结构
每个单位长度中有一个限制性内切酶Alu的切点(AG↓CT)
Alu可将其切成长130和170bp的两段,因而定名为Alu序列(或Alu家族)
Alu家族每个成员的长度约300bp
在单倍体人基因组中重复达30万-50万次,约占人基因组的3-6%
Alu家族在基因组中广泛分布的原因可能是:
Alu顺序可由RNA聚合酶转录成RNA分子,再经反转录酶的作用形成cDNA,然后重新插入基因组所致
Alu序列两侧存在着短的重复顺序,使得Alu顺序很象转座子,因此推测Alu顺序可能也是能够移动的
Alu家族的功能是多方面的:
可能参与hnRNA的加工与成熟
与遗传重组及染色体不稳定性有关
有形成Z-DNA的能力
可能具有转录调节作用
中度重复顺序——KpnⅠ家族
KpnⅠ家族是中度重复顺序中仅次于Alu家族的第二大家族
用限制性内切酶KpnⅠ消化人类及其它灵长类动物的DNA,在电泳谱上可以看到4个不同长度的片段,分别为1.2、1.5、1.8和1.9kb,这就是KpnⅠ家族
KpnⅠ家族成员顺序比Alu家族更长(如:
人KpnⅠ顺序长6.4kb),而且更加不均一,呈散在分布
尽管不同长度类型的KpnⅠ家族(称为亚类,subfamily)之间同源性比较小,不能互相杂交,但它们的3’端有广泛的同源性
KpnⅠ家族的拷贝数约为3000—4800个,占人体基因组的1%
与散在分布的Alu家族相似,KpnⅠ家族中至少有一部份也是通过KpnⅠ顺序的RNA转录产物的cDNA重新插入到人基因组DNA中而产生的
中度重复顺序——Hinf家族
Hinf家族:
以319bp串联重复存在于人体基因组中
用限制性内切酶HinfⅠ消化人体DNA,可以分离到这一片段
Hinf家族在单倍体基因组内约有50—100个拷贝,分散在不同的区域
319bp单位可以再分成两个亚单位,分别为172bp和147bp,它们之间有70%的同源性
中度重复顺序——多聚dT-dG家族
多聚dT-dG家族:
这一家族的基本单位是dT-dG双核苷酸,多个dT-dG双核苷酸串联重复在一起,分散于人体基因组中,这个家族的一个成员位于人类δ和β珠蛋白基因之间,含有17个dT-dG双核苷酸组成的串联重复顺序
在人基因组中,多聚dT-dG顺序达106拷贝,多聚dT-dG的平均长度为40bp
功能
可能是基因转变(geneconversion)或不等交换(unequalcrossing-over)的识别信号
dT-dG中嘌呤和嘧啶的交替顺序有助于Z-DNA的形成,在基因调节中可能起着重要的作用
rRNA基因
人类的rRNA基因位于13,14,15,21和22号染色体的核仁组织区
每个核仁组织区平均含有50个rRNA基因的重复单位
5SrRNA基因似乎全部位于1号染色体(1q42-43)上
每单倍体基因组约有1000个5SrRNA基因
真核生物rRNA基因的重复次数多
真核生物有四种rRNA(18S、28S、5S、5.8SrRNA)
基因组中
18S、28S和5.8SrRNA基因在同一转录单位
5SrRNA在低等真核生物(如:
酵母)中也和18S、28SrRNA在同一转录单位;
而在高等生物中,5SrRNA是单独转录的,而且其在基因组中的重复次数高于18S和28SrRNA基因
tRNA基因
每一种aa至少含有一个tRNA
每一种tRNA的基因拷贝有几十到几百个
同种tRNA的基因常常串联在一起形成基因簇
各基因间也有间隔区,有的还含有内含子
tRNA基因的准确重复次数比较难以估计
在非洲爪蟾中约有300个拷贝,由tRNAmet,tRNAphe,tRNAtrp及其它tRNA基因组成的3.18kb的串联重复单位
在人体单倍基因组中约有1000-2000个tRNA基因,由50-60种tRNA基因编码,每种平均重复20-30次
组蛋白基因
组蛋白基因在各种生物体内重复的次数不一样,但都在中度重复的范围内
通常每种组蛋白的基因在同一种生物中拷贝数是相同的
不同生物中组蛋白基因在基因组中的排列不一样
组蛋白基因没有一定的排列方式,而在拷贝数高等生物基因组中(>
100拷贝),大部份组蛋白基因串联重复形成基因簇
基因组中存在大量重复序列用以编码组蛋白是有其重要意义的
DNA复制时,组蛋白也要成倍增加,而且往往在DNA合成一小段后,组蛋白马上就要与其相结合,这要求在较短的时间内合成大量的组蛋白,因而需要有大量的组蛋白基因存在
超基因
人体基因组中还有几个大的基因簇,也属于中度重复序列的长分散片段。
在一个基因簇内含有几百个功能相关的基因,这些基因簇又称为超基因(Supergene),如人类主要组织相容性抗原复合体HLA和免疫球蛋白重链及轻链基因都属于超基因
超基因可能是由于基因扩增后又经过功能和结构上的轻微改变而产生的,但仍保留了原始基因的结构及功能的完整性
高度重复序列highrepeatedsequence
高度重复序列在基因组中重复频率高,可达百万(106)以上,因此复性速度很快
在基因组中所占比例随种属而异,约占10-60%,在人基因组中约占20%。
种类反向重复序列卫星DNA较复杂的重复单位组成的重复顺序
倒位(反向)重复序列reverserepeatedsequence
这种重复顺序复性速度极快,即使在极稀的DNA浓度下,也能很快复性,因此又称零时复性部分,约占人基因组的5%
反向重复序列由两个相同顺序的互补拷贝在同一DNA链上反向排列而成。
变性后再复性时,同一条链内的互补的拷贝可以形成链内碱基配对,形成发夹式或“+”字形结构
倒位重复
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 病毒 细菌 基因组 结构 功能