真核表达基础知识Word格式文档下载.docx
- 文档编号:14581719
- 上传时间:2022-10-23
- 格式:DOCX
- 页数:10
- 大小:175.27KB
真核表达基础知识Word格式文档下载.docx
《真核表达基础知识Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《真核表达基础知识Word格式文档下载.docx(10页珍藏版)》请在冰豆网上搜索。
哺乳类基因组中仅约10%的序列为蛋白质、rRNA、tRNA等编码,其余约90%的序列功能至今还不清楚。
▲原核生物的基因为蛋白质编码的序列绝大多数是连续的,而真核生物为蛋白质编码的基因绝大多数是不连续的,即有外显子(exon)和内含子(intron),转录后需经剪接(splicing)去除内含子,才能翻译获得完整的蛋白质,这就增加了基因表达调控的环节。
▲原核基因组中除rRNA、tRNA基因有多个拷贝外,重复序列不多。
哺乳动物基因组中则存在大量重复序列(repetitivesequences)。
用复性动力学等实验表明有三类重复序列:
①高度重复序列(highlyrepetitivesequences),这类序列一般较短,长10-300bp,在哺乳类基因组中重复106次左右,占基因组DNA序列总量的10-60%,人的基因组中这类序列约占20%,功能还不明了。
②中度重复序列(moderatelyrepetitivesequences),这类序列多数长100-500bp,重复101-105次,占基因组10-40%。
例如哺乳类中含量最多的一种称为Alu的序列,长约300bp,在哺乳类不同种属间相似,在基因组中重复3-×
105次,在人的基因组中约占7%,功能也还不很清楚。
在人的基因组中18S/28SrRNA基因重复280次,5SrRNA基因重复2000次,tRNA基因重复1300次,5种组蛋白的基因串连成簇重复30-40次,这些基因都可归入中度重复序列范围。
③单拷贝序列(singlecopysequences)。
这类序列基本上不重复,占哺乳类基因组的50-80%,在人基因组中约占65%。
绝大多数真核生物为蛋白质编码的基因在单倍体基因组中都不重复,是单拷贝的基因。
从上述可见真核基因组比原核基因组复杂得多,至今人类对真核基因组的认识还很有限,使现在国际上制订的人基因组研究计划(humangeneproject)完成,绘出人全部基因的染色体定位图,测出人基因组109bp全部DNA序列后,要搞清楚人全部基因的功能及其相互关系,特别是要明了基因表达调控的全部规律,还需要经历很长期艰巨的研究过程。
二、真核基因表达调控的特点
尽管我们现在对真核基因表达调控知道还不多,但与原核生物比较它具有一些明显的特点。
(一)真核基因表达调控的环节更多
如前所述,基因表达是基因经过转录、翻译、产生有生物活性的蛋白质的整个过程。
同原核生物一样,转录依然是真核生物基因表达调控的主要环节。
但真核基因转录发生在细胞核(线粒体基因的转录在线粒体内),翻译则多在胞浆,两个过程是分开的,因此其调控增加了更多的环节和复杂性,转录后的调控占有了更多的分量。
图19-13扼要地列出真核基因表达的各个可能的环节。
图19-13 真核生物基因表达调控的可能环节
图19-13总结了以前章节叙述过的基因表达过程,并作了一些新补充。
图中标出了真核细胞在分化过程中会发生基因重排(generearrangement),即胚原性基因组中某些基因会再组合变化形成第二级基因。
例如编码完整抗体蛋白的基因是在淋巴细胞分化发育过程中,由原来分开的几百个不同的可变区基因经选择、组合、变化,与恒定区基因一起构成稳定的、为特定的完整抗体蛋白编码的可表达的基因。
这种基因重排使细胞可能利用几百个抗体基因的片段,组合变化而产生能编码达108种不同抗体的基因,其中就有复杂的基因表达调控机理。
此外,真核细胞中还会发生基因扩增(geneamplification),即基因组中的特定段落在某些情况下会复制产生许多拷贝。
最早发现的是蛙的成熟卵细胞在受精后的发育过程中其rRNA基因(可称为rDNA)可扩增2000倍,以后发现其他动物的卵细胞也有同样的情况,这很显然适合了受精后迅速发育分裂要合成大量蛋白质,需要有大量核糖体。
又如MTX(methotrexate)是叶酸的结构类似物,一些哺乳类细胞会对含有利用叶酸所必需的二氢叶酸还原酶(dihydrofolatereductase,DHFR)基因的DNA区段扩增40?
00倍,使DHFR的表达量显著增加,从而提高对MTX的抗性。
基因的扩增无疑能够大幅度提高基因表达产物的量,但这种调控机理至今还不清楚。
(二)真核基因的转录与染色质的结构变化相关
真核基因组DNA绝大部分都在细胞核内与组蛋白等结合成染色质,染色质的结构、染色质中NA和组蛋白的结构状态都影响转录,至少有以下现象:
1.染色质结构影响基因转录 细胞分裂时染色体的大部分到间期时松开分散在核内,称为常染色质(euchromatin),松散的染色质中的基因可以转录。
染色体中的某些区段到分裂期后不像其他部分解旋松开,仍保持紧凑折叠的结构,在间期核中可以看到其浓集的斑块,称为异染色质(heterochromatin),其中从未见有基因转录表达;
原本在常染色质中表达的基因如移到异染色质内也会停止表达;
哺乳类雌体细胞2条X染色体,到间期一条变成异染色质者,这条X染色体上的基因就全部失活。
可见紧密的染色质结构阻止基因表达。
2.组蛋白的作用 早期体外实验观察到组蛋白与DNA结合阻止DNA上基因的转录,去除组蛋基因又能够转录。
组蛋白是碱性蛋白质,带正电荷,可与DNA链上带负电荷的磷酸基相结合,从而遮蔽了DNA分子,妨碍了转录,可能扮演了非特异性阻遏蛋白的作用;
染色质中的非组蛋白成分具有组织细胞特异性,可能消除组蛋白的阻遏,起到特异性的去阻遏促转录作用。
发现核小体后,进一步观察核小体结构与基因转录的关系,发现活跃转录的染色质区段,有富含赖氨酸的组蛋白(H1组蛋白)水平降低,H2A·
H2B组蛋白二聚体不稳定性增加、组蛋白乙酰化(acetylation)和泛素化(ubiquitination),以及H3组蛋白巯基化等现象,这些都是核小体不稳定或解体的因素或指征。
转录活跃的区域也常缺乏核小体的结构。
这些都表明核小体结构影响基因转录。
3.转录活跃区域对核酸酶作用敏感度增加 染色质DNA受DNaseⅠ作用通常会被降解成00、400……bp的片段,反映了完整的核小体规则的重复结构。
但活跃进行转录的染色质区域受DNaseⅠ消化常出现100-200bp的DNA片段,且长短不均一,说明其DNA受组蛋白掩盖的结构有变化,出现了对DNaseⅠ高敏感点(hypersensitivesite)。
这种高敏感点常出现在转录基因的5′侧区(5′flankingregion)、3′末端或在基因上,多在调控蛋白结合位点的附近,分析该区域核小体的结构发生变化,可能有利于调控蛋白结合而促进转录。
4.DNA拓扑结构变化 天然双链DNA的构象大多是负性超螺旋。
当基因活跃转录时,RNA聚合酶转录方向前方DNA的构象是正性超螺旋,其后面的DNA为负性超螺旋。
正性超螺旋会拆散核小体,有利于RNA聚合酶向前移动转录;
而负性超螺旋则有利于核小体的再形成。
5.DNA碱基修饰变化 真核DNA中的胞嘧啶约有5%被甲基化为5甲基胞嘧啶(5methylcytidine,m5C),而活跃转录的DNA段落中胞嘧啶甲基化程度常较低。
这种甲基化最常发生在某些基因5′侧区的CpG序列中,实验表明这段序列甲基化可使其后的基因不能转录,甲基化可能阻碍转录因子与DNA特定部位的结合从而影响转录。
如果用基因打靶的方法除去主要的DNA甲基化酶,小鼠的胚胎就不能正常发育而死亡,可见DNA的甲基化对基因表达调控是重要的。
由此可见,染色质中的基因转录前先要有一个被激活的过程,但目前对激活机制还缺乏认识。
(三)真核基因表达以正性调控为主
真核RNA聚合酶对启动子的亲和力很低,基本上不依靠自身来起始转录,需要依赖多种激活蛋白的协同作用。
真核基因调控中虽然也发现有负性调控元件,但其存在并不普遍;
真核基因转录表达的调控蛋白也有起阻遏和激活作用或兼有两种作用者,但总的是以激活蛋白的作用为主。
即多数真核基因在没有调控蛋白作用时是不转录的,需要表达时就要有激活的蛋白质来促进转录。
换言之:
真核基因表达以正性调控为主导。
三、真核基因转录水平的调控
真核细胞的三种RNA聚合酶(Ⅰ、Ⅱ和Ⅲ)中,只有RNA聚合酶Ⅱ能转录生成mRNA,以下主要讨论RNA聚合酶Ⅱ的转录调控。
(一)顺式作用元件(cisactingelements)
真核基因的顺式调控元件是基因周围能与特异转录因子结合而影响转录的DNA序列。
其中主要是起正性调控作用的顺式作用元件,包括启动子(promoter)、增强子(enhancer);
近年又发现起负性调控作用的元件棗沉寂子(silencer)。
1.启动子 与原核启动子的含义相同,是指RNA聚合酶结合并起动转录的DNA序列。
但真核同启动子间不像原核那样有明显共同一致的序列,而且单靠RNA聚合酶难以结合DNA而起动转录,而是需要多种蛋白质因子的相互协调作用,不同蛋白质因子又能与不同DNA序列相互作用,不同基因转录起始及其调控所需的蛋白因子也不完全相同,因而不同启动子序列也很不相同,要比原核更复杂、序列也更长。
真核启动子一般包括转录起始点及其上游约100-200bp序列,包含有若干具有独立功能的DNA序列元件,每个元件约长7-30bp。
最常见的哺乳类RNA聚合酶Ⅱ启动子中的元件序列见表19-1。
表19-1 哺乳类RNA聚合酶Ⅱ启动子中常见的元件
元件名称
共同序列
结合的蛋白因子
名称
分子量
结合DNA长度
TATAbox
TATAAAA
TBP
30,000
~10bp
GCbox
GGGCGG
SP-1
105,000
~20bp
CAAbox
GGCCAATCT
CTF/NF1
60,000
~22bp
Octamer
ATTTGCAT
Oct-1
76,000
Oct-2
53,000
kB
GGGACTTTCC
NFkB
44,000
ATF
GTGACGT
AFT
?
20bp
启动子中的元件可以分为两种:
①核心启动子元件(corepromoterelement) 指RNA聚合酶起始转录所必需的最小的DNA序列,包括转录起始点及其上游-25/-30bp处的TATA盒。
核心元件单独起作用时只能确定转录起始位点和产生基础水平的转录。
②上游启动子元件(upstreampromoterelement) 包括通常位于-70bp附近的CAAT盒和GC盒、以及距转录起始点更远的上游元件。
这些元件与相应的蛋白因子结合能提高或改变转录效率。
不同基因具有不同的上游启动子元件,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 表达 基础知识