分子生物学考纲Word文档格式.docx
- 文档编号:22585582
- 上传时间:2023-02-04
- 格式:DOCX
- 页数:84
- 大小:66.56KB
分子生物学考纲Word文档格式.docx
《分子生物学考纲Word文档格式.docx》由会员分享,可在线阅读,更多相关《分子生物学考纲Word文档格式.docx(84页珍藏版)》请在冰豆网上搜索。
但真核生物中DNA含量并不与生物的复杂性相一致,这种反常现象称为C值矛盾。
C值矛盾表现在:
1、结构、功能相似的同一类生物中,甚至亲缘关系十分接近的物种之间,它们的C值可相差10倍乃至上千倍。
如:
豌豆的C值为14pg,而蚕豆只有2pg。
两栖类C值的变动范围很大,为109-1011bp。
2、较低等生物的C值大于较高等生物的C值
两栖动物(1011bp)>哺乳动物(109bp)
3、真核生物的C值之大,远远超过其基因编码所需
将内含子算上,哺乳动物的一个基因长约5-8Kb,少数10Kb,则哺乳动物应有40-60万个基因。
目前研究表明,实际基因数估计不会超过这个数值的10%(3-4万)。
有些基因的序列不编码蛋白质,则基因组中只含有2%-3%的DNA序列用于编码蛋白质。
余下那么多DNA序列具何功能?
难道不被表达的DNA序列都是调控基因吗?
目前还无法圆满解释。
第二节原核生物基因组
一、原核生物基因组的特点
1、不具备明显的核结构,只有类核,即DNA相对集中的区域。
2、基因组小,一般只有一个染色体,大多为双链环状,少数为单链或线型。
Ø
E.coliDNA分子量为2.4×
109,相当于4.2×
106bp,含3000-4000个基因;
噬菌体DNA分子长48502bp,含46个基因;
ΦX174DNA分子长5386bp,含有11个基因;
SV40病毒DNA分子量为3×
106bp,含5个基因。
3、染色体DNA并不与蛋白质固定地结合,不具核小体结构。
4、结构简练,重复序列和非编码序列很少,体现经济原则。
如:
ΦX174中非编码序列占217/5386;
T4-DNA中占282/5577,均不到5%。
5、功能密切相关的基因构成转录单元,并常转录成含多基因信息的mRNA分子,称为多顺反子mRNA。
6、有重叠基因:
同一段DNA片段可以编码2—3种蛋白质分子。
二、大肠杆菌的基因组
大肠杆菌无明显的核结构,其DNA相对地集中于类核区。
对数生长期的细胞具有2-4个类核。
E.coliDNA长度为4.2×
106bp,每个基因平均长度为1000bp,整个基因组有3000-4000个基因,目前已经定位的基因有1400多个。
功能上相关的基因串联在一起组成操纵子结构,由一个启动子转录调控。
E.coli有260多个基因具有操纵子结构。
E.coli的lac操纵子、Trp操纵子和His操纵子分别有3个、5个和9个相关酶蛋白串联在一起。
E.coli基因组中,几乎所有的基因都是单拷贝的。
基因组中几乎全都是由结构基因组成,很少有非必需的DNA。
三、噬菌体的基因组
噬菌体基因组研究得最好的有ΦX174、λ、T4等。
我们以ΦX174为例。
1、DNA为单链环状,共5386bp。
2、共有11个基因,依次为A,A'
,B,K,C,D,E,J,F,G和H。
3、由于ΦX174的DNA数量有限,因而在基因排列上更加体现经济原则
A、3个转录启动子PA、PB和PD,分别从基因A、B、D开始转录。
基因H和A之间有一强终止子信号,所有的转录都将终止。
在基因J和F之间有一弱终止子信号,部分转录终止。
B、其DNA分子绝大部分用于编码蛋白质,不翻译部分只占4%(217/5386)。
C、有重叠基因和基因内基因。
B基因在A基因之中,E基因在D基因之中。
λ噬菌体的结构特点
双链DNA噬菌体。
基因组有48502bp,共有46个基因。
整个区域分为5个区域:
头部基因、尾部基因、调控区、复制区和晚期调控区。
λ有线状分子和环状分子。
线状分子两端各有12个核苷酸的粘性末端,通过粘性末端配对,线性分子在生活周期的一定阶段可转变为环状分子
四、原核生物的重叠基因(Overlappinggenes)或嵌套基因(nestedgenes)
概念:
指一个基因的序列中,含有另一基因的部分或全部序列。
即一段序列中含有合成两个或两个以上多肽的基因。
基因重叠现象是英国分子生物学家Sanger1977年在测定噬菌体ΦX174的DNA序列是发现的。
1973年,Weiner和Weber在Qβ噬菌体(E.coli的病毒)发现基因重叠现象。
Weiner和Weber当时认为:
Pr2含量少,对病毒无关紧要,而不予关注。
后来,Weissman证实,Pr1是一种外壳蛋白,故需要量大,而Pr2产量虽少,却是组成有感染力的病毒颗粒所必需的。
1977年Sanger在“自然”杂志上发表了X174DNA的全部核苷酸序列,正式发现了重叠基因。
重叠基因有以下几种情况:
一个基因完全在另一个基因里面。
如基因B在基因A里面,基因E在基因D里面。
部分重叠,如K和C、A和C。
两个基因只有一个碱基对的重叠,如D和J。
三重重叠,如G4噬菌体的基因A、B和K。
A和C的部分重叠
A的终止密码
-ATGA-
C的起始密码
D和J部分重叠
D的终止密码
-TAATG-
J的起始密码
剑桥分子生物学家D.C.Shaw和J.E.Walker在测定噬菌体G4DNA的核苷酸的序列时,发现了三重重叠现象.
第三节真核生物基因组
一、真核生物基因组的特点
1、结构复杂、基因数庞大。
低等真核生物107—108bp
高等真核生物5×
108—1010bp
有些植物和两栖类1011bp
人109bp
2、有若干个染色体,一般不呈环状,DNA与蛋白质紧密结合形成染色体,具多个复制起始点。
3、存在核膜,DNA的转录和翻译存在时空差异。
4、有很多不编码序列(内含子,内元)或介入序列。
5、有大量的重复序列。
6、功能上密切相关的基因集中程度不如原核生物高,大多分散在不同的染色体上,但有许多基因家族和假基因存在。
7、有细胞器基因,如chlDNA,mitDNA,其密码子有特异性。
二、真核生物DNA序列的类型
(一)非重复序列(uniquesequence)
1、概念
一个基因组中只存在一个拷贝
2、含量
单拷贝序列占整个基因组的40%-60%
人:
60-65%;
牛:
55%;
小鼠:
70%;
果蝇:
79%
3、长度和类型
v750-2000bp,相当于一个结构基因的长度。
v大多数蛋白质结构基因属于单拷贝序列,如蛋清蛋白、蚕的丝心蛋白、血红蛋白和珠蛋白都是单拷贝序列。
4、作用
v放大作用,单一拷贝序列通过基因扩增可合成大量蛋白质。
v一个蚕丝心蛋白基因作为模板合成104个丝心蛋白mRNA,每个mRNA可合成105个丝心蛋白,因此,一个单拷贝蚕丝心蛋白基因就可合成109个丝心蛋白分子。
(二)轻度重复序列
一个基因组中含有2-10个拷贝。
2、类型
主要是组蛋白和tRNA等基因。
包括两种情况:
i、几个基因都具有功能,编码同一蛋白质或RNA。
ii、有的基因有功能,有的基因没有功能,如假基因。
(三)中度重复序列(moderatelyrepetitivesequence)
一个基因组含有10-104个拷贝
2、长度
平均长度为300bp,一般不是编码序列。
3、含量
占总DNA的10%-40%
20%;
果蝇:
15%
4、类型
i、短周期分散的重复序列(interspersedrepeatsequence,orinterspersedelement,SINES):
长100-300bp,如人、爪蟾、海胆的Alu序列。
ii、长周期分散的重复序列(longinterspersedelement,LINES):
长5000bp,如KpnI家族。
(四)、高度重复序列(highlyrepetitivesequence)
一个基因组含有大于105个拷贝,分布于着丝点,端粒区,结构基因两侧。
占总DNA的10%-60%,高等真核生物中占20%,由6-10bp组成。
3、种类
卫星DNA
三、Alu家族重复序列
1、含量
Alu家族序列占人基因组DNA总量的5%-6%
2、长度:
300bp
3、拷贝数:
5×
105个拷贝
4、Alu序列
v在170位碱基附近的AGCT是限制性内切酶AluI的酶切位点,Alu序列被AluI切割成(AG↓CT)130bp和170bp两段,故名Alu序列。
Alu序列两端都具有7-20bp的顺向重复序列,各个Alu成员的两端的顺向重复序列都不相同。
如人的两个Alu成员:
GTTTAGATAAG…Alu…GTTTAGATAAA
AAAGAAATG…Alu…AAATAAATGG
Alu序列分散在人及哺乳类动物的基因组中,与长为6000bp的单拷贝序列间隔排列。
Alu家族不只在人基因组中发现,非洲绿猴、小鼠、中国仓鼠等哺乳动物中都有。
5、功能
参与基因活化、DNA复制起始、参与前mRNA的加工等,需进一步证实。
四、KpnI家族
KpnI家族占人类基因组的3%-6%,平均长度为3500-5000bp,拷贝数为3000-4000个。
用限制性内切酶KpnI消化后,可得1.2Kb、1.5Kb、1.8Kb、1.9Kb。
五、卫星DNA(satelliteDNA)
DNA的浮力密度决定于它的G﹢C含量,G﹢C含量越高,浮力密度越大。
ρ=1.660+0.00098(G+C)%g/cm3
在高度重复序列中,常有一些AT含量很高的简单重复序列,AT含量有时高达97%(如螃蟹DNA中的卫星DNA)。
在CsCl密度梯度离心时,易与其它DNA分开,形成两个以上的峰,即含量较多的主峰和高度重复序列的小峰。
小峰在主峰旁似卫星,称为卫星DNA。
卫星DNA占总DNA的1%-30%。
人DNA有1条主带,4条卫星区带。
果蝇DNA有1条主带,3条卫星区带。
位于染色体的着丝粒部位的异染色质区
牛的卫星DNA:
ATATAT
果蝇有三个卫星DNA区带,它们是:
5'
ACAAATT3'
,重复3.6×
106次,占8%;
ACAAACT3'
,重复1.1×
107次,占25%;
ATAAACT3'
第四节基因家族
一、概念
真核生物基因组中有许多来源相同、结构相似、功能相关的一系列基因,成串地排列在一起。
这样一组基因称为基因家族。
二、分类
1、简单多基因家族
家族中只有一个或数个基因以串联方式重复排列,如rRNA、tRNA基因。
2、复杂多基因家族
由几个相关基因家族构成,基因家族之间由间隔序列隔开,并作为独立的转录单位。
海胆和果蝇的组蛋白基因及果蝇tRNA基因。
3、发育调控的复杂多基因家族
在不同组织、细胞类型、时间表达的复杂多基因家族。
珠蛋白和免疫球蛋白基因,属于不同时态表达的复杂多基因家族。
三、rRNA基因家族
高等真核生物有4种rRNA,即28S、18S、5.8S和5SrRNA。
前三种为主体rRNA,它们的基因构成重复单元,5SrRNA基因是独立的串联重复基因。
细菌和低等真核生物中,每个rRNA基因重复单元含有23S、16S和5SrRNA基因,其间插入多个tRNA,每个单元总长5500bp,构成一个转录单位。
四、5SrRNA基因的重复单元
5SrRNA由保守的120bp组成,单独成为复制单元。
每个转录单元由5S基因和非转录区组成。
真核生物中有多拷贝的5SrRNA基因,非洲爪蟾约有2万个5S基因拷贝,人类有2000个拷贝。
五、tRNA基因家族
tRNA长70—90bp,拷贝数为10至数百。
人类约有1300个tRNA基因族。
几种不同的tRNA基因串联重复,基因之间的间隔区较大。
六、组蛋白基因家族
组蛋白有H1、H2A、H2B、H3、H4共5种基因。
这5种基因串联在一起形成一个重复单元。
5种基因的排列顺序、转录方向和基因间隔区因生物种类不同而不同。
组蛋白基因家族中重复单元的数目依生物而异。
鸡:
10个;
哺乳动物:
20个;
非洲爪蟾:
40个;
100个;
海胆:
300-600个
30-40个,位于7号染色体的长臂区。
组蛋白基因缺乏内含子。
因此,间隔序列不是内含子。
七、珠蛋白基因家族
血红蛋白分子是珠蛋白的四聚体,由2个α型亚基和2个β型亚基组成,即α2β2。
α型亚基的基因位于第16号染色体上,β型亚基的基因位于第11号染色体上。
α家族包括1个活性的ξ基因、1个ψξ假基因、2个α基因和2个ψα假基因,集中在28kbp的区域内。
β家族包括ε、2个γ、δ和β基因,以及1个ψβ1假基因,分布在50kbp的区域内。
发育阶段
血红蛋白组成
胚胎期(8周前)
ξ2ε2、ξ2γ2、α2ε2
胎儿期
α2γ2
成年期
α2δ2(2%)、α2β2(97%)、α2γ2(1%)
ξ2ε2(HbGower1)
ξ2γ2(HbGower2)
α2ε2(HbGower3)
α2δ2(HbA2)、α2β2(HbA)、α2γ2(HbF)
α亚基的表达时间顺序是:
ξα
β型亚基的表达时间顺序是:
εγδβ
第五节真核生物的不连续基因(interrupted或discountinuousgene)或断裂基因(splitgene)
核苷酸序列中插入与氨基酸编码无关的DNA间隔区,使一个基因分隔成不连续的若干区段,这种不编码的间断基因称为不连续基因。
编码的序列称为外显子(exon),不编码的序列称为内含子(intron)。
二、不连续基因的发现和检测方法
1977年,Broker和Sharp等人研究腺病毒mRNA时首次发现不连续基因。
很快在SV40中也发现了不连续基因。
所有的哺乳动物、脊椎动物、高等植物及简单的真核生物、甚至少数原核生物都含有不连续基因。
检测方法
1、蛋白质序列或mRNA序列与DNA序列相比较。
2、电镜法——mRNA与DNA杂交法
将成熟mRNA分子与相应DNA进行杂交,形成DNA-RNA异源杂交双链分子,在电镜下观察到形成的R-环结构。
3、S1核酸酶制图法(Berk-sharp制图法)
步骤:
变性的基因组DNA同mRNA杂交,形成异源双链DNA-RNA杂种分子。
用S1核酸酶处理,除去没有杂交的单链的间隔子序列。
用琼脂糖凝胶电泳检测。
三、不连续基因的数目和大小
1、数目
v有些只有一个或少数几个内含子,有的含有较多的内含子。
珠蛋白:
2个;
酵母线粒体cytb:
6个
卵类粘蛋白:
6个;
卵清蛋白:
7个
卵类运铁蛋白:
16个;
伴清蛋白:
17个
α-胶原蛋白:
52个;
组蛋白:
0个
2、不同来源的间隔子的分子大小相差悬殊
vSV40基因间隔子长31bp
v人的营养不良蛋白基因间隔子长210kbp。
3、间隔子的长度一般比表达子长
卵清蛋白基因总长7700bp,而mRNA只有1859bp,间隔子总长为5841bp。
二氢叶酸还原酶(DHFR)基因总长31kb,而mRNA只有2kb,而间隔子长为29kb。
多数内含子长40-125bp,多数外显子编码30-40个氨基酸(90-120bp),短于50bp的内含子很少。
4、编码序列在进化过程中较保守,而内含子变化迅速,差异很大。
v哺乳动物二氢叶酸还原酶(DHFR)基因
四、外显子和内含子之间的关系
1、外显子和内含子联结处的共同序列
各种内含子的两端没有任何广泛的同源性和互补性;
联结处的确具有保守的共同序列。
v内含子5'
端起始的两个碱基是GT,3‘端最后两个碱基总是AG。
vGT-AG法则
2、一个基因的内含子可以是另一基因的外显子
产生多种mRNA的情况
利用多个5'
端转录起始位点
多个3'
端加polyA位点
利用不同的内含子剪接方式
以上3种情况的不同综合
五、内含子的可能功能
不存在内含子的基因
少数真核生物并不存在间隔序列,如编码干扰素、组蛋白的基因和大多数酿酒酵母的基因。
转录调控功能:
内含子通过启动子、起始位点的精确碱基配对,来阻止或增强RNA聚合酶的作用,对转录具有调控作用。
形成不同成熟的mRNA:
内含子具各种剪接信号,不同细胞选择不同的拼接点,使初始转录产物形成不同的成熟mRNA。
内含子具有自己特定的蛋白质编码,可能携带某种信号,作为基因调控的因素
第六节假基因(pseudogene)
是基因组中因突变而失活的基因,它和同一家族的活跃基因在结构上和DNA序列上有相似性,但它不具有功能,不能转录或翻译成成熟的mRNA或蛋白质,或产生过早终止的无活性的肽链,或由于错误的阅读框架形成无活性的蛋白质,这种序列称为假基因。
只有一个或两个拷贝,有时在功能基因旁边,有时很远,甚至可能在另一条染色体上
无法表达,没有用处
二、举例
最早发现假基因是在非洲爪蟾的5SrRNA基因中。
5SrRNA基因中有活性的编码序列为120bp,有101bp序列与5SrRNA基因相同,但少了19bp,不能转录,成为无活性的基因。
DNA序列分析表明,缺乏正常转录的起始信号。
假基因的ψβ1结构特点
缺乏内含子剪接加工的5‘共同序列;
polyA的信号由AATAAA突变成AATGAA;
正常的起始密码ATG被GTG所取代;
从第38氨基酸开始有20个核苷酸的缺失,造成一个终止密码,使肽链提前终止。
第七节人类基因组计划
一、HGP产生的背景
人类基因组是指人类生殖细胞所含有的全部染色体,估计有约10万个基因,由3X109bp组成。
这3X109bp如果印刷出来,其篇幅相当于13套大英百科全书。
1985年3月7日
vDulbecco在《Science》上提出了HGP的设想。
1985年6月
v美国能源部提出了HGP的初步草案。
1986年6月
v在新墨西哥州讨论了这一计划的可行性。
v在冷泉港讨论会上,主持了有关“人类基因组计划”的专家会议
1987年
v美国能源部与国家医学研究院为HGP下拨启动经费约550万美元。
v年总额近1.66亿美元。
v美国开始筹建人类基因组计划实验室。
1989年
v美国成立“国家人类基因组研究中心”。
J.Waston出任第一任主任。
1990年
v美国国会批准美国的“人类基因组计划”于10月1日正式启动。
v15年投入30亿美元,对人类全基因组分析。
v美、英、日、德、法及中国等6个国家参加,有16个实验室及1100名生物科学家、计算机专家和技术人员参与。
v搞清楚30亿对核苷酸,就好象搞清楚整个地球上的30亿对人各姓什么(假说天下只有四个姓氏!
)人的基因组就象地球那么大,一个染色体就象一个国家那么大,一个基因就象我们所在这憧楼那么大,..........还有“制图”就象在高速公路上标上路标.........等等。
二、HGP的任务
遗传学图(geneticmap)选择遗传标记以cM(摩尔根重组单位)为图距单位。
人的基因组巳有7000多个信息丰富的遗传标记,分辨率巳达0.7cM(1cM=1000Kb);
物理学图(physicalmap)以碱基对数为图距单位,由巳知序列作为基因的物理图标,现分辨率巳达到200Kb以内;
序列图(sequencemap)分子水平的物理学图,即DNA的碱基排列图,可望在10年内完成;
转录图(transcriptionmap)转录图是基因图的雏形,现至少巳有25万个cDNA序列,并正在以每天1000多个的速度增长;
基因克隆计划:
克隆和鉴定10万个人的基因
基因组多样性计划:
群体多样性的研究;
代表基因组到个体基因组的研究。
cDNA计划:
目标是建立不同组织、不同基因在不同时期的表达“目录”,即个体基因表达的时空图;
蛋白组计划:
HGP的基因序列可马上转化为蛋白质一级结构。
仿照HGP从单一的蛋白质转向大规模的种类、结构和功能的研究。
细胞计划:
从分子水平到细胞水平的研究。
中国的HGP指导思想:
参与、分享,重点是以我们的资源,依靠我们自己的力量,为我们的子孙克隆我们自己的基因
三、HGP的意义
1、寻找基因
对现在仍无法治疗的常见病、传染病、遗传病的研究工作需要大量基因;
研制医治人类各种疾病的新一代药物需要基因;
对人类器官的再植需要基因;
对人类体能、智能的提高需要基因;
有效、大量生产人类生存所必需的肉、蛋、奶、粮食等需要基因;
新兴的生物基因产业的蓬勃发展需要基因,
2、使人类对自身的了解进一步加深
如果法律允许,每个人都可以拿到一张自己的基因组图,这张图记录着一个生命的奥秘和隐私。
假如是一个孩子,凭借这张图就可以知道这个孩子将来是什么性格,是不是色盲,会长多高,会不会秃顶,是胖是瘦,什么时候会患什么病,什么时候死亡,也就是说,基本可以知道这个孩子一生的命运。
3、有助于人类基因的表达调控研究
自杀基因
一个人会自杀,是因为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分子生物学