书签分享收藏举报版权申诉 / 84

立即下载加入VIP,免费下载

当前位置：首页 > 小学教育 > 学科竞赛 > 分子生物学考纲Word文档格式.docx

分子生物学考纲Word文档格式.docx

文档编号：22585582
上传时间：2023-02-04
格式：DOCX
页数：84
大小：66.56KB

《分子生物学考纲Word文档格式.docx》由会员分享，可在线阅读，更多相关《分子生物学考纲Word文档格式.docx（84页珍藏版）》请在冰豆网上搜索。

分子生物学考纲Word文档格式.docx

但真核生物中DNA含量并不与生物的复杂性相一致，这种反常现象称为C值矛盾。

C值矛盾表现在：

1、结构、功能相似的同一类生物中，甚至亲缘关系十分接近的物种之间，它们的C值可相差10倍乃至上千倍。

如：

豌豆的C值为14pg，而蚕豆只有2pg。

两栖类C值的变动范围很大，为109-1011bp。

2、较低等生物的C值大于较高等生物的C值

两栖动物（1011bp）＞哺乳动物（109bp）

3、真核生物的C值之大，远远超过其基因编码所需

将内含子算上，哺乳动物的一个基因长约5-8Kb，少数10Kb，则哺乳动物应有40-60万个基因。

目前研究表明，实际基因数估计不会超过这个数值的10%（3-4万）。

有些基因的序列不编码蛋白质，则基因组中只含有2%-3%的DNA序列用于编码蛋白质。

余下那么多DNA序列具何功能？

难道不被表达的DNA序列都是调控基因吗？

目前还无法圆满解释。

第二节原核生物基因组

一、原核生物基因组的特点

1、不具备明显的核结构，只有类核，即DNA相对集中的区域。

2、基因组小，一般只有一个染色体，大多为双链环状，少数为单链或线型。

Ø

E.coliDNA分子量为2.4×

109，相当于4.2×

106bp，含3000-4000个基因；

噬菌体DNA分子长48502bp，含46个基因；

ΦX174DNA分子长5386bp，含有11个基因；

SV40病毒DNA分子量为3×

106bp，含5个基因。

3、染色体DNA并不与蛋白质固定地结合，不具核小体结构。

4、结构简练，重复序列和非编码序列很少，体现经济原则。

如：

ΦX174中非编码序列占217/5386；

T4-DNA中占282/5577，均不到5%。

5、功能密切相关的基因构成转录单元，并常转录成含多基因信息的mRNA分子，称为多顺反子mRNA。

6、有重叠基因：

同一段DNA片段可以编码2—3种蛋白质分子。

二、大肠杆菌的基因组

大肠杆菌无明显的核结构，其DNA相对地集中于类核区。

对数生长期的细胞具有2-4个类核。

E.coliDNA长度为4.2×

106bp，每个基因平均长度为1000bp，整个基因组有3000-4000个基因，目前已经定位的基因有1400多个。

功能上相关的基因串联在一起组成操纵子结构，由一个启动子转录调控。

E.coli有260多个基因具有操纵子结构。

E.coli的lac操纵子、Trp操纵子和His操纵子分别有3个、5个和9个相关酶蛋白串联在一起。

E.coli基因组中，几乎所有的基因都是单拷贝的。

基因组中几乎全都是由结构基因组成，很少有非必需的DNA。

三、噬菌体的基因组

噬菌体基因组研究得最好的有ΦX174、λ、T4等。

我们以ΦX174为例。

1、DNA为单链环状，共5386bp。

2、共有11个基因，依次为A，A'

，B，K，C，D，E，J，F，G和H。

3、由于ΦX174的DNA数量有限，因而在基因排列上更加体现经济原则

A、3个转录启动子PA、PB和PD，分别从基因A、B、D开始转录。

基因H和A之间有一强终止子信号，所有的转录都将终止。

在基因J和F之间有一弱终止子信号，部分转录终止。

B、其DNA分子绝大部分用于编码蛋白质，不翻译部分只占4%（217/5386）。

C、有重叠基因和基因内基因。

B基因在A基因之中，E基因在D基因之中。

λ噬菌体的结构特点

双链DNA噬菌体。

基因组有48502bp，共有46个基因。

整个区域分为5个区域：

头部基因、尾部基因、调控区、复制区和晚期调控区。

λ有线状分子和环状分子。

线状分子两端各有12个核苷酸的粘性末端，通过粘性末端配对，线性分子在生活周期的一定阶段可转变为环状分子

四、原核生物的重叠基因（Overlappinggenes）或嵌套基因（nestedgenes）

概念：

指一个基因的序列中，含有另一基因的部分或全部序列。

即一段序列中含有合成两个或两个以上多肽的基因。

基因重叠现象是英国分子生物学家Sanger1977年在测定噬菌体ΦX174的DNA序列是发现的。

1973年，Weiner和Weber在Qβ噬菌体（E.coli的病毒）发现基因重叠现象。

Weiner和Weber当时认为：

Pr2含量少，对病毒无关紧要，而不予关注。

后来，Weissman证实，Pr1是一种外壳蛋白，故需要量大，而Pr2产量虽少，却是组成有感染力的病毒颗粒所必需的。

1977年Sanger在“自然”杂志上发表了X174DNA的全部核苷酸序列，正式发现了重叠基因。

重叠基因有以下几种情况：

一个基因完全在另一个基因里面。

如基因B在基因A里面，基因E在基因D里面。

部分重叠，如K和C、A和C。

两个基因只有一个碱基对的重叠，如D和J。

三重重叠，如G4噬菌体的基因A、B和K。

A和C的部分重叠

A的终止密码

-ATGA-

C的起始密码

D和J部分重叠

D的终止密码

-TAATG-

J的起始密码

剑桥分子生物学家D.C.Shaw和J.E.Walker在测定噬菌体G4DNA的核苷酸的序列时，发现了三重重叠现象.

第三节真核生物基因组

一、真核生物基因组的特点

1、结构复杂、基因数庞大。

低等真核生物107—108bp

高等真核生物5×

108—1010bp

有些植物和两栖类1011bp

人109bp

2、有若干个染色体，一般不呈环状，DNA与蛋白质紧密结合形成染色体，具多个复制起始点。

3、存在核膜，DNA的转录和翻译存在时空差异。

4、有很多不编码序列（内含子，内元）或介入序列。

5、有大量的重复序列。

6、功能上密切相关的基因集中程度不如原核生物高，大多分散在不同的染色体上，但有许多基因家族和假基因存在。

7、有细胞器基因，如chlDNA，mitDNA，其密码子有特异性。

二、真核生物DNA序列的类型

（一）非重复序列（uniquesequence）

1、概念

一个基因组中只存在一个拷贝

2、含量

单拷贝序列占整个基因组的40%-60%

人：

60-65%；

牛：

55%；

小鼠：

70%；

果蝇：

79%

3、长度和类型

v750-2000bp，相当于一个结构基因的长度。

v大多数蛋白质结构基因属于单拷贝序列，如蛋清蛋白、蚕的丝心蛋白、血红蛋白和珠蛋白都是单拷贝序列。

4、作用

v放大作用，单一拷贝序列通过基因扩增可合成大量蛋白质。

v一个蚕丝心蛋白基因作为模板合成104个丝心蛋白mRNA，每个mRNA可合成105个丝心蛋白，因此，一个单拷贝蚕丝心蛋白基因就可合成109个丝心蛋白分子。

（二）轻度重复序列

一个基因组中含有2-10个拷贝。

2、类型

主要是组蛋白和tRNA等基因。

包括两种情况：

i、几个基因都具有功能，编码同一蛋白质或RNA。

ii、有的基因有功能，有的基因没有功能，如假基因。

（三）中度重复序列（moderatelyrepetitivesequence）

一个基因组含有10-104个拷贝

2、长度

平均长度为300bp，一般不是编码序列。

3、含量

占总DNA的10%-40%

20%；

果蝇：

15%

4、类型

i、短周期分散的重复序列（interspersedrepeatsequence,orinterspersedelement，SINES）：

长100-300bp，如人、爪蟾、海胆的Alu序列。

ii、长周期分散的重复序列（longinterspersedelement,LINES）:

长5000bp，如KpnI家族。

（四）、高度重复序列（highlyrepetitivesequence）

一个基因组含有大于105个拷贝，分布于着丝点,端粒区,结构基因两侧。

占总DNA的10%-60%，高等真核生物中占20%，由6-10bp组成。

3、种类

卫星DNA

三、Alu家族重复序列

1、含量

Alu家族序列占人基因组DNA总量的5%-6%

2、长度：

300bp

3、拷贝数：

5×

105个拷贝

4、Alu序列

v在170位碱基附近的AGCT是限制性内切酶AluI的酶切位点，Alu序列被AluI切割成（AG↓CT）130bp和170bp两段，故名Alu序列。

Alu序列两端都具有7-20bp的顺向重复序列，各个Alu成员的两端的顺向重复序列都不相同。

如人的两个Alu成员：

GTTTAGATAAG…Alu…GTTTAGATAAA

AAAGAAATG…Alu…AAATAAATGG

Alu序列分散在人及哺乳类动物的基因组中，与长为6000bp的单拷贝序列间隔排列。

Alu家族不只在人基因组中发现，非洲绿猴、小鼠、中国仓鼠等哺乳动物中都有。

5、功能

参与基因活化、DNA复制起始、参与前mRNA的加工等，需进一步证实。

四、KpnI家族

KpnI家族占人类基因组的3%-6%，平均长度为3500-5000bp，拷贝数为3000-4000个。

用限制性内切酶KpnI消化后，可得1.2Kb、1.5Kb、1.8Kb、1.9Kb。

五、卫星DNA（satelliteDNA）

DNA的浮力密度决定于它的G﹢C含量，G﹢C含量越高，浮力密度越大。

ρ=1.660+0.00098（G+C）%g/cm3

在高度重复序列中，常有一些AT含量很高的简单重复序列，AT含量有时高达97%（如螃蟹DNA中的卫星DNA）。

在CsCl密度梯度离心时，易与其它DNA分开，形成两个以上的峰，即含量较多的主峰和高度重复序列的小峰。

小峰在主峰旁似卫星，称为卫星DNA。

卫星DNA占总DNA的1%-30%。

人DNA有1条主带，4条卫星区带。

果蝇DNA有1条主带，3条卫星区带。

位于染色体的着丝粒部位的异染色质区

牛的卫星DNA：

ATATAT

果蝇有三个卫星DNA区带，它们是：

5'

ACAAATT3'

，重复3.6×

106次，占8%；

ACAAACT3'

，重复1.1×

107次，占25%；

ATAAACT3'

第四节基因家族

一、概念

真核生物基因组中有许多来源相同、结构相似、功能相关的一系列基因，成串地排列在一起。

这样一组基因称为基因家族。

二、分类

1、简单多基因家族

家族中只有一个或数个基因以串联方式重复排列，如rRNA、tRNA基因。

2、复杂多基因家族

由几个相关基因家族构成，基因家族之间由间隔序列隔开，并作为独立的转录单位。

海胆和果蝇的组蛋白基因及果蝇tRNA基因。

3、发育调控的复杂多基因家族

在不同组织、细胞类型、时间表达的复杂多基因家族。

珠蛋白和免疫球蛋白基因，属于不同时态表达的复杂多基因家族。

三、rRNA基因家族

高等真核生物有4种rRNA，即28S、18S、5.8S和5SrRNA。

前三种为主体rRNA，它们的基因构成重复单元，5SrRNA基因是独立的串联重复基因。

细菌和低等真核生物中，每个rRNA基因重复单元含有23S、16S和5SrRNA基因，其间插入多个tRNA，每个单元总长5500bp，构成一个转录单位。

四、5SrRNA基因的重复单元

5SrRNA由保守的120bp组成，单独成为复制单元。

每个转录单元由5S基因和非转录区组成。

真核生物中有多拷贝的5SrRNA基因，非洲爪蟾约有2万个5S基因拷贝，人类有2000个拷贝。

五、tRNA基因家族

tRNA长70—90bp，拷贝数为10至数百。

人类约有1300个tRNA基因族。

几种不同的tRNA基因串联重复，基因之间的间隔区较大。

六、组蛋白基因家族

组蛋白有H1、H2A、H2B、H3、H4共5种基因。

这5种基因串联在一起形成一个重复单元。

5种基因的排列顺序、转录方向和基因间隔区因生物种类不同而不同。

组蛋白基因家族中重复单元的数目依生物而异。

鸡：

10个；

哺乳动物：

20个；

非洲爪蟾：

40个；

100个；

海胆：

300-600个

30-40个，位于7号染色体的长臂区。

组蛋白基因缺乏内含子。

因此，间隔序列不是内含子。

七、珠蛋白基因家族

血红蛋白分子是珠蛋白的四聚体，由2个α型亚基和2个β型亚基组成，即α2β2。

α型亚基的基因位于第16号染色体上，β型亚基的基因位于第11号染色体上。

α家族包括1个活性的ξ基因、1个ψξ假基因、2个α基因和2个ψα假基因，集中在28kbp的区域内。

β家族包括ε、2个γ、δ和β基因，以及1个ψβ1假基因，分布在50kbp的区域内。

发育阶段

血红蛋白组成

胚胎期（8周前）

ξ2ε2、ξ2γ2、α2ε2

胎儿期

α2γ2

成年期

α2δ2（2%）、α2β2（97%）、α2γ2（1%）

ξ2ε2（HbGower1）

ξ2γ2（HbGower2）

α2ε2（HbGower3）

α2δ2（HbA2）、α2β2（HbA）、α2γ2（HbF）

α亚基的表达时间顺序是：

ξα

β型亚基的表达时间顺序是：

εγδβ

第五节真核生物的不连续基因（interrupted或discountinuousgene）或断裂基因（splitgene）

核苷酸序列中插入与氨基酸编码无关的DNA间隔区，使一个基因分隔成不连续的若干区段，这种不编码的间断基因称为不连续基因。

编码的序列称为外显子（exon），不编码的序列称为内含子（intron）。

二、不连续基因的发现和检测方法

1977年，Broker和Sharp等人研究腺病毒mRNA时首次发现不连续基因。

很快在SV40中也发现了不连续基因。

所有的哺乳动物、脊椎动物、高等植物及简单的真核生物、甚至少数原核生物都含有不连续基因。

检测方法

1、蛋白质序列或mRNA序列与DNA序列相比较。

2、电镜法——mRNA与DNA杂交法

将成熟mRNA分子与相应DNA进行杂交，形成DNA-RNA异源杂交双链分子，在电镜下观察到形成的R-环结构。

3、S1核酸酶制图法（Berk-sharp制图法）

步骤：

变性的基因组DNA同mRNA杂交，形成异源双链DNA-RNA杂种分子。

用S1核酸酶处理，除去没有杂交的单链的间隔子序列。

用琼脂糖凝胶电泳检测。

三、不连续基因的数目和大小

1、数目

v有些只有一个或少数几个内含子，有的含有较多的内含子。

珠蛋白：

2个；

酵母线粒体cytb：

6个

卵类粘蛋白：

6个；

卵清蛋白：

7个

卵类运铁蛋白：

16个；

伴清蛋白：

17个

α-胶原蛋白：

52个；

组蛋白：

0个

2、不同来源的间隔子的分子大小相差悬殊

vSV40基因间隔子长31bp

v人的营养不良蛋白基因间隔子长210kbp。

3、间隔子的长度一般比表达子长

卵清蛋白基因总长7700bp，而mRNA只有1859bp，间隔子总长为5841bp。

二氢叶酸还原酶（DHFR）基因总长31kb，而mRNA只有2kb，而间隔子长为29kb。

多数内含子长40-125bp，多数外显子编码30-40个氨基酸（90-120bp），短于50bp的内含子很少。

4、编码序列在进化过程中较保守，而内含子变化迅速，差异很大。

v哺乳动物二氢叶酸还原酶（DHFR）基因

四、外显子和内含子之间的关系

1、外显子和内含子联结处的共同序列

各种内含子的两端没有任何广泛的同源性和互补性；

联结处的确具有保守的共同序列。

v内含子5'

端起始的两个碱基是GT，3‘端最后两个碱基总是AG。

vGT-AG法则

2、一个基因的内含子可以是另一基因的外显子

产生多种mRNA的情况

利用多个5'

端转录起始位点

多个3'

端加polyA位点

利用不同的内含子剪接方式

以上3种情况的不同综合

五、内含子的可能功能

不存在内含子的基因

少数真核生物并不存在间隔序列，如编码干扰素、组蛋白的基因和大多数酿酒酵母的基因。

转录调控功能：

内含子通过启动子、起始位点的精确碱基配对，来阻止或增强RNA聚合酶的作用，对转录具有调控作用。

形成不同成熟的mRNA：

内含子具各种剪接信号，不同细胞选择不同的拼接点，使初始转录产物形成不同的成熟mRNA。

内含子具有自己特定的蛋白质编码，可能携带某种信号，作为基因调控的因素

第六节假基因（pseudogene）

是基因组中因突变而失活的基因，它和同一家族的活跃基因在结构上和DNA序列上有相似性，但它不具有功能，不能转录或翻译成成熟的mRNA或蛋白质，或产生过早终止的无活性的肽链，或由于错误的阅读框架形成无活性的蛋白质，这种序列称为假基因。

只有一个或两个拷贝，有时在功能基因旁边，有时很远，甚至可能在另一条染色体上

无法表达，没有用处

二、举例

最早发现假基因是在非洲爪蟾的5SrRNA基因中。

5SrRNA基因中有活性的编码序列为120bp，有101bp序列与5SrRNA基因相同，但少了19bp，不能转录，成为无活性的基因。

DNA序列分析表明，缺乏正常转录的起始信号。

假基因的ψβ1结构特点

缺乏内含子剪接加工的5‘共同序列；

polyA的信号由AATAAA突变成AATGAA；

正常的起始密码ATG被GTG所取代；

从第38氨基酸开始有20个核苷酸的缺失，造成一个终止密码，使肽链提前终止。

第七节人类基因组计划

一、HGP产生的背景

人类基因组是指人类生殖细胞所含有的全部染色体，估计有约10万个基因，由3X109bp组成。

这3X109bp如果印刷出来，其篇幅相当于13套大英百科全书。

1985年3月7日

vDulbecco在《Science》上提出了HGP的设想。

1985年6月

v美国能源部提出了HGP的初步草案。

1986年6月

v在新墨西哥州讨论了这一计划的可行性。

v在冷泉港讨论会上，主持了有关“人类基因组计划”的专家会议

1987年

v美国能源部与国家医学研究院为HGP下拨启动经费约550万美元。

v年总额近1.66亿美元。

v美国开始筹建人类基因组计划实验室。

1989年

v美国成立“国家人类基因组研究中心”。

J.Waston出任第一任主任。

1990年

v美国国会批准美国的“人类基因组计划”于10月1日正式启动。

v15年投入30亿美元，对人类全基因组分析。

v美、英、日、德、法及中国等6个国家参加，有16个实验室及1100名生物科学家、计算机专家和技术人员参与。

v搞清楚30亿对核苷酸，就好象搞清楚整个地球上的30亿对人各姓什么（假说天下只有四个姓氏！

）人的基因组就象地球那么大，一个染色体就象一个国家那么大，一个基因就象我们所在这憧楼那么大，..........还有“制图”就象在高速公路上标上路标.........等等。

二、HGP的任务

遗传学图（geneticmap）选择遗传标记以cM（摩尔根重组单位）为图距单位。

人的基因组巳有7000多个信息丰富的遗传标记，分辨率巳达0.7cM（1cM=1000Kb）;

物理学图（physicalmap）以碱基对数为图距单位，由巳知序列作为基因的物理图标，现分辨率巳达到200Kb以内;

序列图（sequencemap）分子水平的物理学图，即DNA的碱基排列图，可望在10年内完成;

转录图（transcriptionmap）转录图是基因图的雏形，现至少巳有25万个cDNA序列，并正在以每天1000多个的速度增长;

基因克隆计划:

克隆和鉴定10万个人的基因

基因组多样性计划:

群体多样性的研究；

代表基因组到个体基因组的研究。

cDNA计划:

目标是建立不同组织、不同基因在不同时期的表达“目录”，即个体基因表达的时空图;

蛋白组计划:

HGP的基因序列可马上转化为蛋白质一级结构。

仿照HGP从单一的蛋白质转向大规模的种类、结构和功能的研究。

细胞计划:

从分子水平到细胞水平的研究。

中国的HGP指导思想：

参与、分享，重点是以我们的资源，依靠我们自己的力量，为我们的子孙克隆我们自己的基因

三、HGP的意义

1、寻找基因

对现在仍无法治疗的常见病、传染病、遗传病的研究工作需要大量基因；

研制医治人类各种疾病的新一代药物需要基因；

对人类器官的再植需要基因；

对人类体能、智能的提高需要基因；

有效、大量生产人类生存所必需的肉、蛋、奶、粮食等需要基因；

新兴的生物基因产业的蓬勃发展需要基因，

2、使人类对自身的了解进一步加深

如果法律允许，每个人都可以拿到一张自己的基因组图，这张图记录着一个生命的奥秘和隐私。

假如是一个孩子，凭借这张图就可以知道这个孩子将来是什么性格，是不是色盲，会长多高，会不会秃顶，是胖是瘦，什么时候会患什么病，什么时候死亡，也就是说，基本可以知道这个孩子一生的命运。

3、有助于人类基因的表达调控研究

自杀基因

一个人会自杀，是因为

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 分子生物学

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：分子生物学考纲Word文档格式.docx
链接地址：https://www.bdocx.com/doc/22585582.html

分子生物学考纲Word文档格式.docx

热门标签