基因和基因组.ppt
- 文档编号:30871145
- 上传时间:2024-09-12
- 格式:PPT
- 页数:78
- 大小:3.94MB
基因和基因组.ppt
《基因和基因组.ppt》由会员分享,可在线阅读,更多相关《基因和基因组.ppt(78页珍藏版)》请在冰豆网上搜索。
第一节第一节基因的概念与结构基因的概念与结构一、一、基因的概念基因的概念
(一)基因概念的发展
(一)基因概念的发展1
(二)基因的概念
(二)基因的概念侧翼序列:
侧翼序列:
含有调控序列含有调控序列是编码是编码RNARNA或一条多肽或一条多肽链的链的DNADNA片段,包括:
片段,包括:
编码序列:
编码序列:
外显子外显子(exon)插入序列:
插入序列:
内含子内含子(intron)21.原核生物的结构基因是原核生物的结构基因是连续的连续的
(一)
(一)结构基因结构基因基因中编码基因中编码RNARNA或蛋白质或蛋白质的的DNA序列。
序列。
二、二、基因的结构基因的结构3真核生物结构基因真核生物结构基因DNAmRNA前体前体编码序列不连续编码序列不连续,称为称为断裂基因断裂基因(interruptedgene)RNA剪接剪接2.2.由由外显子外显子(编码序列(编码序列)和和内含内含子子(非编码序列(非编码序列)两部分组成,两部分组成,intronexon成熟成熟mRNA45533exon3exon1exon2GTAGGTAG真核基因中真核基因中RNA剪接的识别信号剪接的识别信号内含子的内含子的5端以端以GTGT开始,开始,3端以端以AGAG结束。
结束。
GT-AGGT-AG法则法则intron2intron13.3.553exon3exon2exon1intron1intron2(二二)转录调控序列转录调控序列前导序列前导序列尾部序列尾部序列编码区编码区侧翼序列侧翼序列侧翼序列侧翼序列结构基因编码区两侧的一段不被翻译结构基因编码区两侧的一段不被翻译的的DNADNA片段片段(侧翼序列侧翼序列),参与转录调控。
参与转录调控。
6tayzopstructuralgene1.1.原核生物基因的调控序列原核生物基因的调控序列promoter启动子启动子promoterterminator终止子终止子terminatoroperator操纵元件操纵元件operator72.2.真核生物基因的调控序列真核生物基因的调控序列反式作用因子反式作用因子trans-actingfactor能识别和结合特定的顺能识别和结合特定的顺式作用元件式作用元件,并影响基因并影响基因转录的一类转录的一类蛋白质蛋白质或或RNARNA顺式作用元件顺式作用元件cis-actingelement能能影响基因表达,影响基因表达,但不编码但不编码RNARNA和蛋和蛋白质的白质的DNADNA序列序列TATAAAATATTT5335顺式作用元件顺式作用元件8TATA盒盒(TATABox):
位于位于-25-25-30-30bpbp,TATAAAA/TATATAT与与TFII结合,启动基因转录。
结合,启动基因转录。
(1)
(1)启动子和上游启动子元件启动子和上游启动子元件-25-25+1+1-30-30(II类类)9-30-30-25-25+1+1-80-80-70-70CAAT盒(盒(CAATBoxCAATBox)位于位于-70-80bp,GGC/TCAATCT,与与CTF结合,决定启动子转录效率。
结合,决定启动子转录效率。
10GCGC盒(盒(GCBoxGCBox)位于位于-35bp,GGCGG,与转录因,与转录因子子SP1SP1结合,促进转录的过程。
结合,促进转录的过程。
35-35-35+1+111
(2).
(2).增强子(增强子(enhancerenhancer)CAATbox与转录因子特异性结合,增强与转录因子特异性结合,增强转录活性,在基因任意位置都有效、转录活性,在基因任意位置都有效、无方向性。
无方向性。
TATAboxenhancerpromoter53exonintron125-AATAAA-GT-3DNAmRNA前体前体5-AAUAAA-GU-35-AAUAAA-AAAAAAAA3多聚腺苷酸化多聚腺苷酸化mRNA(3).Poly(A)加尾信号加尾信号Poly(A)聚合酶聚合酶5-AAUAAA-GU-3特异因子特异因子含有含有IIII类启动子的基因,基因末端保类启动子的基因,基因末端保守的守的AATAAA顺序及下游顺序及下游GT或或T富含区富含区,被多聚腺苷酸化特异因子识别,在被多聚腺苷酸化特异因子识别,在mRNA3端加约端加约200200个个A。
13CAATboxTATAboxEnhancerpromoter调控序列调控序列调控序列调控序列真核生物基因的结构真核生物基因的结构exonexon非翻译区非翻译区:
untranslatedregions,UTRUTRUTRPoly(A)加尾信号加尾信号5+1Stop3结构基因结构基因intronintronexonTGAATG开放阅读框开放阅读框:
openreadingframe,ORFresponseelement14三、中心法则三、中心法则centraldogmaReplicationReplicationReverseTranscriptionTranscriptionTranslationDNARNAProtein15(一一)原核生物的原核生物的mRNAmRNA是多顺反子是多顺反子mRNAmRNAPromoterGene1Gene2Gene3TerminatorDNATranscriptionmRNA31235TranslationProteins123多顺反子多顺反子mRNAmRNA(polycistronicmRNA):
):
原核生物的一个原核生物的一个mRNAmRNA分子带有几个分子带有几个结构基因的遗传信息,利用共同的启动结构基因的遗传信息,利用共同的启动子及终止信号,组成操纵子的基因表达子及终止信号,组成操纵子的基因表达调控单元。
调控单元。
16TranslationTranscriptionmRNADNAProteinPromoterGene35(二二)单顺反子单顺反子mRNAmRNA(monocistronicmRNA):
):
真核生物的一个编码基因转录真核生物的一个编码基因转录生成一个生成一个mRNAmRNA。
17基因组基因组:
一个细胞或病毒的全部:
一个细胞或病毒的全部遗传信息;遗传信息;第二节第二节基因组基因组一套完整的单倍体的遗传一套完整的单倍体的遗传物质的总合;物质的总合;含有一种生物的一整套遗含有一种生物的一整套遗传信息的遗传物质;传信息的遗传物质;18C值值(C-value):
):
单倍体基因组中的全部单倍体基因组中的全部DNADNA量量(bpbp)1010661010771010881010991010101010101111显花植物骨鱼类哺乳类甲壳类爬行类鸟类藻类真菌革兰氏阳性菌革兰氏阴性菌枝原体霉菌蠕虫类软体动物棘皮类昆虫类软骨鱼类两栖类19一、病毒基因组一、病毒基因组DNA病毒病毒RNA病毒病毒
(一)基本结构
(一)基本结构多数为双链多数为双链(ds)、环状或线性环状或线性多数为单链多数为单链(ss)、线性线性20
(二)
(二)RNARNA病毒基因组病毒基因组类型类型特点特点代表种类代表种类211.1.单股正链单股正链RNARNA病毒病毒SARSSARS冠状病毒冠状病毒SARSSARScoronaviruscoronavirus包膜蛋白包膜蛋白膜蛋白膜蛋白核衣壳核衣壳蛋白蛋白刺突刺突蛋白蛋白病毒病毒RNARNA聚合酶聚合酶22单股正链单股正链RNARNA、不分节段,不分节段,55端有甲基化帽,端有甲基化帽,33端有端有poly(A)poly(A)结构。
结构。
脊髓脊髓灰质炎病毒、鼻病毒、灰质炎病毒、鼻病毒、多数多数RNARNA噬菌体、噬菌体、冠状病冠状病毒毒23.禽流感病毒禽流感病毒(H5N1)avianinfluenzaAvirus2.2.单股负链单股负链RNARNA病毒病毒88节段节段-ssRNA-ssRNA血凝素(血凝素(HAHA)神经氨酸酶(神经氨酸酶(N)N)24单股负链单股负链RNARNA、88节段,均编码蛋白质,节段,均编码蛋白质,55端由相同的端由相同的1313个核苷酸组成,个核苷酸组成,33端有端有1212个保守的核苷酸序列。
个保守的核苷酸序列。
流感病毒流感病毒、滤泡性口腔炎病毒、滤泡性口腔炎病毒、狂犬病毒狂犬病毒25呼肠孤病毒呼肠孤病毒reovirusreovirus3.3.双链双链RNARNA病毒病毒1111节段节段dsRNAdsRNA内衣内衣壳蛋壳蛋白白外衣壳外衣壳蛋白蛋白26正负双链正负双链RNARNA,10101212节段、节段、每段编码一个蛋白质每段编码一个蛋白质呼肠孤病毒、呼肠孤病毒、轮状病毒、轮状病毒、噬菌体噬菌体66274.4.逆转录病毒逆转录病毒(retrovirusretrovirus)核心蛋白核心蛋白逆转录酶逆转录酶膜蛋白膜蛋白poly(A)poly(A)CapCap人类免疫缺陷病毒(人类免疫缺陷病毒(HIVHIV)28单股正链单股正链RNARNA,有三个基本的结构有三个基本的结构基因:
基因:
gaggag、polpol(逆转录酶逆转录酶)、)、envenv,白血病病毒、肉瘤病毒、白血病病毒、肉瘤病毒、人类免疫缺陷病毒人类免疫缺陷病毒55端有甲基化帽,端有甲基化帽,33端有端有poly(A)poly(A),另有多个基因表达调控位点。
另有多个基因表达调控位点。
29(三)(三)DNADNA病毒基因组病毒基因组类型类型特点特点代表种类代表种类301.1.线性双链线性双链DNADNA病毒病毒早期蛋白(早期蛋白(EE)晚期蛋白(晚期蛋白(LL)腺病毒腺病毒adenovirusadenovirusE1AE1BE3E4E2BE2A0102030405060708090100%L2L3L4L5L1ITRITRITRITRITR:
ITR:
反向末端重复序列反向末端重复序列31反向末端重复序列反向末端重复序列(invertedterminalrepeatinvertedterminalrepeat,ITRITR)ATAT丰富区保守序列:
丰富区保守序列:
ATAATATACCATAATATACCGCGC丰富区保守序列:
丰富区保守序列:
GGGCGG,TGACGTGGGCGG,TGACGT在病毒复制过程有重要作用在病毒复制过程有重要作用基因组:
线性双链基因组:
线性双链DNADNA,编码两大类编码两大类蛋白蛋白早期蛋白(早期蛋白(EE)、)、晚期蛋白(晚期蛋白(LL)32乳头瘤病毒乳头瘤病毒papillomaviruspapillomavirusURR2.2.双链环状双链环状DNADNA病毒病毒衣壳衣壳蛋白蛋白DNA复制复制膜信号蛋白膜信号蛋白组装与释放组装与释放中断细胞生长周期中断细胞生长周期上游调节区上游调节区转录转录与复制与复制33基因组:
双链环状基因组:
双链环状DNADNA,可分为早期区(可分为早期区(EE)、)、晚期区(晚期区(LL)、)、上游调节区(上游调节区(upstreamregulatoryupstreamregulatoryregion,URRregion,URR)调节转录与复制调节转录与复制343.3.单链环状单链环状DNADNA病毒病毒5387nt噬菌体噬菌体phiX174phiX174基因重叠基因重叠53875387ntnt编码编码2500AA2500AA1977,Sanger35乙型肝炎病毒(乙型肝炎病毒(HBVHBV)4.4.开环部分双链开环部分双链DNADNA病毒病毒聚合酶聚合酶HBsAgHBcAg36乙型肝炎病毒(乙型肝炎病毒(HBVHBV)逆转录酶逆转录酶HBsAgHBcAgHBeAg开环部分双链开环部分双链DNA病毒病毒37二、原核生物基因组二、原核生物基因组细菌染色体细菌染色体DNADNA质粒质粒DNADNA以大肠杆菌以大肠杆菌(Escherichiacoli)为例为例38类核(类核(nucleoid):
):
细菌染色体在细菌染色体在细胞内形成的一个致密区域细胞内形成的一个致密区域大肠杆菌细胞结构大肠杆菌细胞结构nucleoidnucleoid质粒质粒plasmid39大肠杆菌染色体结构大肠杆菌染色体结构蛋白质蛋白质核心核心超螺旋超螺旋DNADNA环环40
(一)由一条环状双链
(一)由一条环状双链DNADNA分子组成,分子组成,通常只有一个通常只有一个DNADNA复制起点。
复制起点。
C-Value:
4.6106bp大肠杆菌染色体大肠杆菌染色体DNADNA大肠杆菌大肠杆菌40004000KK30003000KK20002000KK10001000KK00OriCOriCTerCTerC41(二二)结构基因大多组成操纵子结构基因大多组成操纵子乳糖操纵子乳糖操纵子lacoperontayzopstructuralgenepromoterterminatoroperator-galactosidase半乳糖苷酶半乳糖苷酶z-galactosidepermease透酶透酶y-galactosidetransacetylase半乳糖苷乙酰转移酶半乳糖苷乙酰转移酶a42多个功能相关的结构基因多个功能相关的结构基因成簇串联排列,与上游共同的成簇串联排列,与上游共同的调控区和下游转录终止信号组调控区和下游转录终止信号组成的基因表达单位。
成的基因表达单位。
操纵子操纵子operon:
operon:
43(三)其它结构特点(三)其它结构特点C值:
值:
4,639,2214,639,221bpbp基因数:
基因数:
42884288基因大小:
基因大小:
950950bp/genebp/gene基因间隔:
基因间隔:
118118bp/bp/genegene1.1.基因密度非常高,编码区在基因密度非常高,编码区在基因组中所占比例大;基因组中所占比例大;2.2.结构基因没有内含子,多为结构基因没有内含子,多为单拷贝,单拷贝,rRNArRNA基因为多拷贝;基因为多拷贝;3.3.重复序列很少,重复片段为重复序列很少,重复片段为转座子;转座子;50kb444.4.有编码同工酶的同基因(有编码同工酶的同基因(isogene)分支酸别构酶分支酸别构酶ilvBNacetolactatesynthaseIilvIHacetolactatesynthaseIII乙酰乳酸合酶乙酰乳酸合酶entCisochorismatesynthaseentBisochorismatase455.5.不同的原核生物基因组的不同的原核生物基因组的GCGC含量含量(GCcontentGCcontent)变化很大变化很大(25%-75%)(25%-75%)EscherichiacoliMicrococcusluteus藤黄微球菌藤黄微球菌BacillussubtilisSerratiamarcescens枯草杆菌枯草杆菌粘质沙雷菌大肠杆菌大肠杆菌%GC5151525558523766614345333925757369Shigellaflexnerl志贺氏杆菌(痢疾)志贺氏杆菌(痢疾)Salmonellatyphimurium鼠伤寒沙门菌Klebsiellapneumoniae肺炎克雷伯士氏杆菌肺炎克雷伯士氏杆菌Mycopiasmacapricolum支原体支原体46(四)非编码区主要是调控序列:
(四)非编码区主要是调控序列:
复制起始区(复制起始区(OriCOriC)复制终止区(复制终止区(TerCTerC)转录起动区转录起动区转录终止区转录终止区47复制起始区(复制起始区(OriCOriC)48大肠杆菌强启动子大肠杆菌强启动子TTGACTATAATTTGACTATAAT转录起始转录起始49GACCGCCGCUGGCGGCAUUUU-OH35UUCGG5GCCGCCAGUUCGGCUGGCGGCAUUUU3RNA5GCCGCCAGTTCGGCTGGCGGCATTTT3DNA终止子:
终止子:
强终止子:
有反向重复顺强终止子:
有反向重复顺序,可形成茎环结构,其序,可形成茎环结构,其后面为后面为poly(T)poly(T)结构,转结构,转录终止无需录终止无需因子。
因子。
GCGC丰富区、丰富区、ATAT丰富区丰富区50(五)具有转座现象(五)具有转座现象BarbaraMcClintock1902-1992转座转座,或称移位,或称移位(transposition):
转座因子在基因组转座因子在基因组不同位置间的移动。
不同位置间的移动。
511.1.转座因子的类别转座因子的类别Is3转座酶转座酶
(1)
(1)插入序列插入序列(insertionsequence,Is)小于小于20002000bpbp,只有转座相关基因只有转座相关基因2kb52Tn3转座酶转座酶Tn10转座酶转座酶
(2)
(2)转座子转座子(transposon,Tn)2-20kb2-20kb,常带有抗性基因等其它基因常带有抗性基因等其它基因氨苄青霉素抗性氨苄青霉素抗性四环素抗性四环素抗性2kb53(3)Mu(3)Mu噬菌体(噬菌体(MuMu)转座酶转座酶头尾部蛋白头尾部蛋白转座酶转座酶结合位点结合位点转座酶转座酶结合位点结合位点宿主宿主DNADNA宿主宿主DNADNA3737kbkbAB54切离是转座因子从原切离是转座因子从原来位置上切除并转移来位置上切除并转移到基因组新的位置到基因组新的位置转座是转座因子复转座是转座因子复制出一个新拷贝转移制出一个新拷贝转移到基因组新的位置到基因组新的位置2.2.转座因子的遗传效应转座因子的遗传效应供体供体DNADNA转座子转座子受体受体DNADNA复制和转座复制和转座新的新的DNADNA切除和连接切除和连接55transposonHostDNATargetsiteTACATGCACAGATGTACGTGTCtransposonTACATGCAATGCAGTACGTGTC转座的结果使靶点序列倍增转座的结果使靶点序列倍增transposonDirectRepeatsTACATGCAATGTACGTATGCACAGTACGTGTC促使染色体畸变促使染色体畸变56共合体共合体重组重组解离解离复制子复制子11复制子复制子22转座子可以使供体转座子可以使供体和受体复制子融合,和受体复制子融合,形成共合体,形成共合体,解离后释放出两个解离后释放出两个复制子,每一个都复制子,每一个都带有一个转座子。
带有一个转座子。
可形成共合体可形成共合体转座子转座子融合融合57转座子转座子FFEEAABBCCDD复制复制插入插入转座子新拷贝转座子新拷贝FFEEAABBCCDD引起插入突变引起插入突变基因基因FF被隔断而失去功能被隔断而失去功能58携带标志基因使受体增添新基因携带标志基因使受体增添新基因Tn3转座酶转座酶Tn10转座酶转座酶氨苄青霉素抗性氨苄青霉素抗性四环素抗性四环素抗性59(六)质粒(六)质粒(plasmidplasmid)质粒质粒是存在于细菌染色体外的,是存在于细菌染色体外的,具有自主复制能力的环状双链具有自主复制能力的环状双链DNADNA分分子;大小为子;大小为2-32-3kbkb。
60质粒的特性质粒的特性在宿主细胞内可自主复制;在宿主细胞内可自主复制;所携带的遗传信息能赋予宿主特所携带的遗传信息能赋予宿主特定的遗传性状;定的遗传性状;细胞分裂时恒定地传给子代;细胞分裂时恒定地传给子代;质粒可以转移。
质粒可以转移。
61Transcription用一种限制性内切酶消化不同个体的同一段DNA时,由于碱基组成的变化而改变限制性内切酶识别位点,从而会产生长度不同的DNA片段。
基因组:
一个细胞或病毒的全部遗传信息;位于-70-80bp,GGC/TCAATCT,AUUUU-OH3
(一)基因概念的发展DirectRepeats小卫星(minisatellite)DNA:
(invertedrepeats)原核生物基因的调控序列1977,Sanger(highlyrepetitiveDNA)单股正链RNA、不分节段,Translation含有II类启动子的基因,基因末端保守的AATAAA顺序及下游GT或T富含区,被多聚腺苷酸化特异因子识别,在mRNA3端加约200个A。
调控区和下游转录终止信号组5-AAUAAA-AAAAAAAA3第一节基因的概念与结构Micrococcusluteus三三真核生物基因组真核生物基因组染色体染色体DNADNA线粒体线粒体DNADNA62人类基因组染色体人类基因组染色体
(一)染色体
(一)染色体DNADNA的组成的组成核小体核小体631.1.单一序列单一序列DNA(uniquesequenceDNA)单一序列在人类基因组中单一序列在人类基因组中大于大于5050。
结构基因主要存。
结构基因主要存在于单一序列中。
在于单一序列中。
单拷贝单拷贝DNA(singlecopyDNA)642.2.高度重复序列高度重复序列DNA(highlyrepetitiveDNA)卫星卫星DNADNA(satelliteDNAsatelliteDNA)反向重复序列反向重复序列(invertedrepeats)invertedrepeats)重复次数重复次数106次次65
(1)卫星卫星DNADNA存在于非编码区的串联重复序列,存在于非编码区的串联重复序列,在基因组中约占在基因组中约占55。
主带主带光光密密度度卫星卫星DNA66a.大卫星(大卫星(macro-satellite)DNADNA:
重复单位重复单位5-105-10bpbp,其在人群中多态其在人群中多态性不显著。
性不显著。
光密度光密度260nm果蝇基因组果蝇基因组67b.小卫星小卫星(minisatelliteminisatellite)DNADNA:
重复单位重复单位9-249-24bpbp,呈高度多态性。
呈高度多态性。
可变数目串联重复序列(可变数目串联重复序列(variablevariablenumberoftandemrepeat,VNTRnumberoftandemrepeat,VNTR)端粒端粒DNADNA:
(TTAGGGTTAGGG)nn,2-20kb2-20kb,染色体复制,末端保护。
染色体复制,末端保护。
核心序列核心序列GGGCAGGAGGGCAGGAXXGG;68c.微卫星微卫星DNADNA(macro-satelliteDNA)短串联重复短串联重复(shorttandemrepeat,STR)重复单位重复单位2-62-6bpbp,常见为常见为(ACAC)n)n和和(TGTG)n)n,重复次数重复次数10-6010-60次,总长度小于次,总长度小于150150bpbp,高度多态性,可作遗传标记。
高度多态性,可作遗传标记。
69
(2).反向重复序列反向重复序列5AAACCACCGCTGGTAGCGGTGGTTT33TTTGGTGGCGACCATCGCCACCAAA55AAACCACCGCTAGCGGTGGTTT33TTTGGTGGCGATCGCCACCAAA5回文结构回文结构两两个个顺顺序序列列相相同同的的拷拷贝贝在在DNADNA链链上上呈呈反反向向排排列列。
在在基基因因组组中中约约占占55,常见于基因调控区。
,常见于基因调控区。
703.3.中度重复序列中度重复序列:
tRNAtRNA、rRNArRNA组蛋白、免疫球蛋白组蛋白、免疫球蛋白可能与基因调控相关序列可能与基因调控相关序列重复次数重复次数10-1010
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基因 基因组