基因组学考点复习.docx
- 文档编号:29854143
- 上传时间:2023-07-27
- 格式:DOCX
- 页数:17
- 大小:31.30KB
基因组学考点复习.docx
《基因组学考点复习.docx》由会员分享,可在线阅读,更多相关《基因组学考点复习.docx(17页珍藏版)》请在冰豆网上搜索。
基因组学考点复习
基因组学考点复习
第一章绪论
1.基因组学的发展历史和现状(人类基因组计划HGP)
答
2.基因组学的研究内容
答:
Genomics:
Thestudiesofthestructureandfunctionofgenomes.
Structureandsequenceofgenomes;Functionofgenomics;Appliedgenomics.
3.什么是基因组Genome、转录组和蛋白质组
答:
Genome:
Theentiretyofanorganism'shereditaryinformation.ItisencodedeitherinDNAor,formanytypesofvirus,inRNA.转录组:
RNAcopiesoftheactiveprotein-codinggenes。
蛋白质组:
Thecell’srepertoireofproteins
第二章遗传作图
1.遗传作图的分子标记类型(RFLP、STR/VNTR/Microsatellite、SNP)、分布特征和作图方法
答:
RFLP:
Restrictionfragmentlengthpolymorphisms,限制性片段长度多态性;
VNTR:
小卫星序列STR:
微卫星序列SNP:
单核苷酸多态性singlenucleotidepolymorphisms
2.卫星、小卫星、微卫星的区别
答:
卫星的组成单位是短碱基序列,卫星序列位于染色体的异染色质区;小卫星在染色体上分布于常染色质区;微卫星重复单位仅2-5bp,也位于常染色质区。
3.SNP的高通量检测技术有哪些
答:
(1)、未知SNP的发现:
即通过找寻未知的SNP,并对其分析以确定此SNP与遗传疾病的关系;
(2)已知SNP的遗传分型:
即对不同人群的SNP遗传多样性进行检测或对已知致病基因的遗传病进行诊断。
4.个体基因身份鉴定的原理(STR)和应用(法医、亲子鉴定等)
答:
ThePCRproductsarethenseparatedbyeithergelelectrophoresisorcapillaryelectrophoresis.采用含有国际标准的13-16个核心STR位点进行DNA检测,综合这些位点信息,个人的个体识别率已超过千亿分之一,即1000亿人之间不会有两个个体的STR基因型发生重复,完全可以进行个人同一认定。
在遭遇意外事故、失散、财产继承、试管婴儿、骨髓移植、克隆器官或克隆生命体等原因引起的需要进行个体识别和亲权鉴定中,基因身份证将发挥至关重要的作用。
5.遗传图谱偏高的原因(遗传作图的局限性)
答:
Mapresolutiondependson:
samplesizeforcrossbreed;quantificationofpolymorphicmarkers.
Limitedaccuracy:
Recombinationhotspot;Exchangefrequencydifferencesbetweengenders
;Numerousexchangesbetweentwolocus
6.个体基因组中多态性的表现形式(SNP、Indel、STR、Structuralvariation)
答:
SNP:
同一个体或不同个体基因组中等位位点上的单核苷酸碱基不同。
对于二倍体生物,等位位点上的SNP有杂合、纯合之分。
第三章物理作图
1.遗传作图和物理作图在作图原理、标记类型、标记方法、图距单位上的差异和联系(1cM约相当于1Mb)
答:
作图原理:
区别:
遗传作图采用遗传学分析方法将基因或其他DNA分子标记标定在染色体上构建连锁图;物理作图采用分子生物学技术直接将DNA分子标记基因或克隆标定在基因组的实际位置所构建的位置图。
联系:
它们都是确定基因或DNA分子标记在染色体上的排列位置
标记类型:
遗传作图的标记类型有性状、基因或DNA分子标记;物理作图有限制性作图、基于克隆的基因组作图、荧光原位杂交作图和序列标签位点。
联系:
由于方法的局限性,遗传图和物理图均会产生某些偏差,通过共同的做图标记可以相互校正,由此获得更加准确的基因组连锁图。
标记方法:
区别:
遗传图:
RFLP\SSLP\SNP物理图:
Gene、Restrictionsite、STS、FISH
图距单位:
遗传图:
厘摩(CM)物理图:
依作图方法而异。
联系:
都与交换率有关。
2.物理作图从尺度分为哪几种
答:
Cytogeneticmapping、Restrictionmapping、FISH、RHmapping、Clonebasedmapping
3.辐射杂交作图的原理和适用性
答:
Radiationhybrid(RH)map:
AgenomemapinwhichSTSsarepositionedrelativetooneanotheronthebasisofthefrequencywithwhichtheyareseparatedbyradiation-inducedbreaks.(作图需要已知序列的STS和一套辐射杂种细胞系,作图后得到STS之间的图距。
)
Thefrequencyisassayedbyanalysingapanelofhuman–hamsterhybridcelllines,eachproducedbylethallyirradiatinghumancellsandfusingthemwithrecipienthamstercellssuchthateachcarriesacollectionofhumanchromosomalfragments.
4.荧光原位杂交的原理
答:
ThepositionatwhichtheprobehybridizestothechromosomalDNAisvisualizedbydetectingthefluorescentsignalemittedbythelabeledDNA.
5.限制性作图原理:
与RFLP的区别
答:
comparethefragmentsizesproducedwhenaDNAmoleculeisdigestedwithtwodifferentrestrictionenzymestodecidetherestrictionsiteofthetwoenzymesintheDNAmolecule.
6.HGP标准克隆载体BAC的结构
答:
pBAC为mini-F的衍生质粒。
OriS和repE基因介导F因子的单向复制,parA和parB维持低水平质粒拷贝数,每个基因组约1-2个拷贝。
CosN为λ噬菌体末端酶专一性切割位点,loxP为P1Cre蛋白作用位点,均可将环状BACDNA转变为线型分子,便于物理图绘制。
HindIII和BamHI为外源DNA插入位置,两侧的NotI位点可用于直接检测克隆的大分子DNA。
7.什么是STS,哪些序列适合作为STS?
答:
STSareshortsequencesthatareoperationallyuniqueinthegenomeandareusedtogeneratemappingreagents.
ESTs(expressedsequencetags)、SSLP、Randomgenomicsequeces
第四章基因组测序
1.第一代基因组测序的策略:
克隆重叠群法和鸟枪法
第一代人类基因组测序测了多少条染色体(24条)
2.克隆重叠群(Clonecontigs)和支架(Scaffold)的含义
克隆重叠群:
一群相互重叠的克隆或DNA序列,可以是草图序列或精确序列,包括连续的或不连续的DNA序列
支架:
一组锚定在染色体上的重叠群,内部含间隙或不含间隙
如何利用克隆指纹构建contigs:
由于BAC(细菌人工染色体)克隆DNA可以大规模机械化制备,酶切核电用凝胶分离,通过计算机对酶切片段的扫描识别,可对BAC克隆进行大范围的指纹比对和排列,由此快速构建指纹重叠群
3.鸟枪法基因组测序的含义、局限性和适用性
含义:
将整个基因组DNA打断成小片段后将其克隆到质粒载体中,然后随机挑取克隆对插入片段进行测序,并以获得的测序序列构建重叠群,进而搭建序列支架,最后以分子标记为向导将序列锚定到基因组整合图上。
局限性:
1、如果基因组太大,结构过于复杂,序列组装的起始阶段工作量非常大,必须对所有已知小片段序列进行分析,找出共有序列组装成很小的重叠群。
序列组装时可能会将重复基因过滤掉从而丢失许多重要信息;2、存在大量难以填补的间隙,这些间隙所处的物理图位置难以判断,给序列填补带来很大麻烦
适用性:
鸟枪法优点在于测序速度快,而且无需提供相关的遗传图和物理图,此外全基因组鸟枪法测序覆盖面较大,有些在作图法中遗漏的基因可在鸟枪法测序中发现。
4.测序的覆盖率(Coverage)和深度(Depth)
测序深度:
指测序得到的总碱基数与待测基因组大小的壁纸。
假设一个基因大小为2M,测序深度为10%,那么获得的总数据量为20M。
覆盖度:
指测序获得的序列占整个基因组的比例。
由于基因组中的高GC、重复序列等复杂结构的存在,测序最终拼接组装获得的序列往往无法覆盖所有的区域,这部分没有获得的区域就称为Gap,例如一个细菌基因组测序,覆盖度是98%,那么还有2%的序列区域是没有通过测序获得的。
5.第二代高通量基因组测序的三巨头及其基本原理:
Roche454GS:
焦磷酸光点测序原理:
在DNA聚合酶、ATP硫酸化酶、荧光素酶和ATP双磷酸酶的作用下,将每一个dNTP的聚合与一次化学发光信号的释放偶联起来,通过检测化学发光信号的有无和强度,达到实时检测DNA序列的目的。
IlluminaGA:
将基因组DNA的随机片段附着到光学透明的玻璃表面(即Flowcell),这些DNA片段经过延伸和桥式扩增后,在Flowcell上形成了数以亿计Cluster,每个Cluster是具有数千份相同模板的单分子簇。
然后利用带荧光基团的四种特殊脱氧核糖核苷酸,通过可逆性终止的边合成边测序(Sequencing-by-synthesis,SBS)技术对待测的模板DNA进行测序。
ABISoLid:
用连接法测序获得基于“双碱基编码原理”的SOLiD颜色编码序列,随后的数据分析比较原始颜色序列与转换成颜色编码的reference序列,把SOLiD颜色序列定位到reference上,同时校正测序错误,并可结合原始颜色序列的质量信息发现潜在SNP位点。
6.基因组序列拼接的难点在于:
重复序列和缺口(序列缺口和物理缺口);
两类缺口的含义和弥补办法:
序列间隙:
指测序时遗漏的序列,这些序列仍然保留在尚未挑选到的克隆中。
填补:
首先收集所有已知间隙两侧的序列,由此设计专一性探针,从基因组文库中筛选阳性克隆,再由筛选到的阳性克隆PCR扩增,进行克隆和测序。
物理间隙:
指构建基因组文库时被丢失的DNA序列,它们从已有的克隆群体中永久性地消失。
填补:
1、利用一个不同的载体重新构建一个基因文库,以间隙两侧重叠群末端序列作为探针筛选第二个文库;2、利用PCR方法,将不同重叠群末端序列作为引物两两配组扩增基因组DNA
7.目前已完成全基因组测序的物种大致有多少(2000多种)
第五章基因组概貌
1.病毒基因组的组成和复制策略的多样性(以、和为例)
组成:
核酸:
DNA/RNA;基因组的形状:
线性、环形、片段;核酸链:
双链、单链、部分双链(单链RNA有正反链的区别)
复制策略多样性:
流感病毒FLU:
流感病毒的基因组是多节段ss(-)RNA,复制时多个片段是作为一个整体一起复制的,反义链RNA先在RNA聚合酶作用下逆转录出正义RNA链,结合形成双链DNA后整合到宿主染色体上扩增出子代病毒mRNA和子代核酸。
乙肝病毒HBV:
乙肝病毒的基因组是由两条螺旋的DNA链围成的一个环形结构。
其中一条较长负链已经形成完整的环状;另一条长度较短的正链,呈半环状。
在感染肝细胞之后,这条半环状的DNA链要以负链为模板,在聚合酶的作用下延长,最终形成完整的环状,然后再以此为模板进行DNA复制。
艾滋病毒HIV:
其基因组是ss(+)RNA,复制时先有正义链逆转录形成反义链,再由RNA酶降解亲代正义链,由新合成的反义链为模板逆转录出新的正义链,结合形成dsRNA整合到宿主细胞进行复制
2.原核生物基因组的大小、基本特点(操纵子、单倍性、连续性等)
原核生物基因组较小,只含有一个染色体,呈环状或线状,只有一个复制起点,一个基因组就是一个复制子。
特点:
1、功能相关的基因大多以操纵子形式出现。
操纵子是细菌的基因表达和调控的一个完整单位,包括结构基因、调控基因和被调控基因产物所识别的DNA调控原件(启动子等)。
2、蛋白质基因通常以单拷贝的形式存在。
一般而言,为蛋白编码的核苷酸顺序是连续的,中间不被非编码顺序所打断。
3、重复序列和不编码序列很少。
越简单的生物,其基因数目越接近用DNA分子量所估计的基因数。
4、功能密切相关的基因常高度集中,越简单的生物,集中程度越高。
5、DNA绝大部分用于编码蛋白质,结构基因多为单拷贝6、结构基因中无重叠现象。
7、基因组中存在可移动的DNA序列,如转座子和质粒等
3.原核生物基因组元件存在侧向基因转移(Lateralgenetransfer)
侧向基因转移:
Transferofagenefromonespeciestoanother.菌种之间有大量横向基因转移:
几百到几千kb;细菌与古细菌之间也存在横向基因转移。
Thepicturethatisemergingisoneinwhichprokaryoteslivinginsimilarecologicalnichesexchangegeneswithoneanotherinordertoincreasetheirindividualfitnessforsurvivalintheirparticularenvironment.
Ways:
Transformation;Transduction;Conjugation
4.真核生物基因组的基本特征
1、CpG岛:
CpG岛经常出现在的的调控区,在许多的启动子或“起始”区域周围,经常被抑制,这些区域包含浓度相对较高的CpG对,与此段区域对应的染色体区段一起被称作CpG岛,其长度通常在几百到几千的长度内变化;2、假基因:
假基因具有与功能基因相似的序列,但由于有许多突变以致失去了原有的功能,所以假基因是没有功能的基因,常用ψ表示。
3、存在C值矛盾:
C值的大小与物种的结构组成和功能的复杂性没有严格的对应关系的现象。
因为真核生物基因组染色体上存在不同数目的重复序列;4、重复序列:
组成基因组的DNA序列,根据其重复的频度可分为三类。
一是基因组只有一个复制序列的单一DNA,二为高度重复序列(highlyrepetitivesequence),由较短的序列105—107次直线连结而成,其中含随体DNA等。
第三为中等程度的重复序列(moderatelyrepetitivesequence),为有300—500个核苷对的大致相同的序列
5.假基因形成的原因(常规的和加工的)
1、常规假基因:
DNA复制和突变引起,常位于同源基因有功能拷贝的附近,含有内含子。
无意突变:
基因内部出现终止密码子;启动子突变失活;剪接信号缺陷;偶尔也可能通过一个有利突变而激活;2、加工的假基因:
功能基因的mRNA经过逆转录产生cDNA插入基因组形成,无内含子。
无启动子,来源于RNA聚合酶III转录物的假基因除外,因为它们的启动子位于mRNA序列内部,如Alu序列。
6.真核生物基因组中转座子的类型(LINE、SINE、Alu序列)及其生物学意义
LINE(longinterspersednuclearelements,长分散核因子):
containsreversetranscriptase.
SINE(shortinterspersednuclearelement,短分散核因子):
itstranspositiondependsonreversetranscriptaseprovidedbyotherautonomousretroelements.
ALU:
是哺乳动物基因组中SINE家族的一员,约有50万份拷贝,由于这种DNA序列中有Alu的识别序列AGCT,所以称为Alu重复序列
生物学意义:
目前转座子元件是植物分子生物学操作和中分离克隆基因和研究基因功能最有力的工具之一,其中的一大类—具有分布广、异源转座高和受组织培养诱导激活等优势,因此它的发现和利用又为转座子标签的应用提供了更广阔的前景。
此外通过对现有的改造以及转座元件作为改造的工具,也将大大加速植物基因和功能序列的分离与研究。
7.真核生物细胞器基因组(线粒体、叶绿体)的特点
1、叶绿体:
大小:
物种间变化不大,组成相似,大小相近(100~200kb),包含约200个基因,如rRNA、tRNA、核糖体蛋白质基因、光合作用有关基因;数目:
绿藻中约1000个拷贝,高等植物中每个细胞约200个拷贝;特征:
有两段较大的反向重复序列(IR区),编码rRNA,可以防止分子内重组,保持稳定的组成。
2、线粒体:
人类:
基因组较小(),结构紧凑,间隔序列很少,含有个别重叠基因;酵母(低等真核生物和高等植物):
基因组较大(75kb),有较长的间隔序列和较多内含子,有的内含子中包含基因,功能为RNA剪接,高等植物线粒体基因组中散布有许多短重复序列,常导致重排,使线粒体基因组变化很大(200~2500kb),并在同一个体中不均一分布。
8.重要的7种模式生物(大肠杆菌Escherichiacoli、酵母Saccharomycescevevisiae、线虫Caenorhabditiselegans、果蝇Drosophilamelanogaster、拟南芥Arabidopsisthaliana、小鼠Musmusculus、人Homosapien)的代表性和基因组结构特征
模式生物的必要条件:
易培养、繁殖、观察;成年个体小;世代周期短,后代多;在进化上有一定代表性;模式生物基因组一般复杂性比较高,重复序列比例低;建立了成熟的培养方法;建立了多种遗传突变种系;遗传背景积累的资料丰富。
大肠杆菌:
原核生物。
22分钟一代。
基因组全长465381bp,含4283个结构基因或ORF,其中62%都可基于比较基因组学的分析而确定其功能;酵母:
酵母是最简单的真核生物,是研究真核生物基因的结构、功能、表达和调控的模型。
16条染色体,基因组全长12068kb,5885个ORF,ORF平均长度1450bp,即基因密度平均为2Kb,蛋白质编码序列占基因组的72%,有将近31%编码蛋白质的酵母基因或者开放阅读框与哺乳动物编码蛋白质的基因有高度的同源性;线虫:
线虫是细胞分化和组织发育研究的最重要的材料。
它是唯一一个身体中的所有细胞能被逐个盘点并各归其类的生物。
G≈80Mb,n=6,基因密度为7~8Kb,存在重叠基因和多顺反子转录现象;果蝇:
从经典遗传学的连锁律的确立到细胞遗传学中多线染色体的发现,以至分子遗传学最重要的发现之一,同源盒(HOX)基因的发现,都离不开对果蝇的研究。
G=165Mb,n=4;拟南芥:
拟南芥的全基因组测序工作于2000年完成,成为植物界第一个被完整测序的物种。
与其他一些高等植物相比,拟南芥的基因组很小,5条染色体总共含约亿个碱基对,尽管基因组小,拟南芥的万多基因在功能类别上却和其他开花植物大致相似,因而,拟南芥作为实验材料有利于其基因的克隆和饱和突变体库的建立。
此外,拟南芥生命周期很短,从播种到种子收获仅需要6~8周;拟南芥个体较小,适合于实验室内种植;小鼠:
由于小鼠繁殖快,饲养管理费用低,所以成为生物医学研究中广泛使用的模式生物,也是当今世界上研究最详尽的哺乳类实验动物。
目前全世界每天约有2500万只小鼠被用于生物医学研究,以小鼠为对象的研究已经获得了17项诺贝尔奖。
G=,复杂性和人相似;人:
人类基因组由23对组成,其中包括22对体染色体、1条和1条,人类基因组含有约30亿个。
但人类基因组中的基因数量比原先预期的少得多,其中的,也就是能够制造的编码序列,只占总长度的%。
9.什么是基因组印迹:
基因组印迹又称基因组印记、亲代印迹或配子印迹,是指在配子或合子发生期间,来自亲本的等位基因或染色体在发育过程中产生专一性的加工修饰,导致后代体细胞中两个亲本来源的等位基因有不同的表达活性的现象。
甲基化对基因表达的影响:
DNA的甲基化通常会抑制基因的表达、抑制转座因子的活性。
组蛋白乙酰化对基因表达的影响:
乙酰化可能通过对组蛋白电荷以及相互作用蛋白的影响,来转录,组蛋白乙酰化有利于基因表达。
10.人基因组中大致有多少基因(20000~25000)
为什么人类基因组的基因数量并不多,却可以完成非常复杂的生物学功能(可变剪接、基因表达调控的多层次):
1、可变剪接:
有些基因的一个mRNA前体通过不同的剪接方式(选择不同的剪接位点)产生不同的mRNA剪接异构体,这一过程称为可变剪接。
可变剪接是调节基因表达和产生多样性的重要机制,是导致人类基因和蛋白质数量较大差异的重要原因。
2、基因表达调控的多层次:
分为转录水平上的和翻译水平上的。
1.转录水平的调控:
包括DNA转录成RNA时的是否转录及转录频率的调控,DNA的序列决定了DNA的空间构型,DNA的空间构型决定了是否可以顺利的结合到DNA的上,比如结合到TATA等序列上;2.翻译水平的调控:
翻译水平的调控又可以分成翻译前的调控和翻译后的调控。
a、翻译前的调控主要是修饰。
生物体对RNA进行编辑剪切,比如剪切后变成28S/16S/5S.还有一些修饰等等。
b、翻译后调控主要是蛋白的修饰,蛋白修饰后可以成为有功能的蛋白或者有隐藏功能的蛋白。
第六章搜寻基因
1.如何预测基因组序列中的基因
同源性比对、ORF搜寻(长度筛选、内含子剪接特征、密码子偏爱)、基因结构信号辅助(CpG岛、启动子)、EST拼接不指导预测基因及其可变剪接形式等。
基因功能预测主要采用软件分析方法,根据已有的基因功能推测基因组中具有相似结构的基因的功能。
计算机预测基因功能的主要依据仍然是同源性比较,同源基因都拥有一个共同的祖先基因,在漫长的进化岁月中,他们仍然保持原有的生物学功能。
同源基因一般不会有完全一致的核苷酸序列,因为这两个基因,在出现后独立的发生随机突变,但他们有相似的序列组成,大部分未突变的核苷酸位置是相同的,当一个新的基因序列被确认后,根据同源性可从数据库中查找已知序列的同源基因。
根据进化的相关性可从已知的同源基因推测新基因的功能。
2.ORF及其含义:
ORF是生物个体的基因组中,可能是蛋白质编码序列的部分。
基因中的ORF包含并位于开始编码与终止编码之间。
由于一段DNA或RNA序列有多种不同读取方式,因此可能同时存在许多不同的开放阅读框架。
3.Homology(同源性):
指起源于同一祖先但序列已经
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基因组 考点 复习