SNP及检测技术.docx
- 文档编号:4630746
- 上传时间:2022-12-07
- 格式:DOCX
- 页数:29
- 大小:56.90KB
SNP及检测技术.docx
《SNP及检测技术.docx》由会员分享,可在线阅读,更多相关《SNP及检测技术.docx(29页珍藏版)》请在冰豆网上搜索。
SNP及检测技术
1定义:
单核苷酸多态性(singlenucleotidepolymorphism,SNP),主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。
它是人类可遗传的变异中最常见的一种。
占所有已知多态性的90%以上。
SNP在人类基因组中广泛存在,平均每500~1000个碱基对中就有1个,估计其总数可达300万个甚至更多。
SNP所表现的多态性只涉及到单个碱基的变异,这种变异可由单个碱基的转换(transition)或颠换(transversion)所引起,也可由碱基的插入或缺失所致。
但通常所说的SNP并不包括后两种情况。
单核苷酸多态性(SNP)是指在基因组上单个核苷酸的变异,包括置换、颠换、缺失和插入。
所谓转换是指同型碱基之间的转换,如嘌呤与嘌呤(G2A)、嘧啶与嘧啶(T2C)间的替换;所谓颠换是指发生在嘌呤与嘧啶(A2T、A2C、C2G、G2T)之间的替换。
从理论上来看每一个SNP位点都可以有4种不同的变异形式,但实际上发生的只有两种,即转换和颠换,二者之比为2:
1。
SNP在CG序列上出现最为频繁,而且多是C转换为T,原因是CG中的C常为甲基化的,自发地脱氨后即成为胸腺嘧啶。
一般而言,SNP是指变异频率大于1%的单核苷酸变异。
在人类基因组中大概每1000个碱基就有一个SNP,人类基因组上的SNP总量大概是3×106个。
依据排列组合原理,SNP一共可以有6种替换情况,即A/G、A/T、A/C、C/G、C/T和G/T,但事实上,转换的发生频率占多数,而且是C2T转换为主,其原因是CpG的C是甲基化的,容易自发脱氨基形成胸腺嘧啶T,CpG也因此变为突变热点。
理论上讲,SNP既可能是二等位多态性,也可能是3个或4个等位多态性,但实际上,后两者非常少见,几乎可以忽略。
因此,通常所说的SNP都是二等位多态性的。
这种变异可能是转换(CT,在其互补链上则为GA),也可能是颠换(CA,GT,CG,AT)。
转换的发生率总是明显高于其它几种变异,具有转换型变异的SNP约占2/3,其它几种变异的发生几率相似。
Wang等的研究也证明了这一点。
转换的几率高,可能是因为CpG二核苷酸上的胞嘧啶残基是人类基因组中最易发生突变的位点,其中大多数是甲基化的,可自发地脱去氨基而形成胸腺嘧啶。
SNP在动物基因组中分布广泛,每一个核苷酸发生突变的概率大约为10-9。
由于选择压力,SNP在单个基因、整个基因组中以及种群间的分布是不均匀的。
SNP在非编码区中要多于编码区,而且在编码区也是非同义突变(有氨基酸序列的改变)的频率比其他方式突变的频率低得多[4]。
而基因间,同一种基因中的编码SNP(codingSNP,cSNP)的数目也不相同,可从0~29个不等。
多项研究同时发现不同种族间SNPs的数目也是不同的,非洲人群及非裔种族中SNPs数量最多,而其他种群的SNPs要少得多,因此通过比较亚群间等位基因的频率将有助于阐明种族的结构和进化。
在基因组DNA中,任何碱基均有可能发生变异,因此SNP既有可能在基因序列内,也有可能在基因以外的非编码序列上。
总的来说,位于编码区内的SNP(codingSNP,cSNP)比较少,因为在外显子内,其变异率仅及周围序列的1/5.但它在遗传性疾病研究中却具有重要意义,因此cSNP的研究更受关注。
从对生物的遗传性状的影响上来看,cSNP又可分为2种:
一种是同义cSNP(synonymouscSNP),即SNP所致的编码序列的改变并不影响其所翻译的蛋白质的氨基酸序列,突变碱基与未突变碱基的含义相同;另一种是非同义cSNP(non-synonymouscSNP),指碱基序列的改变可使以其为蓝本翻译的蛋白质序列发生改变,从而影响了蛋白质的功能。
这种改变常是导致生物性状改变的直接原因。
cSNP中约有一半为非同义cSNP。
先形成的SNP在人群中常有更高的频率,后形成的SNP所占的比率较低。
各地各民族人群中特定SNP并非一定都存在,其所占比率也不尽相同,但大约有85%应是共通的。
自身的特性:
1)SNP数量多,分布广泛。
据估计,人类基因组中每1000个核苷酸就有一个SNP,人类30亿碱基中共有300万以上的遍布于整个人类基因组中,根据SNP在基因中的位置,可分为基因编码区SNPs(Coding-regionSNPs,cSNPs)、基因周边SNPs(PerigenicSNPs,pSNPs)以及基因间SNPs(IntergenicSNPs,iSNPs)等三类。
2)SNP适于快速、规模化筛查。
组成DNA的碱基虽然有4种,但SNP一般只有两种碱基组成,所以它是一种二态的标记,即二等位基因(biallelic)。
由于SNP的二态性,非此即彼,在基因组筛选中SNPs往往只需+/-的分析,而不用分析片段的长度,这就利于发展自动化技术筛选或检测SNPs。
3)SNP等位基因频率的容易估计。
采用混和样本估算等位基因的频率是种高效快速的策略。
该策略的原理是:
首先选择参考样本制作标准曲线,然后将待测的混和样本与标准曲线进行比较,根据所得信号的比例确定混和样本中各种等位基因的频率。
4)易于基因分型。
SNPs的二态性,也有利于对其进行基因分型。
对SNP进行基因分型包括三方面的内容:
(1)鉴别基因型所采用的化学反应,常用的技术手段包括:
DNA分子杂交、引物延伸、等位基因特异的寡核苷酸连接反应、侧翼探针切割反应以及基于这些方法的变通技术;
(2)完成这些化学反应所采用的模式,包括液相反应、固相支持物上进行的反应以及二者皆有的反应。
(3)化学反应结束后,需要应用生物技术系统检测反应结果。
绝大多数疾病的发生与环境因素和遗传因素的综合作用有关,通常认为是在个体具有遗传易感性的基础上,环境有害因素作用而导致疾病。
不同群体和个体对疾病的易感性、抵抗性以及其他生物学性状(如对药物的反应性等)有差别,其遗传学基础是人类基因组DNA序列的变异性,其中最常见的是SNP.易感基因的特点是基因的变异本身并不直接导致疾病的发生,而只造成机体患病的潜在危险性增加,一旦外界有害因素介入,即可导致疾病发生。
另外在药物治疗中,易感基因的变异造成药物对机体的疗效和副作用不同。
随着人类基因组计划的进展,人们愈来愈相信基因组中的SNP有助于解释个体的表型差异、不同群体和个体对疾病,特别是对复杂疾病的易感性以及对各种药物的耐受性和对环境因子的反应。
因此,寻找和研究SNP已成为人类基因组计划的内容和目标之一。
多态性与突变的区别
1、多态性是一个群体概念,多态性指这个差异占群体的1%以上。
否则就叫突变(小于1%)
2、SNP是多态性中的一种,只是进一步限定了差异只是单碱基。
3、SNP一般来说,是全部体细胞一样的基因型(除开嵌合体)。
4、突变一般不是一个个体全部细胞的变化。
5、如果突变发生在生殖细胞,则可以遗传,但是只要这个突变群没有达到总群体的1%,它就只是一个突变株/系。
达到了1%就是多态性了。
常用数据库:
HumanGeneMutationDatabase(HGMD)TSC)1cm当前SNP功能研究主要有以下几方面:
SNP的分型技术可分为两个时代,一为凝胶时代,二为高通量时代。
凝胶时代的主要技术和方法包括限制性酶切片段长度多态性分析(RFLP)、寡核苷酸连接分析(OLA)、等位基因特异聚合酶链反应分析(AS2PCR)、单链构象多态性分析(SSCP)、变性梯度凝胶电泳分析(DGGE),虽然这些技术与高通量时代的技术原理大致一样,但是由于它不能进行自动化,只能进行小规模的SNP分型测试,所以必然会被淘汰。
高通量时代的SNP分型技术按其技术原理可分为:
特异位点杂交(ASH)、特异位点引物延伸(ASPE)、单碱基延伸(SBCE)、特异位点切割(ASC)和特异位点连接(ASL)5种方法。
此外,采用特殊的质谱法和高效液相层析法也可以大规模、快速检出SNP或进行SNP的初筛。
近年来已经在晶体上用“光刻法”实现原位合成,直接合成高密度的可控序列寡核苷酸,使DNA芯片法显示出强大威力,对SNP的检测可以自动化、批量化,并已在建立SNP图谱方面投入实际应用。
DNA芯片法有望在片刻之间评价整个人类基因组。
1)报告基因转染技术:
这一技术主要用于研究启动子SNP对于mRNA转录效率,是通过观察转录结局来判断SNP是否具有功能。
2)EMSA技术:
通过在体外合成含SNP位点的寡核苷酸与转录因子特异性结合,观察结合的强度和效率,但是该技术由于只人工合成较短长度的寡核苷酸,没有考虑SNP周围遗传背景环境的影响,因此在重复性和说服力上不强。
3)ChiP技术:
该技术通过超声将染色体碎片化,再将碎片化的核酸与转录因子的结合,最后通过PCR技术观察判断结合的效率和强度,该技术克服了EMSA的一些缺点,当前做的文献较多。
5SNP产生功能的机制研究的个人之所见
1.对大多数SNP而言,都由于位于一些非编码区域而不产生明显的功能性影响,此时做SNP功能意义不大。
2.启动子SNP研究是做的人最多的,相关实验技术都比较成熟,其产生功能的机制主要是影响TF与启动子的的结合能力,从而调控基因的转录。
3.编码区SNP有同义和非同义2种,非同义突变由于会导致氨基酸的变化,从而影响蛋白质的功能,特别是发生在结构功能区域的SNP尤其重要,可是这方面的技术还存在瓶颈,做得相当少,据我所知要用什么诱导点突变的方法再去评价蛋白质功能的。
至于非同义突变,虽然没有明显的功能的分子机制,但是在遗传学上可能因为与附近的其它致病基因的表达或者SNP连锁,因此在流行病学上形成阳性结果一般以此解释。
4.内含子区域SNP产生功能的分子机制一般是与附近其它基因SNP连锁或者可能影响mRNA的剪接从而影响蛋白质的功能——很多研究中做INTRON发现有阳性结果解释不了,而且大多只是猜测。
PYRO测序用于SNP基因分型
其实是一种段片段焦磷酸测序技术,在测序引物的引导下,完成段片段(含snp)的测序,从而实现基因分型。
缺点:
不能检测长片段,对于重复序列没有办法。
原理简介
1.测序引物与单链,PCR扩增的DNA模板相结合。
然后将其与DNA聚合酶、ATP硫酸化酶、荧光素酶和三磷酸腺苷双磷酸酶,以及底物APS和荧光素一起孵育。
2.四种dNTP之一被加入反应体系,如与模扳配对,此dNTP与引物的末端形成共价键,dNTP的焦磷酸基团(PPi)释放出来。
而且释放出来的Ppi的量与和模板结合的dNTP的量成正比。
sulfurylase在adenosine5′phosphosulfate存在的情况下催化PPi形成ATP,ATP驱动luciferase介导的Luciferin向oxyluciferin的转化,oxyluciferin发出与ATP量成正比的可见光信号。
光信号由CCD摄像机检测并由pyrogram反应为峰。
每个光信号的峰高与反应中掺入的核苷酸数目成正比。
和未掺入的dNTP由Apyrase降解,淬灭光信号,并再生反应体系。
5.然后加入下一种dNTP。
最终待测序列顺序,即可从反应光强的信号峰中读出。
在此过程之中有几点值得注意的是,在体系中使用的是dATPS而非dATP,因为dATPS不是荧光素酶的底物,而且DNA聚合酶对dATPS的催化效率更高。
而且在系统之中,底物的浓度已经最佳化,使得dNTP的降解速度慢于它的掺入速度,ATP的合成速度快于水解速度,其中三磷酸腺苷双磷酸酶的特异浓度,可以保证降解完全,使系统复原。
RealtimePCR检测SNP的方法是:
针对目标基因片段的突变位点,设计两条引物,这两条引物的区别仅仅是末端的1-2个碱基不同,分别与突变位点匹配。
共同的下游引物和探针。
然后扩增。
就可以得到不同的CT值,根据CT值的不同,来确定基因类型。
1、把蛋白序列对应的核酸序列找到。
2、根据核酸序列做BLAST(对dbSNP数据库)。
3、结果中,可以得到你的序列上所以已知的SNP。
以编码5-hydroxytryptamine(serotonin)receptor的HTR1A基因为例,先进入entrez,选择gene选项,在NCBI中搜HTR1A基因,到如下图界面,点基因缩略图,然后点graphics。
点击后的界面如下。
这里已经很清楚地标明了SNP所在的位置以及对应的核酸与蛋白序列。
但有一点要说明,我注意到这个基因编码的蛋白序列与swissprot的序列有一些差别,很可能是收录的版本不同,或是有些序列是NCBI直接根据orf形成的.
1,如果是检测基因的所有已知的SNP,那么首先要去了解并查询到这些SNP位点,SNP位点可以通过查询dbSNP数据库()和TSC(TheSNPConsortium)数据库(),可以获知基因及上下游邻近序列的SNP位点。
2,至于挑选的原则,可以介绍一下HapMap的正规化标准:
SNPSelectionCriteria
Category1"verified"
ThiscontainsallSNPsforwhichwehaveallelefrequencyorgenotypingdata.ThisincludesSNPsfromtheTSCallelefrequencyproject,aswellasSNPscharacterizedbyJSNP.TheseSNPsweregeneratedfromthosersclustersinwhichatleastoneoftheSNPsintheclustercontainsgenotypeorallelefrequencydataandtheminorallelemusthavebeenseeninatleasttwoindividuals.
Category2"two-hit"
Thesearetruedouble-hitSNPs,producedincollaborationwithJimMullikinandSarahHunt.Adouble-hitSNPmustbeseentwice,intwodifferentDNAsampleswhichmusthaveproducedtwoalleles.TSCtracedatawasonlyallowedtocontributeonehitperallelebecausetheindividualsourceDNAforatracecouldnotbeidentified.
Category3"jsnp-verified/perlegen-verified”
Thiscategorycontainstwogroups:
SNPsthatJSNPcertifiesarelikelytoberealbasedonmanualinspectionoftheirdata(buthavenotbeengenotyped),andSNPsthatPerlegenverifiedindependently.
Category4"bac-overlap"
TheseareSNPsfromBACoverlapsthatdonotfallintocategory1or2above
基因芯片与SNP分析
基因芯片技术作为一种新兴的生物技术,近年来得到迅速发展,其应用具有巨大的潜力。
单核苷酸多态性(SNP)作为新的遗传标记对基因定位及相关疾病研究的意义亦非常重大。
本文主要介绍了DNA芯片技术的原理和分类、单核苷酸多态性检测方法及DNA芯片技术在单核苷酸多态性检测方面的应用。
生物芯片技术是90年代初发展起来的,集分子生物学、微电子技术、高分子化学合成技术和计算机科学等于一身的一门新型技术。
目前发展的生物芯片种类繁多,如蛋白质芯片、基因芯片、激素芯片、药物芯片等。
但最初的生物芯片主要用于对DNA的测序,基因表达谱的鉴定及基因突变体的检测、分析等方面。
迄今为止,使用最多的也是DNA芯片。
DNA水平遗传多态性标记至今已经历了3个阶段:
限制性酶切片段长度多态性标记(RFLP)、DNA重复序列的多态性标记(包括小卫星、微卫星DNA重复序列)、单核苷酸多态性标记(singlenucleotidepolymorphisms,SNPs)。
SNP具有数量多,分布广泛,易于快速、规模化筛查,便于基因分型等特点。
伴随着SNP检测和分析技术的进一步发展,尤其是与DNA芯片等技术的结合,SNPs在基因定位中具有巨大优势和潜力,并为DNA芯片应用于遗传作图提供了基础。
由于基因芯片具有携带信息量大和检测方便的特点,使得用DNA芯片对SNP进行分析具有广阔的前景。
DNA芯片和SNP分析已日益成为研究功能基因组学的工具。
1、基因芯片
基因芯片的基本原理是应用已知的核苷酸序列作为探针与标记的靶核苷酸序列进行杂交,通过对信号的检测进行定性与定量分析。
基因芯片可在一微小的基片(硅片、玻片等)表面集成大量的分子识别探针,能够在同一时间内平行分析大量基因,进行大信息量的检测分析。
基因芯片应用很广,根据所用探针类型不同分为cDNA微阵列(或cDNA微阵列芯片)和寡核苷酸阵列(或芯片),根据应用领域不同而制备的专用芯片如毒理学芯片(toxchip)、病毒检测芯片(如肝炎病毒检测芯片)、p53基因检测芯片等。
根据其作用可分为检测基因质和量的芯片。
量的检测包括:
检测mRNA水平、病原体的有无及比较基因组基因的拷贝数,既可用寡核苷酸芯片,又可用cDNA芯片完成,但cDNA芯片更具优势。
质的检测包括:
DNA测序及再测序、基因突变和SNP检测等,主要用寡核苷酸芯片完成。
巢式PCR-RFLP技术
“巢式PCR-RFLP是针对任意的基因分型技术,使任何位点最终都能进行常规限制性内切酶鉴定;同时该SNP分型技术利用巢式PCR技术,使得多个位点同时进行分析成为可能。
即使低浓度的DNA也能够进行快速准确的分型工作。
与现有常规的分型技术相比,其最大的优势包括:
(一)所需DNA浓度低。
1-2ng/uL也能完成检测工作,而Taqman技术所需的DNA含量至少5ng/uL。
(二)价格低。
由于不需要合成荧光探针,使得该技术比Taqman技术价格低,该优势在对多个位点同时进行分型时更明显。
技术基本原理和实例
采用的巢式PCR-RFLP分型技术,其基本原来是利用PCR引物的3’端,对SNP位点附近的碱基进行人为改造,产生一个常规的限制性内切酶识别序列,如SNPrs1321425(rs1321425-来自NCBI的refSNP数据库)的C/G,其任何一个碱基和上下游碱基无法形成一个可直接被限制性内切酶识别的序列,于是我们对SNP位点前的上游碱基进行改造,通过对序列的分析和PCR效果的计算,我们将原本四个碱基AGAT改成CTGC,结合后一个碱基A以及SNP位点G,形成CTGCAG(PstI)酶切识别位点,经测序和序列对比,改造成功。
又比如rs9309462和rs4646642,成功的将2个碱基,3个碱基进行成功的改造。
rs1321425TCACAAAAAATAAAAAATTTTAATTTTAAAGGAGATAC/GACAAGAAATGAGCATGTGTGAAAGCACTTCTGTAAACTACATGCACTAAT
与Taqman技术和普通技术的详细对比
分型技术PCR-RFLP技术Taqman技术普通PCR-RFLP技术?
最佳运用时机200-600样本,任何DNA多态位点样本量大于500人份仅适合含有现成酶切位点的多态位点的分型
试剂投入低荧光探针,需3000-4000元。
有可能实验失败需重新花钱设计荧光探针。
低
技术的适用性可适合任何多态位点的分型基本适合任何多态位点的分型,但有时若干位点不能成功进行试验;当分型位点过于接近也不能用该方法。
仅适合含有现成酶切位点的多态位点的分型,有时出现的是一些稀有酶的酶切位点,导致效率低下或费用昂贵;结果判断直观,明确,稳定间接,每管反应必须加荧光参照ROX,否则结果判断不确定一般直观,明确;有时酶切位点出现在非主频等位基因上,导致结果判读困难
结果稳定性稳定一般稳定
结果准确性准确度高一般准确度高
样本消耗量1-2ng5-10ng50-100ng
实验耗时2-3周由于要定制MGB荧光探针,和预实验,也需要2-3周2-3周
操作流程
1.基本信息收集具体内容包括客户信息、样本数(case,control)数、位点信息等。
2位点信息的查询主要包括:
位点上下游各300bp的确切序列,基因频度;有无文献报道证明该位点多态存在于中国人群;如无上述相关文献,在J-SNP数据库中查询该位点多态是否存在于东亚人群中。
为了保证结果的可靠,实验方案设计原则上应以野生型进行酶切鉴定,因此确认snp的频度是非常重要的。
3.样品质控从全部样品中取8%样品,即96个样品中取8个样品,用我们的一对特异的PCR引物进行样品质控,以检测送来样品是否良好。
因为客户样品质量是实验成功的关键因素之一,只有客户提供的样品质量可靠稳定,那么结果自然就好。
4.引物设计同时设计AB两套方案,分别以正链和负链为模板设计引物。
5.单管测试进行实验方案可行性尝试,首先要在多种温度,多种Mg离子、多种添加剂加入的情况下进行方案的可行性测试,对于所有单管测试的结果都送去测序,以保证序列的正确性,在实验结果得到确认的基础上,挑选稳定的方案进入中试过程。
6.中试抽取8个样品做小规模批量实验,以模拟和检查批量PCR情况和酶切情况。
7.大规模实验准备将DNA模板按方案进行一次性分板(有冗余),并引入阳性和阴性对照,同时将所有相关的PCR体系进行一次性大规模分装,防止污染。
8.第一板数据先用一板模板进行一轮PCR和酶切,以检验体系和分板的情况。
9.正式实验
相关技术要点
1.实验设计必需保证野生型的被限制性内切酶切开因为对于只有少量突变型的SNP位点,如果突变型被切开,那么所得到的实验结果就是大量没有被酶切开的PCR产物,而这个结果与酶切实验失败的结果非常类似,不易区分,对结果的判读造成很大的麻烦,因此保证了主频碱基被解开,从根本上保证了实验的可靠性。
2.偏向性扩增的解决。
所谓偏向性扩增是因为SNP位点上会往往存在嘌吟和嘧啶的替换,在PCR过程中,聚合反应对嘧啶(C或T)比较敏感,使得嘌吟(A或T)的扩增非常少,而出现偏向性扩增,这在SNP位点附近嘌吟含量较高时特别明显。
为此,本公司专门设计一个方案,用以克服偏向性扩增。
3.方案设计中的内切酶的选择虽然从理论上,我们的方案可以进行任意位点改造,但事实上在改造过程中会出现一系列的问题,包括扩增效率,碱基划移等一系列问题,使得改造方案失败。
对此,我们公司专业开发了一个引物设计软件,通过运算获得最佳的改造方案,同时通过在正向和反向序列上同时设计方案,以保证试验的成功。
4.PCR产物的污染问题在大规模的PCR过程中,最严重的问题是PCR产物污染,据我们经验总结,80%以上的污染是由于接触式污染,剩余的污染则包括气溶胶污染等环境造成的污染。
对于PCR污染这个问题,本公司制订了严格的实验措施,具体包括使用滤芯抢头、所有PCR体系全部
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SNP 检测 技术