基因簇的生物信息学分析设计.docx
- 文档编号:12881196
- 上传时间:2023-04-22
- 格式:DOCX
- 页数:42
- 大小:1.16MB
基因簇的生物信息学分析设计.docx
《基因簇的生物信息学分析设计.docx》由会员分享,可在线阅读,更多相关《基因簇的生物信息学分析设计.docx(42页珍藏版)》请在冰豆网上搜索。
基因簇的生物信息学分析设计
南京邮电大学本科生毕业设计(论文)
南京邮电大学
毕业设计(论文)
题目
miR-430基因簇的生物信息学分析
专业
生物医学工程
学生姓名
王凯
班级学号
B09090321
指导教师
李小慧
评阅教师
指导单位
地理与生物信息学院
日期:
2013年3月1日至2013年6月1日
毕业设计(论文)原创性声明
本人郑重声明:
所提交的毕业设计(论文),是本人在导师指导下,独立进行研究工作所取得的成果。
除文中已注明引用的内容外,本毕业设计(论文)不包含任何其他个人或集体已经发表或撰写过的作品成果。
对本研究做出过重要贡献的个人和集体,均已在文中以明确方式标明并表示了谢意。
论文作者签名:
日期:
年月日
摘要
microRNAs(miRNAs)是由基因组非蛋白质编码序列编码的一类小RNA(19-24nt),miRNA与靶基因的转录产物互补结合,导致mRNA降解、翻译抑制,调节靶基因的表达。
miRNA对动植物的生长、发育等各种生命活动发挥着至关重要的调节作用。
通常多个miRNA基因在染色体上聚集排列形成miRNA基因簇,这些miRNA基因簇在不同物种中有较高的保守性,miRNA基因簇在功能上比单个miRNA的作用更高效,对miRNA基因簇进行研究,有利于深入了解miRNA所参与的复杂调控网络。
miR-430基因簇最早在斑马鱼中被发现,是目前已知的最大的miRNA基因簇之一。
miR-430簇分布在斑马鱼4号染色体上约20kb的一个区域内,三个miRNA(mir-430a,c和b)组成了三联体,并以此为基本单元进行复制。
miR-430在早起胚胎发育中丰度最高,通过抑制和降解母源基因在母源调控向合资调控的转换过程中起到重要作用。
本课题主要开展miR-430基因簇分子进化分析研究。
主要的步骤:
从miRBase数据库中获得数据,即已知的mir-430基因的成熟序列。
根据斑马鱼、青鳉、红鳍东方鲀等物种的mir-430基因的成熟序列通过同源性对比的方法在所有动物物种中进行搜索,利用BLAST软件进行相似性比较的分析。
利用CLUSTALW软件进行渐进的多序列比对。
利用MEGA4.1软件,以mir-430基因簇中的mir-430成员成熟序列构建系统进化树。
本课题的目的主要是根据miRNA基因在物种间的保守性,利用生物信息学同源性搜寻、对比的方法,探讨miR-430基因簇的分子进化规律,揭示miR-430基因簇的起源及相关物种的进化关系,为其调控网络的研究提供理论基础。
关键词:
MIR-430、NCBI、Blast、ClustalW、MEGA4.1
ABSTRACT
microRNAs(miRNAs)areaclassofsmallnon-proteincodingsequenceencodedbythegenomeRNA(19-24nt)miRNAtargetgenetranscriptscomplementarybinding,leadingtomRNAdegradation,translationalrepression,regulateexpressionoftargetgenes.miRNAgrowth,developmentandotheractivitiesoflifeonplantsandanimalsplayacrucialregulatoryrole.UsuallymultiplemiRNAgenesarearrangedtoformmiRNAgeneclusteronchromosomegathered,thesemiRNAgeneclusterswereconservedindifferentspecies,miRNAgeneclustersarefunctionallymoreefficientthanasinglemiRNAmiRNAgeneclusterstudy,isconducivetotheunderstandingofmiRNAinvolvedincomplexregulatorynetworks.
miR-430geneclusterwasfirstfoundinzebrafish,isthelargestknownmiRNAgeneclusterone.miR-430clusterlocatedwithinanareaofabout20kbzebrafishchromosome4,threemiRNAs(miR-430a,candb)thetriplet,anduseitasthebasicunitofreplication.miR-430inearlyembryonicdevelopmentintheabundanceofthehighestinthematernalregulationplayanimportantroleintheconversionprocessofjointcontrolbyinhibitingthedegradationofthematernalgene.
Topicsusingmolecularevolutionanalysis.Mainsteps:
dataobtainedfromthemiRBasedatabase,eachspeciesprecursorofmiR-430genesequence.PrecursorsequenceofmiR-430geneinzebrafish,medaka,redfinspufferspeciesbyhomologycomparisonmethodinallanimalspeciestosearchusingBLASTsoftwarefortheanalysisofthesimilaritycomparison.UseofCLUSTALWSoftwareprogressivemultiplesequencealignment.UseMEGA4.1software,theprecursorsequenceofmiR-430membersofthemiR-430geneclusterphylogenetictreewasconstructed.
ThepurposeofthisprojectisbasedonmiRNAgenesconservedbetweenspecies,bioinformaticshomologysearch,contrast,investigatethemolecularevolutionofmiR-430geneclusterslaw,torevealtheoriginofthemiR-430geneclusterandrelatedtheevolutionaryrelationshipsofthespecies,forthestudyofregulatorynetworksprovideatheoreticalbasis.
KEYWORD:
MIR-430;NCBI;Blast;ClustalW;MEGA4.1
第一章引言
1958年,DNA双螺旋结构的发现者之一,佛朗西斯.克里克[1]提出了分子生物学的中心法则,即“遗传信息从DNA传递给RNA,再从RNA传递给蛋白质,完成遗传信息的转录和翻译的过程,也可以从DNA传递给DNA,完成DNA的复制过程”。
这是所有具有细胞结构的生命所遵循的普遍法则。
根据这一原理,RNA分子在生命过程中主要起信息传递,指导细胞蛋白质合成的作用。
然而,随着近年来非编码RNA分子,特别是microRNA(miRNA)的发现,这一原则正遇到越来越多的挑战。
miRNA是一类长度约为22个核普酸的内源性非编码RNA分子,可通过干扰mRNA指导蛋白合成过程,负向调节蛋白编码基因的表达。
作为一类进化上保守的、起重要调控作用的分子,miRNA通过与靶标mRNA分子3’一非编码区(3’-untranslatedregion,3’-UTR)完全或非完全互补结合,miRNA能有效抑制相关蛋白的合成,或导致靶mRNA降解,产生基因沉默效应。
研究表明,miRNA可能为调节基因表达的转录后调控的中心分子。
目前已在多个门类的生物中发现miRNA的存在,包括植物、动物、某些病毒和藻类等。
研究表明miRNA可能存在于所有多细胞生物以及少数单细胞生物中,起基因表达调控的作用。
早在1993年,Lim等人[2]采用定位克隆的方法在线虫(Caonorhabdttislegans)中发现了第一个miRNA分子lin-4。
Lin-4基因不编码蛋白,而是产生一种小分子RNA,这种小分子RNA能与靶mRNA的3’-UTR相互作用,从而抑制Lin-14基因表达。
Lin-4的缺失导致线虫幼虫由L1期向L2期的转化发生障碍。
这一发现当时并未引起人们重视,直到2000年第二个miRNA一let-7的发现,miRNA在基因表达调控领域的重要作用才逐渐被人们所认识。
与lin-4类似,let-7与lin-41基因的3’-UTR互补结合抑制其蛋白表达。
Let-7序列与行为模式在包括人类在内的多个物种中高度保守,暗示了miRNA的调控行为可能是一种普遍的模式。
目前己有数以千计的miRNA在不同物种中被发现。
迄今为止,在miRBase数据库中己有15,172条己注释的miRNA序列。
其中包括:
1048条人类miRNA,672条小鼠miRNA,176条果蝇miRNA,175条线虫miRNA以及213条拟南芥miRNA。
预计在人类基因组中编码的miRNA分子的基因总数可能占到基因总数的2-3%,它们可能多种物学过程中扮演了重要的角色。
己证实miRNA参与到包括胚胎发育、细胞凋亡、细胞分裂、分化、死亡、造血作用、癌症发生以及病毒感染等多种基因表达调控途径。
对这些小分子RNA相关的生物信息学与进化分析的基因序列、加工表达方式、功能等方面的研究表明其系统发育广泛性与进化保守性的特点,暗示了其在生命活动中复杂的调节方式,并可能对构建多细胞组织起精确调控遗传网络的作用。
1.1miRNA生物发生及作用机制
1.1.1miRNA的生物发生
miRNA的生物发生是一个多步骤过程。
以动物为例,多数miRNA过RNA聚合酶Ⅱ,少数通过RNA聚合酶Ⅲ转录为长度在数百至数千核普酸的初级转录本,初级转录本其5’-端多具有7-甲基鸟嘿吟帽子,3’-端具有poly(A)结构。
在细胞核中,初级转录本在辅助因子DGCR8帮助下被核酸酶Drosha加工成长度约为60-80nt的非完全互补茎-环结构,称为前体miRNA。
前体miRNA在辅助因子Ran的参与下,与细胞膜转运蛋白Exportin-5结合,由细胞核转移至细胞质中,这一过程需要以及GTP的水解提供能量。
在细胞质中,前体miRNA在另一种核酸酶Dicer:
及其辅助因子TRBP作用下,被进一步切割为18-24nt的双链miRNA分子。
其中的一条或两条链同时作为成熟的miRNA分子与蛋白质结合形成核糖核蛋复合体miRNP,或称为RNA诱导沉默复合物,其后miRNA通过与靶基因mRNA3’-UTR区互补配对,发挥基因表达调控作用。
植物细胞中miRNA的发生过程与动物miRNA稍有不同,其加工过程主要在细胞核内完成。
Pri-miRNA在细胞核内由Dieer-likeprotein和其他蛋白,如HYLI的参与下加工为pre-miRNA,pre一m1RNA进一步被DCLI加工为miRNA-miRNA*双链复合体,之后被HENI蛋白甲基化后在HASTY蛋白(与动物ExPortin-5基因同源)的协助下从细胞核运往细胞质,在解旋酶作用下加工为成熟的miRNA,降解特定的靶基因。
1.1.2miRNA作用机制
miRNA与靶标mRNA通过碱基互补配对而发生作用,通常miRNA5’-端的第2-8个核普酸对于miRNA发挥调节功能至关重要,这段区域与3’-UTR靶位点完全互补配对,被称为seed区,其在同源miRNA中通常保守。
miRNA靶序列在不同物种中也通常保守。
已证实miRNA主要存在两种不同的作用机制:
降解mRNA或抑制mRNA翻译。
通常情况下,如果miRNA与mRNA的3’-UTR非完全互补结合,则mRNA不被降解而产生翻译抑制,如果二者具有较高互补程度或完全互补,则导致mRNA降解。
通常认为在动物细胞中miRNA与靶基因序列具有较弱的互补性,多导致翻译抑制。
通过高通量表达谱分析表明,动物miRNA对多个mRNA同时产生降解作用,造成靶基因mRNA表达水平的不同程度的下降也可能是一种普遍的现象。
相对而言,在植物细胞中miRNA通常与靶基因有较高程度的配对,因而多导致靶
mRNA的降解,而较少看到翻译抑制的现象存在,如miR-39或miR-171与其靶mRNA完全互补,切割降解靶基因mRNA。
1.2miRNA基因的结构特征
miRNA基因通常位于蛋白编码的基因间区域,约有三分之一的miRNA位于已知蛋白编码基因内含子区的有义或反义链上,miRNA前体在同一或不同染色体中常呈单拷贝或多拷贝存在,2-3个甚至更多个miRNA基因排列在一起,共同转录为多顺反子RNA。
例如miR-17-92基因簇,在人类中共由6个成员组成,而在果蝇中则由8个成员组成。
Ambros等人[3]提出了miRNA基因识别与鉴定的一系列标准:
(l)通过Northem等方法可以从RNA样品中检测到22nt左右的转录本;
(2)由分级分离得到的RNA分子构建的cDNA文库中得到的长度为22nt左右的序列,这些序列必须精确地与来源生物的基因组序列相匹配;
(3)具有可以预测的发夹结构前体,在其中一条臂上具有成熟的miRNA分子。
该发夹结构必须具有最低的能量状态,并且在发夹结构的其中一条臂上必须含有22核普酸中的至少16个,预测的前体miRNA二级结构中不应该有大的内部环、泡等结构。
在动物中,该发夹结构通常为60-80nt,而在植物中该前体长度变化较大,甚至可能达到数百nt;
(4)miRNA及其发夹结构前体在进化上高度保守。
保守的发夹要符合标准3中最少配对碱基数的要求,但不必是能量最低;
(5)如果Dieer功能降低或丧失,应可检测到前体miRNA分子在细胞内积累。
1.3miRNA命名规则
由于发现的miRNA数量众多,为防止混淆,除最早发现的lin-4,let-7及lsy-6之外,研究者们对于其他miRNA统一用miR-#(#为数字)表示,其基因则记为mir-#(#为相应数字)。
高度同源的miRNA在其后加英文字母加以区别,多拷贝miRNA基因再其后再加数字。
(1)除了lin-4和let-7外,其他miRNA统一用miR-#(#为数字)表示,mir-#(#代表数字)表示相应的编码基因。
(2)高度同源的miRNA在#后加英文小写字母(般从a开始)。
(3)多基因拷贝的在后面加-No(如miR-2a-I)。
之后人们又对命名规则作了补充。
不同物种中同源的miRNA最好用同一个名字;如果一个前体的两条臂上分别产生一个miRNA,则根据克隆实验,观察成熟产物,次要的在后面加
“*”号,如果蝇的miR-306与miR-306*(*表示量少的):
如果不能区分表达量的多少,可以如下表达:
如拟南芥的miR-835-5p和miR-835-3p(5p表示在5’端的臂上,3p表示在3’端的臂上)。
1.4miRNA相关功能
首先,miRNA的生成过程起始于pri-miRNA的产生,,它由细胞核内编码miRNA的基因转录生成,长度为几百到几千个核苷酸。
Lee等人证明其中一大类miRNA由多聚酶Ⅱ(PolⅡ)转录,,而且一些miRNA的转录本(如let-7)具有5′帽和3′poly(A)的结构。
Rodriguez等在基因组水平对miRNA的转录也进行了分析,哺乳动物中由内含子编码的miRNA,其转录酶应该是PolⅡ。
其次,pri-miRNA在核内被RNaseⅢ核酸酶Drosha加工成长约70nt的发夹状的pre-miRNA。
在这个过程中,Drosha和另外的一些成分(如人类中的DGCR8蛋白、果蝇中的Pasha蛋白)构成一个微小RNA处理器(microprocessor)的复合体,pri-miRNA在这个microprocessor中被加工成pre-miRNA。
最后,pre-miRNA在Ran-GTP依赖的核质/细胞质转运蛋白exportin5的作用下,从核内运输到胞质中。
能与exportin5结合的pre-miRNA必须具有大于16nt配对的茎和3′末端有2个悬垂碱基的结构特点。
胞质中pre-miRNA在Dicer酶的作用下,被切割成双链的miRNA∶miRNA*配对分子,然后成熟的miRNA分子被解链,单链的miRNA进入一个核糖蛋白复合体miRNP(也叫RISC),通过与靶基因的3′UTR区互补配对,指导miRNP复合体对靶基因mRNA进行切割或者翻译抑制。
MiRNA到底是抑制还是切割取决于miRNA与靶序列互补配对的程度,互补配对高的可能进行切割,而配对低的就只是抑制。
近年来,关于miRNA的研究已经从识别miRNA、阐明其作用机制,转移到鉴定其功能。
并且,随着生物信息学的预测方法、原位杂交、过量表达、基因沉默技术等的发展,一些miRNA的功能已经得到确认。
这些miRNA的作用遍及生命体的发生、生长、发育、分化、信号转导、疾病和死亡的过程。
1.4.1miRNA对动物发育的调控作用
通过DNA芯片技术,Krichevskv等[4]在2003年证明了在哺乳动物脑发育阶段miRNA表达的精确调控,约有20%的miRNA的表达发生了显著变化,其中miR.19和miR.131表达失调时,无早衰素的老鼠表现出严重的大脑缺陷;随后相继发现,miRNA在调控线虫神经系统发育过程中发挥重要作用;美国哈佛医学院的研究人员研究发现,miRNA通过转录后抑制HOX基因表达,在脊椎动物发育过程中发挥重要作用;美国华盛顿大学的研究人员证明在干细胞不断分裂的过程中
miRNA是必要的条件;Bruneau[5]发现了miRNA是心脏形成过程的一个靶标,同年,美国西北大学和卡耐基梅隆大学的研究人员合作研究发现,miRNA在调节卵生长过程中起到重要的作用。
在肌肉发育方面,AlexClop等[6]证实,Texel绵羊中的GDF8基因的3'UTR内的一个点突变产生了一个可以在骨骼肌内高度表达的两个miRNA,即miR-1和miR-206,它们同时作用的靶位点,从而引起miRNA介导的myostain浓度在转录后降低而造成肌肉造成肌肉肥大;Chen等证实,miR-1通过作用于HDAC4而促成肌细胞分化为成熟的肌肉细胞,抑制细胞扩增,miR-133则通过抑制SRF而促进成肌细胞扩增,抑制其分化。
1.4.2miRNA对动物疾病发生的影响
研究表明,miRNA与人类的肿瘤形成、癌症发生密切相关。
Michael等[7]发现在人类直肠瘤形成过程中,miR-143和miR-145表达量保持较低水平:
VandenBergA等用SAGE技术研究发现,霍奇金淋巴瘤中miR-155/BIC高度表达(达91%),作为对照,其在非霍奇金淋巴瘤中几乎不表达;随后Calin等[8]发现,在超过68%的慢性淋巴细胞白血病例中,miR-15a与miR.16a水平双双下调;Takamizawa等[9]发现肺癌病人的let-7表达显著降低;还有研究表明:
淋巴瘤中,miRNA的一类miRl7-92可能是潜在的致癌基因,并且发现一种叫做e-Myc的转录因子能调节miRNA;2006年,美国俄亥俄州立大学的Volinia等[10]通过分析来自肺部、胸部、胃部、前列腺、结肠和胰腺等处的癌细胞样品540份,发现了有过量表达的部分miRNA组成的实体癌症miRNA信号,在这些miRNA中包括miR-17-5p、miR-20a、miR-21、miR-92、miR-106a和miR-155。
这说明miRNA在实体肿瘤的癌症发病机理中发挥着重要的作用。
1.4.3miRNA对动物细胞增殖和凋亡的影响
Hipfner等[11]在果蝇体内鉴定出第一个与增殖相关的miRNA基因Bantam及其靶基因hid。
Bantam与hidmiRNA的3'UTR互补结合,阻止了hidmiRNA的翻译,抑制蛋白的表达,最终表现为促进细胞增殖的作用;随后,Xu等在果蝇体内发现了另一种凋亡抑制miRNA--miR.14。
miR-14的缺失促进了Reaper以来的细胞凋亡的发生,尽管果蝇仍能存活,但对压力反应过敏,生存期缩短;耶鲁大学分子发育生物学和细胞发育生物学系还证实了miRNA对衰老和死亡的调控作用,miRNA可以阻止细胞过早死亡。
动物miRNA的负调控功能不仅局限于抑制靶基因转录,Brennecke等利用人工构建的与Bantam完全互补的靶基因,证实了动物
miRNA一样可以引起靶基因的降解。
还有研究发现,miR-196基因和靶基因Hoxb8匹配得非常完美,导致靶基因mRNA的降解,从而达到调控作用。
而植物中的miRNA几乎都引起靶基因降解,这是植物miRNA和动物miRNA的一个重要的区别。
植物miRNA同靶基因配对完美,而且它们的互补位点可以位于靶基因转录区域,而不是限制在3'UTR。
在研究拟南芥花发育过程中发现的miR.172是作为转录抑制基因出现,它同靶基因APETALA2(AP2)的互补位点却位于编码区域,而非3'UTR。
1.5miRNA鉴定方法
迄今发现的miRNA主要通过两种途径获得,即构建富集miRNA的cDNA文库和生物信息学方法。
(1)cDNA文库法
该方法是首先从细胞组织中提取总RNA,用聚丙烯酰胺凝胶电泳进行大小分级,回收大小在20~25个核苷酸的RNA分子,利用T4连接酶,直接将人工合成的5′和3′接头连接到RNA上后,用PCR反转录扩增这些序列,获得miRNAs的cDNA文库,再将这些cDNA进行克隆、测序,然后用生物信息学软件对其进行基因组中定位,并验证是否具有发夹结构的前体以及该发夹结构在其它物种中的保守性,最后将具有发夹结构的小分子RNA进行Northern杂交等以检测其表达情况,最终将符合miRNA标准的小分子RNA鉴定为新的miRNA。
但是,对于部分表达丰度低、且具有组织和阶段表达特异性的miRNA,以及一些由于自身的物理因素,如序列成份和转录后修饰等,而很难通过克隆的方法得到的miRNA,通过建文库的方法寻找miRNA具有明显的局限性。
除此之外,一些内源性的小RNA以及mRNA和其他非编码RNA的降解产物对克隆也具有一定的干扰作用。
(2)生物信息学方法
生物信息学方法是依据在不同的物种中,成熟的miRNA具有较大的序列同源,前体的茎环结构具有相当大的保守性,其结构和序列的热力学稳定性与已知miRNA具有相似性,以及miRNA在基因组中往往是成簇
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基因 生物 信息学 分析 设计