骆驼科动物基因组研究进展.docx
- 文档编号:6690805
- 上传时间:2023-01-09
- 格式:DOCX
- 页数:10
- 大小:28.30KB
骆驼科动物基因组研究进展.docx
《骆驼科动物基因组研究进展.docx》由会员分享,可在线阅读,更多相关《骆驼科动物基因组研究进展.docx(10页珍藏版)》请在冰豆网上搜索。
骆驼科动物基因组研究进展
骆驼科动物基因组研究进展
明亮1陈钢粮2吉日木图,3
(1.内蒙古农业大学乳品生物技术与工程教育部重点实验室,内蒙古呼和浩特010018;2.MongolianUniversityofScienceandTechnology,UlaabatarMongolian;3.内蒙古骆驼研究院,内蒙古巴丹吉林737300)
摘要:
从结构基因组学和功能基因组学上分别阐述了骆驼科动物基因组学的研究现状,基于全基因组测序结果探讨了不同骆驼科动物的起源进化,并对骆驼科动物全基因组测序的后续研究进行了概述;进一步讨论了骆驼科动物全基因组测序面临的挑战以及今后的研究重点。
关键词:
双峰驼;单峰驼;羊驼;基因组
AdvanceongenomesequencinginCamelids
Ming-liang1ChenGang-liang2Jirimutu1,3
(1.KeyLaboratoryofDairyBiotechnologyandBioengineering,MinistryofEducation,InnerMongoliaAgriculturalUniversity,Hohhot,InnerMongolia,010018,China;2.MongolianUniversityofScienceandTechnologyUlaabatarMongolian;3.CamelProtectionAssociationofInnerMongolia,Hohhot,InnerMongolia,010018,China)
Abstract:
Thisreviewdescribedtheresearchprogressinthestructuralgenomicsandfunctionalgenomicsofcamelids.Atfirst,weinvestigatedtheevolutionhistoryofcamelids,andsummarizedtheprogressofcamelidspost-genomicresearch.Challengesingenomicsforcamelidsareraisedandthefutureofpost-genomicsresearchinterestsincamelidswasdiscussedintheend.
Keywords:
Bactriancamel;dromedarycamel;alpaca;genome
骆驼科是哺乳动物(mammalian)偶蹄目、胼足亚目中唯一一个生存至今的科,目前主要包含骆驼属、羊驼属、小羊驼属(羊驼)[1]。
骆驼属中主要包含单峰驼和双峰驼;单峰驼原产于北非和亚洲西部及南部,主要饲养于阿拉伯、印度及北非的一些国家,在非洲的一些国家,单峰驼又被称为阿拉伯驼;双峰驼起源于伊朗和土库曼斯坦南部,主要分布在中亚的一些国家,并在公元前1000年左右扩散到中国北部和西北地区[2]。
小羊驼属主要包含羊驼,羊驼主要分布在安第斯山区和南美洲南部的草原、半荒漠地区,被称为美洲驼。
自古以来,单峰驼和双峰驼是荒漠、半荒漠地区人民的货物运输工具及奶、肉的主要来源;而羊驼一直都是以其优质的毛纤维得到广泛的关注。
结构基因组学(structuralgenomics)是基因组学的一个重要组成部分和研究领域,它是通过基因作图、核苷酸序列分析以确定基因组成、基因定位的一门科学[3]。
功能基因组学(functionalgenomics)是利用结构基因组学提供的信息和产物,发展和应用新的实验手段,通过在基因组或系统水平上全面分析基因的功能,使得生物学研究从对单一基因或蛋白质的研究转向多个基因或蛋白质同时进行系统的研究的一门科学[4]。
随着基因组学的发展,包括以全基因组测序为目标的结构基因组学和以基因功能鉴定为目标的功能基因组学的不断发展,为科研工作者深入了解骆驼科动物基因组、认识基因与性状之间的联系提供了有效的途径。
为解决如何确定大量基因序列功能的问题,进而了解基因与基因之间通过其产物而形成的控制生物体代谢和发育的调节网络提供了一种有效的方法;更为双峰驼、单峰驼和羊驼育种工作提供了充足的基因资源。
1骆驼科动物结构基因组研究
1.1骆驼科动物基因组特点
骆驼科动物基因组方面的研究起步晚、进度慢;直到2012年才完成了世界首例双峰驼全基因组序列图谱的绘制和解析工作[5]。
此次工作是由内蒙古农业大学、上海交通大学、中国科学院上海生命科学研究院、南开大学、上海生物信息技术研究中心等研究机构的科研人员合作完成,并在《自然·通讯》杂志发表其研究成果。
之后2014年[6],由内蒙古农业大学、深圳华大基因研究院以及沙特阿拉伯阿卜杜拉国王科技城国家生物技术中心等多家单位的科研人员成功破译骆驼科动物的基因组序列;此次研究对一峰双峰驼、一峰单峰驼和一峰羊驼进行了高深度全基因组从头(denovo)测序,并同时结合双峰驼的转录组数据,研究骆驼的沙漠适应性以及骆驼科物种的进化历程;该研究成果已于《自然·通讯》杂志发表。
此外,2013年由澳大利亚的研究人员[7]从头(denovo)组装了鸟枪法测序的一峰双峰驼全基因组序列,并进一步确定了杂合的SNP、评估了群体参数和核苷酸多样性。
Robert等[8](2015)对北非的一峰雌性单峰驼进行了从头(denovo)组装,其测序深度达到了65×,基因组大小为2.06Gb。
骆驼科动物全基因组数据比较见表1。
表1骆驼科动物全基因组数据比较
物种
测序方法
测序深度
基因组大小
ContigN50(kb)
ScaffoldN50(Mb)
基因数量
重复序列比例
文献来源
野生双峰驼
Illumina
Solid
Roche
76×
2.38Gb
85
2
20821
34%
Jirimutuetal[5],2012
家养双峰驼
Illumina
79.3×
2.01Gb
24.9
8.7
20251
30%
HuiGunagWuetal[6],2014
家养双峰驼
Illumina
6.56×
1.57Gb
2.8
_
_
_
Pamelaa.Burgeretal[7],2013
单峰驼
Illumina
65×
2.01Gb
54.1
4.1
20714
38%
HuiGunagWuetal[6],2014
单峰驼
Illumina
65×
2.06Gb
-
1.5
21167
34%
RobertR.etal[8],2015
羊驼
Illumina
72.5×
2.05Gb
66.3
5.1
20864
32%
HuiGunagWuetal[6],2014
1.2骆驼科动物起源的研究
骆驼科动物起源、进化问题的探究主要围绕在其线粒体基因组的研究;线粒体DNA(mitochondrialDNA,mtDNA)具有母系遗传、进化速度快、无重组等特点[9,10]。
程佳[11](2009)根据家养双峰驼mtDNA细胞色素b(Cytochromeb,Cytb)基因序列和D-loop区序列进行分析表明,我国家养双峰驼的线粒体DNA的遗传多样性比较丰富;由mtDNACytb基因序列和D-loop区序列得到的系统发育树一致表明,试验中的家养双峰驼类群与现存的野生双峰驼不是一个母系起源,现存的野生双峰驼作为一个独立的支系,不是家养双峰驼的直接祖先,或者说我国家养双峰驼的祖先与现存的野生双峰驼并非同一个亚种。
吉日木图等[12](2009)为了进一步研究家养双峰驼和和野生双峰驼进化上的关系对两峰野驼和三峰家驼的线粒体基因组进行了测定,也得到了以上的结论,为现存的野双峰驼和驯养的双峰驼可能没有共同的祖先,至少在他们的母体起源上不是一样的亚种;此外,线粒体基因组序列的分子钟分析表明,两个谱系的亚物种形成大概在70万年前的更新世早期就开始了。
人们对羊驼的起源在传统分类学中有很多异议。
Miranda等[13](2001)对羊驼(alpaca)和美洲驼(Llama)的线粒体分析研究表明,羊驼的祖先为骆马(vicuna),应该把羊驼划分到羊驼属(Vicugnapacos)中。
董常生等(2006)[14]对羊驼Cytb基因序列的测定并与骆驼科其它物种细胞色素b基因进行同源序列比较,从分子水平上探讨了羊驼在骆驼科物种中的分类地位;结果表明,羊驼与骆马和美洲驼存在的遗传差异相对比羊驼与原驼大,与传统的形态分类基本相一致。
PengCui等[15](2007)拼接了野生双峰驼、羊驼的线粒体基因组序列,研究羊驼和骆驼的分歧时间,并利用拼接的序列构建了一个系统发育树;发现双峰驼和单峰驼的分歧发生于北美洲,在骆驼从北美洲向亚洲迁移前;双峰驼和羊驼分歧于2.5亿年前,早于化石考证的时间。
HuiGuangWu等[6](2014)采用了双峰驼、单峰驼、羊驼和7个其他物种(牛、马、狗、大熊猫、人、小鼠和负鼠)的7398个单拷贝同源基因构建了系统发育树;结果表明羊驼和有峰驼(单峰驼和双峰驼)分歧发生于1630万年前,表明骆驼族(Camelini)和羊驼族(Lamini)分歧发生在北美,分歧时间大约1700万年前,这与考古学家所发现的时间一致;单峰驼和双峰驼分歧大约发生在440万年前;推测早在中新世晚期,在北美洲骆驼族与羊驼族有共同祖先,之后在724.6万年至490万年间他们相互分歧之后双峰驼和单峰驼从北美州通过白令海峡到达欧亚大陆。
2骆驼科动物功能基因组研究
骆驼(双峰驼和单峰驼)经过长期的自然选择,具备了许多特殊的生物学特性,具有极强的耐渴、耐饥饿、耐受高血糖、沙漠适应、温差适应、嗅觉灵敏等能力。
研究人员在测定双峰驼和单峰驼全基因组序列的基础上进一步展开了对其独特生物学特性相关功能基因的研究。
而对于羊驼而言,以上独特的生物学特性都不明显;羊驼功能基因组方面的研究主要围绕其毛色性能相关的一些基因。
2.1双峰驼和单峰驼功能基因组的研究
2.1.1能量代谢相关的功能基因
能量的代谢和储存对于食物匮乏的沙漠地区的骆驼而言是至关重要的;研究人员[6]对双峰驼、单峰驼和羊驼的基因组测序发现,在能量、葡萄糖和脂肪代谢类别中的很多基因都进行了快速进化。
骆驼科动物峰数(双峰、单峰和无峰)不同也会影响其脂肪代谢能力;研究表明在单峰驼和双峰驼基因组中与ATP(GO:
0006200,GO:
0016887,GO:
0042626)、线粒体(GO:
0005739,GO:
0005759)、脂质转运(GO:
0006869)、胰岛素(GO:
0032868)等功能类别中的基因进行了快速进化;而在双峰驼基因组中脂质代谢类别中的基因比单峰驼基因组中相应类别中的基因显示了更快的进化速度;这些基因可能增强了骆驼科动物脂肪的储存和脂肪产生能力。
表明双峰驼在脂肪储存和产生能力上强于单峰驼和羊驼。
2.1.2应激能力
应激能力是指对酷热和干旱沙漠地区的适应能力。
双峰驼和单峰驼基因组中与DNA损伤和修复(GO:
0006974,GO:
0003684,GO:
0006302)、细胞凋亡(GO:
0006917,GO:
0043066)、蛋白质稳定性(GO:
0050821)和免疫应答(GO:
0006955,GO:
0051607)相关类别中的基因显示了快速进化;比起羊驼双峰驼和单峰驼几个重要的功能类别如氧化还原过程、氧化还原酶相关通路中的基因进行了快速进化;此外,细胞色素c氧化酶活性和氮氧酶活性类别中的基因显示快速进化。
这些结果表明骆驼可以耐受严寒酷热的沙漠环境[6]。
2.1.3呼吸系统的适应性
沙漠地区的沙尘空气往往会提升哮喘等呼吸性疾病的发生率;然而骆驼终生生活与沙漠地区,不会导致呼吸疾病。
研究人员发现[6]与人类呼吸疾病相关的FOXP3,CX3CR1,CYSLTR2和SEM4A四个基因在双峰驼和单峰驼基因组中进行了快速进化;此外,在双峰驼和单峰驼基因组中,与肺相关类别(GO:
0030324)中的基因显示了快速进化。
这些正向选择基因的快速进化可以说明骆驼更容易适应沙漠环境。
2.1.4对盐的适应性
众所周知,骆驼长期生活在荒漠,半荒漠以及沙漠生态条件下,由于采食环境的限制,骆驼可以吃大量的盐分很高的食草[16],却不会像人类一样因为进食盐含量过多而患上高血压。
对双峰驼细胞色素P450基因家族的研究表明,骆驼含有多拷贝的CYP2J基因,而CYP2J2的活性通常被高盐饮食激活,并且抑制其活性可诱发盐敏感性高血压[17]。
因此,研究人员推断骆驼拥有多拷贝的CYP2J可能与其耐高盐的独特的生理学特性相关[18]。
双峰驼含有两个拷贝数的NR3C2和IRS1基因(在其他哺乳动物中以上两个基因为一个拷贝),在肾脏中NR3C2和IRS1基因对钠离子的重吸收和水平衡方面起着重要的角色。
此外,比起牛双峰驼和单峰驼基因组中与钠离子迁移(GO:
0006814)类别中的基因进行了快速进化;结合以上的结果表明,骆驼比羊驼和牛更加有效的运输和代谢盐,而且这些通路对水的重吸收是非常重要的。
2.1.5解毒能力相关功能基因
在沙漠里,骆驼的食物来源很有限,他们吃的植物狼毒草是有毒的,其他动物一般不吃。
研究发现[18]双峰驼有6个拷贝的CYP3基因,牛只有4个,骆驼的这6个基因都属于CYP3A亚科。
这个亚科主要负责中和有毒物质,他们以尿的方式从我们体内排出[19],所以骆驼有更多拷贝的CYP3基因也就可以解释骆驼可以忍受有毒植物的原因。
2.1.6双峰驼血细胞抗旱性相关功能基因分析
双峰驼的红细胞呈椭圆形薄饼状,少数为卵圆形,这一特殊形态有利于其贮水膨胀,也有利于在血液中运行并变形通过毛细血管。
此外,双峰驼红细胞对渗透性溶解有很强的抵抗力,比牛、马的强很多。
在溶血前,它们可膨胀到原体积的196%,而一般家畜的红细胞胀大到150%以下时即发生溶解[20-23]。
研究人员[24]针对双峰驼这一独特的生理特性通过克隆获取了与双峰驼抗旱性相关的7个功能基因,分别为血红蛋白基因、肌动蛋白基因、内收蛋白基因、血型糖蛋白基因、原肌球调节蛋白基因、带4.1蛋白基因和血影蛋白基因。
2.1.7血糖相关功能基因的分析
通过对双峰驼基因组的测序,研究人员[5]绘制了双峰驼血糖调节的特殊代谢通路。
在双峰驼II型糖尿病的代谢和胰岛素信号传导通路中共有25个净化选择的基因,这些通过计算dN/dS值选择出来的净化选择的基因都是参与血糖调节相关的基因;如mTOR和GK都是相对牛来说净化选择的基因,这两个基因在血糖调节中是关键的基因。
mTOR可以通过磷酸化苏氨酸和丝氨酸的残基来抑制胰岛素受体底物。
GK的突变可能使物种的血糖耐受力增强。
相对于牛来说,骆驼净化选择的基因还有很多,如Cb1,aPKC,JNK,IKK,AMPK,PHK和FOXO1等。
双峰驼独特的血糖调节及许多特殊的净化选择的基因可以为糖尿病的治疗提供一定的资料。
2.1.8嗅觉相关功能基因
研究人员[5]在双峰驼基因组注释结果中发现了约742个嗅觉受体基因,总的数目与其他物种相比偏少,生存对气味依赖性较大的小鼠嗅觉受体基因有1500个,人类的嗅觉受体基因约有1000个,犬有1300个嗅觉受体基因。
比较基因组研究表明,哺乳动物的嗅觉灵敏性与基因组中OR基因的数目和比例有紧密联系,且呈现正相关趋势,同时有研究表明,哺乳动物基因组中的OR基因的总数,可在一定程度上反映出动物辨别气味种类的能力。
沙漠中的植被比较单一,我国最大的沙漠塔克拉玛干沙漠共有73种植物,分属22科,53属,其中,数目较多的科有黎科,柽柳科,禾本科,豆科和菊科,且大多数植被仅分布于沙漠边缘和深入沙漠的沿河两岸(塔克拉玛干沙漠公路沿线植被及特点)。
所以,骆驼的嗅觉受体数目较少,这可能是由于沙漠中的植被比较单一,所以可能骆驼某气味的嗅觉被加强了。
2.2羊驼功能基因组的研究
羊驼因其优质的毛纤维及其色彩多样的天然毛色越来越受到重视;直接利用天然色可免去深加工中漂白染色的程序节约成本亦可减少对环境的污染[25]。
羊驼毛色形成过程复杂但主要受控于遗传因素基因主要通过调控黑色素细胞的生成和分布来影响被毛颜色掌握毛色遗传规律发掘控制毛色相关基因科学育种将有利于提高毛产量。
Agouti(鼠灰色)基因参与羊驼毛色发生过程的调节且与白色被毛的发生相关[26];MC1R(黑素皮质激素受体1)[27]、TGF-β1(转化生长因子)[29]、APC(大肠腺瘤样息肉)基因与羊驼有色被毛相关[30]。
TYR(酪氨酸酶)基因在色素沉着过程中起到了调控作用并与羊驼棕色被毛相关[28];
3全基因组测序的后续研究
3.1重测序研究
目前只对骆驼科动物(双峰驼、双峰驼和羊驼)进行了单个个体基因组的从头测序(denovo);而对骆驼科动物个体间或群体结构方面的研究仅限于微卫星的分析方法[31-34]。
从基因组的水平揭示骆驼科动物群体间和群体内的差异分析还是一片空白;所以有必要对骆驼科动物基因组进行重测序。
基因组重测序是指对已知基因组序列的物种进行不同个体的基因组测序,并在此基础上对个体或群体进行差异性分析。
通过序列比对,可以找到大量的单核苷酸多态性位点(SNP)、插入缺失位点(InDel)、结构变异位点(SV),从而揭示骆驼科动物的起源以及驯化过程,为鉴定有价值的遗传资源以及骆驼育种提供重要参考。
3.2SNP芯片的开发
全基因组关联分析(genome-wideassociationstudy,GWAS)可以理解为候选基因关联分析的延伸,只是将标记扩大到整个基因组范围内[35]。
基于高密度SNP标记的全基因组关联分析是近几年提出的复杂性状功能基因鉴定的新政策;高密度SNP作为最新分子标记类型,具有密度高、分布范围广泛、分型简单等优点[36]。
其基本思想是通过直接检测基因本身或基因附近的微小区域的SNP标记与数量性状的表型信息的关联来实现基因的精确定位。
与传统的QTL定位方法(连锁分析和候选基因分析)相比,基因组关联分析突破了依赖于系谱以及基因组重组信息的束缚,直接利用基因内部或个体水平的SNP基因的连锁不平衡信息,使定位更加精确;全基因组关联分析不受已知生物学功能的基因的限制,能够从整个基因组范围内实现与目标性状关联基因的定位。
骆驼的肉、油、乳都是营养价值很高的食品[1]。
驼乳和驼肉品质一直是消费者和科研人员关注的重要问题。
在对高档驼肉和驼乳需求不断提高的今天,借助现代生物技术手段对我国乃至世界各地骆驼品种进行有效的遗传改良,是加快骆驼产业发展,提高骆驼肉品质和乳品质的一条重要途径。
然而在骆驼乳和肉质品质、性状关联分析方面还是一片空白;因此有必要开发研究骆驼全基因组SNP芯片,利用SNP芯片分型技术,在骆驼全基因组范围内进行SNP标记与肉质性状和奶质性状的关联分析,以期发现影响肉质性状的重要位点,为骆驼肉质性状和奶质性状的候选基因的功能验证提供分子理论依据[37-39]。
3.4转录组学研究
转录组学(transcriptomics)是功能基因组学研究的重要组成部分,从整体水平研究基因功能以及基因结构,揭示特定生物学过程以及疾病发生过程中的分析机理。
骆驼科动物转录组学(RNA-seq)方面的研究较少。
Abdulaziz等[40](2014)采用了表达序列标签(ESTs)进行单峰驼的转录组分析,共产生了70,272个reads,最后经过剪切、重复序列的屏蔽、分类和组装共得到了23,602个假定的基因序列,其中超过4,500个基因进行了快速进化;利用已有的碱基和蛋白质数据库对得到的基因进行了GO功能注释。
此外,HuiguangWu等[6]对双峰驼、单峰驼和羊驼进行全基因组测序的同时对双峰驼肾皮质和肾髓质两个组织进行了转录测序;通过转录组学分析发现其肾皮质上调的基因主要富集在金属离子的结合(GO:
0046872)和体内液体水平的调节(GO:
0050878)类别中;肾髓质上调的基因主要富集在葡萄糖代谢过程(GO:
0006006)、糖质新生(GO:
0006094)、能量代谢(GO:
0006091)和营养水平的应答(GO:
0031667)等类别中。
3.5数据库构建
随着测序技术的不断发展,全基因组测序的趋势已在向更多个体上进行,通过全基因组测序可以获得包括全基因组序列、转录组及表达序列、蛋白质组和代谢组数据、基因型和表型数据、遗传图谱和物理图谱在内的大量生物学信息。
因此,利用生物信息学工具和数据库分析、贮存、整合以及传播这些数据,为基础研究和应用研究提供使用的数据是非常必要的。
目前测序得到的野生双峰驼,家养双峰驼、单峰驼和羊驼的数据都已经提交到GenBank和Ensemble数据库中(http:
//www.ncbi.nlm.nih.gov/genome/11942;http:
//www.ncbi.nlm.nih.gov/genome/10741;http:
//www.ncbi.nlm.nih.gov/genome/10740;http:
//www.ensembl.org/index.html;登录号(accessionnumber)PRJEB407)。
这些数据将为深入开展骆驼基因组研究提供丰富的资源和数据。
4骆驼科动物全基因组测序面临的挑战及今后研究进展
通过全基因组测序虽然得到了大量数据,但是如何破解并利用这些数据成为了摆在研究者面前的巨大挑战。
因此在今后很长的一段时间内研究重点将从表现型依赖型研究转入基因型依赖型研究,从对单一基因的研究转入对整个基因组的研究。
在全基因组测序结果的基础上,选择不同品种或个体进行全基因组重测序,探索物种的起源与进化历程,填补双峰驼、单峰驼和羊驼参考基因组中的缺口,提高组装精度;对同以品种的不同时期、不同组织材料之间进行转录组学和代谢组学研究;对重要基因家族进行比较基因组学分析,并进行后续的功能验证实验过程;探索全基因组关联分析(Genome-wideassociationstudies,GWAS),评价决定个体基因型的成千上万单核苷酸多态性(SNPs),解决控制复杂的功能性状的遗传位点,这些将是骆驼科动物全基因组测序后续研究的重点和方向。
参考文献
[1]吉日木图,陈钢粮,云振宇.双峰驼与双峰驼乳[M].中国轻工业出版社,1-5,2009.
[2]常洪.动物遗传资源学[M].科学出版社,64-170,2009.
[3]庄金秋,贾杏林.功能基因组学研究进展[J].动物医学进展,25(4),32-36,2004.
[4]HieterP,BoguskiM.Functionalgenomics:
it'sallyoureadit[J].Science,278,601-602,1997.
[5]Jirimutu,ZhenWang,GuohuiDingetal.Genomesequencesofwildanddomesticbactriancamels[J],Naturecommunication,3,1-8,2012.
[6]HuiguangWu,XuanminGuang,MohamedB.Al-Fageehetal.Camelidgenomesrevealevolutionandadaptationtodesertenvironment[J].Naturecommunication.5,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 骆驼 动物 基因组 研究进展