基因测序行业深度分析报告.docx
- 文档编号:26283568
- 上传时间:2023-06-17
- 格式:DOCX
- 页数:35
- 大小:2.96MB
基因测序行业深度分析报告.docx
《基因测序行业深度分析报告.docx》由会员分享,可在线阅读,更多相关《基因测序行业深度分析报告.docx(35页珍藏版)》请在冰豆网上搜索。
基因测序行业深度分析报告
(此文档为word格式,可任意修改编辑!
)
2017年5月
正文目录
图表目录
测序技术:
不断更迭,性能不断提升
在生物学上,测序(sequencing)是指确定线形生物大分子(如蛋白质、核酸)一级结构的过程。
其中核酸测序(特别是DNA测序)由于生物学意义重大,获得的信息含量及其丰富,成本低廉,因而发展最快,应用最广。
后文中“测序”一般也指DNA测序(事实上对RNA的测序也是通过反转录酶将其反转录为DNA进行测序)。
绝大多数情况下,DNA序列仅四种经典碱基——A、T、C、G构成,但四种碱基构成了长达三十亿个碱基对的人类基因组,其中编码了丰富的遗传信息,对生物的生、长、衰、病、老、死等一切生命现象和生命繁衍、遗传变异有深远影响。
因此,对基因序列进行精确、廉价、快速的测定解析,是生物医学研究和临床实践的迫切需求。
测序技术被广泛应用于基础研究、医疗、工业、法医学等领域,市场潜力巨大。
根据测序技术的根本原理,目前已经成熟或基本成型的测序技术主要有三代:
以Sanger测序为代表的第一代测序,以Illumina边合成测序为代表的第二代测序,以及以各类单分子测序为代表的第三代测序(有人将尚未成熟的这些新技术进一步划分为第三代第四代测序,但我们认为目前并没有太大意义)。
衡量测序的关键指标:
读长、通量、准确度和成本
在比较各类平台前,我们认为对测序平台的衡量标准主要有:
读长、通量、准确度、成本四个方面:
读长是指测序反应所得到的读段(reads)的长度:
人的基因组是长达30亿碱基对的一篇“长文”,而测序反应每次只能“阅读”其中十分有限长度的一个“语句”,再通过比对软件将无数“语句”进行比对和拼接,推断基因组“长文”的序列情况,并进行后续生物信息学分析获取需要的信息。
如果测序平台的平均读长过短,将导致对测序数据生物信息学分析难度大幅提升,计算资源和时间的耗费大大增加、错误率明显上升,且对高度重复区域的reads难以有效比对。
在这方面,一代测序读长可达1000bp(basepair,碱基对);而二代测序由于反应原理限制读长普遍较短(数十至数百bp);三代测序读长最长,可达数千bp甚至数万bp以上。
通量指的是单次运行或单位时间内所能产生的数据量(以测序读取的碱基数量衡量,可简单理解为测序通量=Reads数×读长),其他技术水平接近的情况下,通量越高,则运行效率大大提升。
人类全基因组、全外显子组、全转录组的大规模测序所需的数据量极大,只有高通量测序仪才能有效率地在较短时间内完成测序任务。
而在同样时间内,通量大的测序平台能完成更深的测序深度,对低频率变异的检测效果更好,假阳性率假阴性率也更低。
图表1:
不同的平台的通量性能,越靠右上角通量越高,越能胜任大型测序任务
准确度:
样本扩增,DNA文库制备和测序反应都会引入错误。
当在肿瘤基因组学研究等领域中,测序结果被用于寻找很低频率的突变和结构变异,测序引入的错误非常容易造成误判,为保证测序结果和变异检测的可靠性,需要加大测序深度(即增加覆盖区域的测序次数)增加测序成本。
因此,准确性较差的测序平台后续更高的测序成本
成本则是技术性能以外最重要的考虑因素:
足够低的成本能一定程度上弥补技术性能的不足,而技术优势如要能够转化为市场成功,则合理的成本是必要条件。
一代测序技术:
金标准,成本高难以大规模商业化应用
第一代测序技术(Sanger测序):
诞生于20世纪70年代,共同特点是通过电泳来分离不同长度的DNA片段实现测序,主要有Sanger的链终止法和Gilbert的降解法,其中Sanger法应用最广,几乎是一代测序的同义词,也有成熟的、商品化的自动荧光测序仪。
一代测序技术是分子生物学发展史上的革命性的发明,使对遗传物质的解读成为可能。
研究人员正是运用一代测序技术完成了人类基因组计划(humangenomeproject,HGP)这一划时代的科学计划,也带来了相关产业的重大变革。
图表2:
经典一代测序仪机型——ABI3730xl
一代测序精确度高,读长可达1000bp(测序测得的片段长度),技术成熟可靠,是测序验证的金标准。
但通量低,且成本高(相对于二代测序),难以用于覆盖基因组大面积、商业化的测序应用。
二代测序:
高通量低成本,今后一段时期仍是主流
第二代测序技术(也称下一代测序NGS,大规模平行测序MassivelyParallelSequencing,高通量测序High-throughputsequencing),是2005年以来发展的新一代测序技术。
二代测序的原理丰富多样,但共同的特点是海量的测序反应同时进行,拥有远大于一代测序的速度和通量,同时成本却低得多。
二代测序的出现和不断优化,使基因测序成本降到前所未有的水平,速度和数据量却有极大上升,带来了基因组学研究的深远变革,基因测序也大范围应用到科研之外的多个领域,特别是在医疗诊断方面发挥了更大的作用。
代表性的平台有采用“边合成边测序”的罗氏454测序平台和Illumina测序平台,采用半导体测序的IonTorrent平台,以及采用“边连接边测序”SOLiD测序平台
图表3:
测序费用以超摩尔定律下降(箭头为二代测序诞生时间,单位:
美元)
经过十年的不断竞争和发展,目前二代测序成本已经较十年前下降10000
倍以上,速度和性能却不断提升。
三代测序:
才露尖尖角,科研界的大规模普及是首要里程碑
除了如日中天的二代测序,以单分子测序为特点的三代测序(划分有争议,
这里将NGS以后的新式测序技术统称为第三代测序)也已经逐步得到科研界和产业界的关注。
典型技术有PacificBiosciences公司的单分子实时测序(SingleMoleculeReal-Timesequencing,SMRT)技术和OxfordNanoporeTechnologies公司的纳米孔单分子测序技术。
其共同特征是不依赖PCR,并能够对单个DNA分子进行测序,纳米孔测序更直接对DNA进行直接观测测序,不需要进行双链合成。
其主要优势是:
高读长(1000bp以上,甚至可达10kb),大大降低生物信息学分析的难度和计算成本,拼接比对非常容易
Reads分布非常均匀,对很多突变类型有更好的检测能力
样本前处理不需要PCR,避免引入新的错误
相比二代测序,其错误是随机发生的,可以通过加大通量提高测序深度来减少错误率(同一个地方多测几次)
可以用于RNA测序,能够直接测序出完整的转录本
速度比二代测序快一些
图表4:
三代测序Reads分布非常均匀
但三代测序技术成熟度尚低,有两个致命问题影响了其实用性:
通量低:
二代测序仪一次运行能产生数十至数千Gb数据量,三代测序(以pacbio为例)一次仅数百Mb,而单次运行的成本基本上在一个量级。
单次测序反应错误率高:
相比二代单次反应,三代测序的单次测序错误率可达10%-20%,在一些应用中纳米孔测序错误率甚至大于35%。
这在检测稀有突变检测(典型的应用场景是肿瘤突变的检测)中是无法容忍的。
理论上,随机错误可以通过增大测序深度来克服,但第三代测序的低通量和高成本又使这一问题在当前成为死结。
由于这些缺陷,即使在科研上三代测序也往往只能和二代测序配合使用,因此当前讨论三代测序在临床诊断上的应用仍然为时过早。
提升技术成熟度,逐渐在科研上得到普及,才是三代测序当前发展阶段的目标。
图表5:
三代测序PacBioRS的错误是随机发生的
图表6:
部分上市测序平台性能和特点对比
测序策略的选择:
深度、广度和数量的权衡
除了不同测序平台的差异,不同测序策略的选择也是测序技术的重要内容。
按用途划分,基因测序可以分为从头测序(denovo测序)和重测序两大类。
从头测序是在没有参考基因组的情况下对一个物种的基因组进行测序、拼接和组装,重在获得该物种的基因组图谱,主要用于科研用途;而重测序则是在已知基因组序列的物种进行不同个体的测序,重在发现个体或群体的变异情况,被广泛运用于科研、医疗、公共卫生等多个领域,应用远比从头测序广泛。
在一个固定的的技术水平和经费限制下,测序产生的数据量是一定的,因此测序的深度(可以理解为同一个位置测序的次数)、覆盖度、以及样本数是矛盾的:
提高其中一个就必定以牺牲另外两个中的至少一个作为代价。
样本数主要体现在科研及公共卫生方面的应用中,如要有足够强的和统计力度和足够广泛的科学意义,则测序群体(cohort)必须有一定规模。
而在临床领域最重要的是深度和覆盖度的平衡:
如要检测基因组上更广阔的区域(提高覆盖度),就必须降低测序深度,从而损失了对低频率突变的检测能力(在肿瘤中,一些低频突变往往发挥了关键性的作用)。
灵活的选择测序策略和优化技术,也是测序在临床应用时必须考虑的重要因素。
图表7:
不同的测序策略在深度、覆盖范围和样本之间的取舍
测序上游产品篇:
大局已定,壁垒极高,国产平台道阻且长
测序产业链的上游主要是测序相关仪器及试剂的生产。
测序产品是高技术含量设备,技术壁垒极高,涉及机光电一体化、分子生物学、精细化学、纳米科学等多个领域,以产品性能论英雄,技术升级迅速(通量、速度、准确性不断提升,成本不断下降),目前已基本被国际巨头主宰。
二代测序设备及试剂市场中,Illumina公司通过不断更新的产品优势和有力的市场策略,已经成为二代测序硬件市场的赢家,占据75%以上测序市场份额,形成了从桌上小型测序仪到大型工业测序仪,从测序仪器到测序相关试剂的完整产品线,下游服务也已经开始布局。
而Thermofisher的SOLiD平台高通量测序已经败下阵来,长期未有更新,但其IonTorrent系列半导体测序仪则具备小巧、快速、自动化程度高等优点,拥有一定市场份额,主要适用于中小型规模应用场景
而罗氏和CompleteGenomics的测序平台已经退出市场(后华大基因收购CG而获得CG的测序技术,并在其基础上进一步发展推出了BGISEQ-500和BGISEQ-50等测序平台)。
三代测序方面,目前技术仍然在完善和成熟过程,主要企业PacBio和OxfordNanopore也仍在市场化进程中,目前规模仍然较小。
纵观测序工业企业的竞争力历史,性能和成本始终是决定胜负的最关键因素,这是一个以产品和技术能力作为核心实力的领域。
Solexa(后来被Illumina收购)、IonTorrent(后被LifeTech收购,LifeTech又被Thermofisher收购)乃至后来的PacBio等小型企业之所以能在不到十年时间里,以惊人的速度实现成长神话,核心因素也是技术上的优越性和领先性。
以国内的基础工业和科研创新水平,短时间内要直接挑战测序工业产品,我们认为为时尚早。
但采购试剂和测序仪器的高昂成本对国内下游服务企业产生了沉重的压力,供应采购受制于人甚至将对公司经营和业务开展造成风险(典型例子是华大与Illumina曾经的供货之争)。
因此部分领先企业开始和国际测序工业企业合作,合作生产(类似于贴牌)
测序仪,典型代表如与Thermofisher合作的华大基因、博奥生物、达瑞生物(基于IonProton平台),以及与Illumina合作的贝瑞和康、安诺优达。
这些合作测序一般属于中低端型号,适用于相对小型的测序应用,如无创产前诊断(NIPT)等。
但通过这些手段,服务企业可以降低采购成本,同时掌握初步的测序产品技术,对于国内相关产业发展同样意义重大(另一方面这样的选择也是因为我国医疗体制决定了相关业务难以全部从医院外包,后续我们会继续讨论这一点)。
走在行业最前列的华大基因已经通过收购CG公司获得其技术平台并进行后续开发和改进,打造拥有自主核心技术的测序平台。
但其产品性能和技术成熟度要达到与国外一流平台在同一档次竞争的程度,尚需时日。
图表8:
主要国产测序仪情况
图表9:
华大基因向Illumina的的采购占其成本很大比例
图表10:
贝瑞和康向Illumina采购费用的成本占比更突出
测序下游服务篇:
由NIPT到肿瘤基因组学,寻找下一个杀手级应用
国内企业地位巩固:
相比上游业务,我们认为基因测序服务将长期持续被国内企业主宰,国内企业不仅在渠道、服务和医院资源方面有巨大优势,基因检测服务掌握大量遗传资料,属于敏感领域,国外企业也难以涉足。
这一领域面向终端和患者,市场空间庞大,行业内优秀企业增长速度亮丽。
我们将当前基因测序服务分为四大领域:
研究与试验发展(R&D)类测序
生育健康相关
肿瘤基因组学
消费级测序需求
不同子领域的发展阶段和行业规律也有明显差别,下面我们将分别讨论。
图表11:
华大基因、贝瑞和康收入利润的快速成长
科研测序服务:
梦开始的地方,停滞后有望迎来转机
科研测序服务是测序产业的起点,也是国内基因测序企业最初起家的根基,华大基因、诺禾致源、贝瑞和康等企业在发展早期,科技服务均是其支柱业务和重要收入来源。
测序在生物学、医学、药学、农学等方面均有重要应用,例如:
物种基因组测定
药物研发
人群应用
农业应用
但我们认为这一领域是测序企业的“摇篮”,却难以让企业实现长期成长
科研市场规模限制:
科研测序服务的费用很大程度来自于科研机构获得的科研经费,这就注定了这一市场的规模较小
部分测序量较大的高校院所和科研机构自行购置测序平台开展测序,进一步分散市场。
科研类测序附加值较低,随着二代测序技术的成熟和普及,测序本身的成本一直在下降,市场降价趋势明显,科研市场的利润空间不断受到压缩
基础科研类服务市场门槛相对最低(对资质、规模、速度的要求不高),竞争者数目众多,竞争生态恶化导致服务单价及单个合同金额降低
从业务类型变化来看,21世纪前十年大量denovo测序(对物种基因组进行首次测序确定结构)项目的开展为测序服务企业提供了大量高毛利、大金额的服务订单。
但目前科研服务已经主要转向重测序、纯测序,订单金额和毛利率不断下降。
图表12:
华大基因和贝瑞和康科研收入及占比的下滑(单位:
万元)
技术革新有望带来集中度回升:
随着二代测序的成熟,高通量的工业级测序仪(如IlluminaHiseqXTen和IlluminaNovaseq等)的推出将有可能重新带来集中度的回升:
只有成规模的测序企业才有实力购买工业级的大型测序设备,从而获得成本、速度、通量上的巨大优势。
只有在这样情况下,当前科研服务类测序的行业格局才可能有改善机遇。
大规模人群队列测序是下一个重要机会:
二代测序的普及使低价基因组测序成为可能,而在精准医学和大数据时代的今天,大型人群队列研究已经成为流行病学研究的主旋律之一。
对数万人甚至数百万人的测序计划及队列研究,可揭示疾病的病因、评价预防效果、揭示疾病的自然史、掌握人口健康状况、引导实验设计,将知识转化为临床和人群早期诊断和干预策略,从而提高疾病防治水平,降低社会卫生负担。
近年来各类精准医学计划的出现更促进了大规模测序计划的繁荣,出现了以美国精准医疗计划、英国10万人基因组计划、法国基因组医疗2025计划、韩国万人基因组计划等为代表性项目。
2012年,英国政府提出10万基因组计划,在2017年完成对英国国民医疗保健制度(NHS)记录中的10万名病人的完整基因组进行测序。
其目标是根据基因组学和临床数据制定个性化的癌症和罕见疾病疗法,并使NHS成为“世界上第一个将提供基因组医学作为日常护理一部分的主流健康服务体系”。
2017年,英国生物银行宣布将与葛兰素史克制药公司(GSK)和美国再生元制药公司(RGC)合作,对该银行拥有的50万名志愿参与者样本进行基因测序;首批5万个样本的基因测序将于17年年底完成。
预计未来完成全部50万名志愿者样本的测序将耗资1.5亿英镑,历时3年—5年。
GSK和RGC对所产生的基因测序数据拥有9个月的排他期使用权,之后这些数据将被归入英国生物银行数据库,最终将对更多科学家和科技组织开放;所有的研究发现同样也将提交给同行审议的期刊发表。
国内也发起了中国新生儿基因组计划,计划从2016年起,在5年内开展10万例样本的新生儿基因检测,旨在构建中国新生儿基因组数据库,建立新生儿遗传病基因检测标准,促进新生儿遗传病基因检测的产业化,制定新生儿遗传病遗传咨询标准,联合医院进行遗传咨询培训,完善遗传咨询培训体系。
因此,我们认为随着这类公共卫生项目的落地,相对停滞的科研类测序市场有望再度迎来成长机遇。
在这一轮机遇中,测序服务机构的规模和效率门槛将大大升高。
生育健康诊断:
基因检测的第一个杀手级应用,百亿级市场
基因测序在生育健康相关方面的应用主要有无创产前检测(NIPT)、植入前胚胎遗传学诊断(PGD/PGS)、遗传疾病风险检测等。
其中NIPT是当前市场规模最大、最成熟的领域。
生育健康相关业务技术成熟,收入规模和成长速度可观,这一领域也有望诞生中国最早的以基因测序为主业的上市企业(华大基因、贝瑞和康)。
图表13:
中国人口出生情况
2016年,中国新出生人口达1786万,多年来首次出现回升,二胎政策初见威力。
出生缺陷在新生儿中比例较高,约占总数的5.6%,其中染色体非整倍体引起的缺陷是发病较高的疾病类型。
近百万缺陷新生儿对社会和家庭造成了沉重负担,完善和普及产前诊断有极大必要。
然而我国每年接受产前染色体异常诊断的产妇不到20万人次,这一方面是因为羊水穿刺、绒毛活检、脐静脉穿刺等技术的操作难度大,对检测医生的专业技能要求高,只有高等级医院才能提供;另一方面有创性的检测对孕妇和胎儿都存在一定风险。
而传统的无创诊断手段假阳性率和假阴性率较高,可靠性存在疑问
图表14:
唐氏综合征发病率随产妇年龄快速上升
图表15:
国金人口模型对未来出生人数预测
母体的血浆和血清中都存在有胎儿的游离DNA片段,被称为cell-freefetalDNA(cffDNA),这些cffDNA在母体血浆中的含量与孕周存在一定的关系,并在一定范围内波动。
当胎儿的某条染色体数目发生异常时,该染色体的cffDNA比例就会超出正常范围。
对母体血浆DNA片段进行检测分析,就可以发现其中DNA片段数量异常,进而判断胎儿染色体是否正常。
目前这一技术已经相对成熟。
相比其他方法,胎儿染色体非整倍体无创产前基因检测安全(无流产风险)、准确(假阴性率低)、快速、低成本,因而得到迅速推广,NIPT企业也实现了惊人的成长速度。
图表16:
NIPT与其他检测方法对比
此外,辅助生殖诊断(如PGD、PSD)原理和目的与NIPT类似,但检测对象为胚胎,采用单细胞全基因组扩增技术和全基因组低覆盖度高通量测序技术,通过采集胚胎活检细胞以及家系的外周血样本,对样本进行检测和生物信息学软件分析,可准确分析胚胎染色体数目及结构异常情况以及判断胚胎是否遗传了父母的致病突变。
据统计,全球NIPT测序市场规模在7.5亿美元左右。
我国是出生缺陷高发国家,但目前产前筛查的覆盖面尚不足孕妇人群的10%,NIPT覆盖人群更是有限。
据我们估计,如按国内NIPT市场渗透率仅5-10%,以单价2000元/例计算,国内NIPT市场当前规模在18-35亿人民币之间。
作为一项对产妇有重大意义的检测,未来其渗透率完全有可能达到30%,则市场规模也可达到130亿元以上。
目前国内有5省份出台定价标准,应注意浙江、福建等省份在检验及医疗定价方面相对激进,全国总体定价水平高于这些省份的标准。
图表17:
国内已有5省份出台NIPT定价标准
图表18:
华大和贝瑞生育健康类样本数的成长(单位:
万例)
纳入医保将成为一大催化剂:
尽管对于NIPT的有效性和重要性目前已有较为一致的认识,但目前全国仍无省份将其纳入医保。
随着各地不断有建议和舆论推动NIPT纳入医保,我们认为这一进程将在数年内以较快速度落地,并成为行业进一步壮大的催化剂。
图表19:
部分地区关于NIPT相关报销和推广政策
政策明确进一步助力市场成长:
除了技术和市场的逐步成熟,监管政策的明确和成熟更是行业发展的长期助力。
在相关监管政策方面,我国先后出台了《产前诊断技术管理办法》(2002年)、《国家卫生计生委医政医管局关于开展高通量基因测序技术临床应用试点工作的通知》(2014年)、《国家卫生计生委妇幼司关于产前诊断机构开展高通量基因测序产前筛查与诊断临床应用试点工作的通知》(2015年)等政策。
由于基因检测市场鱼龙混杂,项目、收费混乱,国家食药监总局和国家卫计委在2014年2月联合发文叫停基因检测服务,至2015年开展试点工作才再度开启临床检测服务大门。
其中2014-2015年医政司和妇幼司出台的两大规定分别对基因测序的技术应用和具体的产前筛查诊断临床实践作出了相关规定,并了确定试点单位(14年医政司通知确定了华大基因、达安基因、安诺优达、博奥医学检验所、北京协和医院、湘雅医学检验所等高通量基因测序技术临床应用试点单位;15年妇幼司通知确定了109家医疗机构获得开展高通量基因测序产前筛查与诊断(NIPT)临床试点资格)。
2016年卫计委公布的《国家卫生计生委办公厅关于规范有序开展孕妇外周血胎儿游离DNA产前筛查与诊断工作的通知》废止了了卫计委妇幼司和医政司规定中与产前筛查和诊断专业试点机构有关的规定,提出了系统性的、覆盖“采样——实验室分析——形成诊断结论和诊断报告”全流程的规范,整合了NIPT检测整合,属于测序和分子诊断领域政策的重大变动,将对市场格局产生重要影响。
2016版《通知》定义了NIPT行业的三大类组成机构:
产前诊断机构(诊断机构)、产前筛查机构(筛查机构)、具备能力的医学检验所和其他医疗机构(检验机构)。
产前诊断机构可以独立或与具备相应检测能力的检验机构合作开展cffDNA产前筛查与诊断服务:
由产前诊断机构负责临床服务,检验机构负责提供检测技术。
产前诊断机构与产前筛查机构合作时,产前筛查机构在产前诊断机构指导下承担采血服务,并与其建立合作机制,落实后续检测与产能诊断服务。
同时,卫计委对各方的资质和条件要求做出了细化的规定。
随着行业的规范,标准的确定和试点资格限制的取消,NIPT行业正在迎来新的一轮普及和腾飞,生育健康服务这一当前基因测序领域的收入“顶梁柱”未来仍有广阔空间。
服务模式的多样化,样本外送与产品销售并存:
早期NIPT的销售采销的是服务,采用样本外送的模式进行。
随着二代测序技术的普及和检测样本量的上升,一些大医院为了将更多利润留在医院,开始自主购置测序仪并建立检验队伍进行检测。
因此部分基因测序企业已经开始加强销售产品模式,以测序仪和测序实际销售获得利润。
参考其他IVD领域的发展经验,我们认为商业和服务模式的多样化是未来NIPT市场大势所趋,产品销售在全市场的占比也有望不断提升。
图表20:
贝瑞和康以产品销售收入的上升(统计不包括科研服务类)
肿瘤基因检测:
庞大空间即将浮出水面,千亿级市场
基因测序在肿瘤中的应用范围甚广,主要可分为基础研究和临床应用两大市场。
前一类主要由科研高校院所及医疗机构的基础医学部门开展,类似于基础科研测序服务;后一类则是目前正在逐渐成型的巨大市场,我们认为值得重点关注。
我国2015年有429.2万例新发肿瘤病例和281.4万例死亡病例,由于我国预后较差的肺癌、胃癌、肝癌等
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基因 行业 深度 分析 报告