将未见之物可视化或探测不可探测之物的技术的每一次突破,都能掀起新一波科学新发现的狂潮。而高通量和可负担得起的 DNA 测序技术的迅速出现,无疑是过去十年生命科学发展的关键推动力。在此中,基因测序仪可以被认为是人类族群在向生物世代强力探索与推进进程中的“核能发动机”。2020 年全球基因测序市场规模预计将达 138 亿美元。根据 BCC Research 的数据,2018 年全球基因测序市场规模为 117 亿美元,预计从 2010 年到 2018 年,全球市场的复合年增长率将保持在 10-30% 之间,预计 2020 年全球市场规模可达 138 亿美元。测序技术和生物信息学的迅速发展已使人们能够鉴定与疾病风险增加相关的基因变异,随着 NGS、纳米孔测序等测序技术的广泛应用,人类已经可以在单个诊断平台上同时测试多种基因,从而进一步扩大了基因测序在临床诊断应用中的效用。和个人生活最为贴近的例子是,更快、更成熟的突变鉴定已经可以为肿瘤的个性化诊疗提供更高效准确的参考信息,并可进一步鉴定针对其进行药理治疗的癌症靶标或途径。此外,以 NGS 为共同基础的全球规模的基因测序项目的出现也为肿瘤学精确医学的进一步发展提供了更新、更全面的知识基础。图 | 全球基因测序市场规模(单位:亿美元)及同比增速走势(来源:BCC Research,CB Insights 中国)每一代测序技术均脱胎于科研需求。到目前为止的 4 代测序技术均诞生于科学研究的工具及方法论,其后再逐步发展完善演进成为成熟的产品或者研究体系,进而实现商业化并在各种实际应用场景中落地生根、开花结果。目前科学研究仍是基因测序的主流应用场景,脱胎于科研而反哺科研。由于 Sanger 测序技术和 NGS 在全球科研机构中极高的接受度,2019 年基因测序在科学研究板块的应用占据了全球基因测序市场超过一半的份额。此外,在测序行业前沿科学领域资金和投资项目的增加也反过来促进了些科研实体对 DNA 测序产品的需求,从而造就了更大的市场份额。应用层面的市场份额占比也已超过 1/3,商业应用落地持续发展推进。临床研究、医院诊所及生物医药公司这三个应用层面的终端使用客户在全球基因测序终端份额中的占比分别为 16%、13% 和 9%,三者相加占到了 38% 的市场份额,超过了 1/3。这也意味着测序技术在商业应用领域的落地也取得了相当的进展,随着测序技术的不断成熟完善、更多的使用场景被开发,预计这一趋势在未来将会持续上扬。 图 | 全球测序行业终端用户分布占比(来源:Grand View Research,CB Insights 中国)人口红利推动下,2020 年中国基因测序行业市场规模有望达到 138 亿人民币。根据赛迪顾问的数据,从 2010 年开始至今,中国整个基因测序行业的市场规模一直处在高速发展的阶段,中位同比增速超过 40%,考虑到中国的人口数量带来的巨大红利,基因测序产业在中国潜力巨大,预计在 2020 年市场规模可以达 138 亿人民币。 图 | 中国基因测序市场规模(单位:亿人民币)及同比增速走势(来源:赛迪顾问,CB Insights 中国)政策支持方面,十三五规划以来,中国政府为加快推进生物技术与生物技术产业发展,打造国家科技核心竞争力和产业优势,对于生物产业,尤其是基因测序领域,加大了产业扶持力度,先后推出了多项相关政策、规划等产业指导,重点相关政策列举如下:图 | 2020 年中国基因测序行业相关重大政策一览(来源:公开资料整理,CB Insights 中国)
巨量资本的注入给整个基因测序行业的发展带来了强大的推动力。自 2013 年以来,面向基因测序初创公司的全球融资经历了快速、持续的增长。在过去的 7 年中,全球资本对初创基因测序公司的投资资金增长迅猛,2019 年的投资金额相比于 2013 年增长了 6 倍。图 | 全球基因测序领域投融资额及投融资交易数量走势统计,统计数据截至 2020 年 8 月 10 号(来源:CB Insights 中国)
全球基因测序领域公司的融资交易数量正在减少,但在创纪录的大轮融资中资金依然保持强劲。从 2013 年到 2017 年,基因测序领域公司每年获得的资金增长了 6 倍多。在随后的 2017 年、2018 年里虽然交易数量持续增加,但总融资自此稳定在每年 40 亿美元左右。尽管 2020 年的融资总额有望超过 2019 年,但今年迄今为止(YTD)的数据表明,投资成交量正在放缓,预计将降至 2016 年的水平。图 | 基因测序行业融资额最大融资数量最多的应用领域是无可争议的 Healthcare,数据统计时间区间为 2015 年 1 月至 2020 年 10 月(来源:CB Insights 中国)
Healthcare 领域 7 笔巨量融资推高 2020 年全球总融资额。根据 CB Insights 中国 的数据,今年预期的总融资额相较于 2019 年仍然会保持超过 4 亿美元的增长,预计总量将超过 4.4 亿美元,这很大程度上要归功于今年成交的7笔巨额融资(单笔交易价值超过 1 亿美元),这也是迄今为止巨量融资交易发生频次最高的一年。2020 年迄今为止基因测序领域最大的一轮融资是向中国测序设备制造商华大智造投资的 10 亿美元,主要投资方为 IDG Capital、CPE 和 GoldStone Investment 等,该轮融资使华大智造获得了 40 亿美元的独角兽估值。其余在 2020 年获得巨额融资的企业为:Encoded Therapeutics,这家公司使用计算方法筛选 DNA 以寻找基因治疗目标,目前正在进行首次临床试验(D 轮融资 1.35 亿美元);Sema4,一家生殖健康和肿瘤筛查公司(C 轮融资 1.21 亿美元,目前估值 11 亿美元);DNAnexus,一家基因组数据分析平台公司(F 轮融资 1 亿美元),其在 2020 年还获得了 Karius、Kallyope 和 Tempus 的投资;其余获得巨量融资的公司还有传染病液体活检公司 Karius、精准医疗技术公司 Tempus 等。图 | 种子轮和天使轮交易的占比下降,而中期交易的占比在上升(来源:CB Insights 中国)
投资者变得更为青睐头部成熟后期公司。根据 CB Insights 中国 的数据,近五年来基因测序领域种子轮和天使轮的融资交易的占比总体呈下降趋势,已经从 2016 年的 44% 下降到 2019 年的 27%,再加上 2020 年预计的总交易数量可能由 2019 年的 238 笔下降至 2020 年预计的 149 笔,以及超大规模单轮融资的增加,表明投资者正在将资金集中在更成熟的后期公司的更大交易上。从 2015 年至 2020 年的基因测序领域公司 IPO 或并购退出前的融资总额的走势来看,前四年维持相对平稳的状态,而在 2020 年这一数值几乎是往年平均总额的三倍,并购退出前融资总额达到了惊人的 23.7 亿美元。图 | 基因测序领域公司 IPO 或 M&A 退出前融资总额(来源:CB Insights 中国)
巨量资本的哺育下基因测序行业的良性生态已在构成。从全球基因测序领域融资总额最高的 10 家公司来看,肿瘤早筛公司 GRAIL 以 20 亿美元的融资额一骑绝尘,紧随其后的二代测序仪制造商华大智造的总融资额超 12 亿美元,纳米孔测序技术开创者牛津纳米孔(Oxford Nanopore Technologies,ONT)位居第三。融资额前 10 的企业中有上游测序仪制造商,也有类似于 23andMe 这样直接面向消费者提供基因测试的中下游应用商,整个基因测序行业的良性生态已在逐步构成。图 | 全球基因测序领域 10 家融资额最高的公司(来源:CB Insights 中国)中国已成为美国之外最大的基因测序投资目的地
过去的几年中,美国是基因测序领域最大的投资热土,但随着初创公司寻求改善遗传数据的多样性,资本开始对位于美国之外的基因组测序公司的投资有了显着增长。而对 Covid-19 基因测试的需求则进一步加快了资本流动趋势,目前中国为除美国之外在基因测序领域融资交易成交数量最多的国家。对基因数据多样性的需求开始推动资本望向美国之外。精准医疗的实现依赖于基因组学技术,但到目前为止,距离实现真正的精准医疗还有很长一段路要走。在某种程度上这是由于基因组数据集缺乏多样性,目前的数据组成严重偏向来自于欧洲的样本,但是整个欧洲的人口却整体开始走上负增长的道路,因此收集和分析来源更多、更多样的基因组学数据将是精确医疗真正落地的关键因素。在美国以外(Outside the United States,OUS)的其他国家,出现了许多初创基因组公司有望促成基因数据多样性的最后闭环,嗅到了趋势的资本纷纷跟进。图 | 除美国之外(OUS)其余国家基因组学相关投融资交易数量占比分布,统计数据截至 2020 年 8 月 10 号(来源:CB Insights 中国)
中国是除美国之外基因组学市场最成熟的国家。全球流向 OUS 基因组学初创公司提供的总资金增长迅速,自 2015 年以来增长了近 7.5 倍,预计今年将达到 2.4 亿美元。自 2020 年初迄今,OUS 公司已占全球总交易量的 60%,而 2017 年这一数值仅为 39%。而中国则是 OUS 基因组学最成熟的市场,根据 CB Insights 中国 的数据,在过去 5 年内基因测序领域 OUS 最大的 10 次融资中,中国公司占了 9 次。为了更好的分析与把握 Healthcare 领域的投资趋势,CB Insights 根据投资组合估值和投资结果在全球范围内选择了 25* 家顶级 Healthcare 健领域的风投公司,即“25 Healthcare Smart Money investors”。以下为这 25 家 VC 在基因测序行业的布局及他们所关注的新兴主题的简要分析。* 25 家 Healthcare 领域全球顶级 VC(来自 CB Insights 数据库):
Abingworth
Alta Partners
ARCH Venture Partners
Atlas Ventures
Casdin Capital
Deerfield Management
F-Prime Capital
Flagship Pioneering
Forbion Capital Partners
Foresite Capital
Founders Fund
General Catalyst
Kleiner Perkins Caufield & Byers
New Enterprise Associates
New Leaf Venture Partners
Omega Fund Management
OrbiMed Advisors
Polaris Partners
Qiming Venture Partners
Sequoia Capital
Sequoia Capital China
The Column Group
Third Rock Ventures
Venbio
Venrock
COVID-19 大流行背景下顶级 VC 们对基因测序领域投资仍保持强劲态势
2016 年至 2017 年,随着基因组学的精准医疗应用开始出现势头,这 25 家 Healthcare 风投向基因组公司投入的资金暴增超过 400%。在此之前,2015 年与基因泰克(Genentech)合作的 23andMe 以及 2015-2016 年与 Illumina 合作的 Helix 这两家著名的基因测序领域初创公司都获得了巨大的商业关注。在此之后,在 2017 年液体活检公司 GRAIL 在 B 轮融资中获得了史无前例的 9.14 亿美元以继续支撑其对肿瘤早筛产品的开发,此轮融资由 ARCH Venture Partners 领投、强生跟投。图 | 全球 Healthcare 领域 25* 家顶级 VC 自 2016 年以来在基因组学领域的投资布局,统计数据截至 2020 年 9 月 21 号(来源:CB Insights 中国)
在 2017 年之后的 2018 年、2019 年以及 2020 年迄今为止,尽管这些顶级 VC 们在基因组学领域的投资总额没有超过 2017 年的水平(当然 2017 年 GRAIL 一家便贡献了当年基因组学领域融资总额的近 40%),但出手数量一直保持在较高水平,预计 2020 年可与历史峰值持平。尽管 COVID-19 全球大流行带来了巨大的不确定性,但预计到 2020 年,基因学公司获得顶级 VC 的资金支持将逐年增长。并且随着融资规模的中位值从两年的 6000 万美元跃升至如今的 1 亿美元,聪明的顶级 VC 们正在这个领域增加筹码。顶级 VC 们开始关注人类基因组测序之外的新方向
自人类基因组计划启动以来,人类基因组学与基因测序一直是基因组学领域的研究热点。但随着测序成本的持续下降以及测序能力的不断提升,Healthcare 领域顶级 VC 们也开始将部分目光投向单纯基因测序以外的领域。包括从事非人类基因组研究的公司,以及利用基因组数据进行诊断和精准医疗等应用的公司。图 | 全球 Healthcare 领域 25* 家顶级 VC 在基因测序各细分领域投资数量占比,统计数据截至 2020 年 9 月 21 号(来源:CB Insights 中国)
非人类基因组测序
自 2018 年以来,顶级 VC 们在基因组学大领域的总投资额中 29% 投向了基因测序公司。最近部分这些资金开始向非人类基因组测序领域流动。General Catalyst 投资了一家分析微生物细胞游离 DNA 的初创公司 Karius,他们可以直接从血液样本中识别出 1000 多种病原体以为医生的临床判断提供参考。此外,测序技术在人类医疗保健领域之外的应用也受到了关注。F-Prime Capital 牵头为 Embark Veterinary 注入了 1000 万美元的 A 轮融资,该公司正在针对狗开发一种可以追踪 20 万种基因标记的全面 DNA 测序,可以为祖源分析以及对遗传疾病风险和遗传特性分析提供关键参考。诊断领域新机会
自 2018 年以来,对诊断技术的投资占去了顶级 VC 们在基因组学大领域中总投资额的 25%。该领域的公司可以快速轻松地帮助使用者评估遗传风险因素和疾病亚型,为医生和患者提供参考金标准。由 Casdin Capital 投资的 Singular Bio 在2019年被 Invitae 收购,Singular Bio 开发了非侵入性产前筛查技术,可以为女性提供胎儿的遗传信息以提前预判风险。“下注”精准医学
精准医学旨在利用基因组学为患者提供量身定制的治疗方法,即在合适的时间点为合适的患者提供合适的药物。顶级 VC 们已经开始投资那些根据遗传数据来为病患提供精准医学服务的公司。Polaris Partners 和 Casdin Capital 投资的 Kallyope 已经完成了 2.43 亿美元的总融资,Kallyope 通过整合测序、生物信息学、神经影像学、细胞和分子生物学以及人类遗传学领域的技术以释放肠脑轴的治疗潜力。更为“用户友好”的基因组学
随着基因组数据变得越来越丰富,能够使终端用户(通常是测序、诊断或医疗服务提供商)能够轻松整合、分析这些数据的分析平台正越来越受到青睐。顶级 VC 们已经向从事基因组分析或开发相关分析软件的初创公司投入了大量资金。Tempus 已经从包括 New Enterprise Associates 在内的资本方筹集了 6.2 亿美元资金,用于建立分子数据库、临床数据库及算法库以最终实现对癌症的个性化护理。通过结合数据分析软件提供测序服务,Tempus 可以通过对基因组数据的分析实时协助医生做出决策,为医生创造价值。基因测序技术已经发展迭代至第四代。
第一代基因测序法即 Sanger 法测序,是根据核苷酸在某一固定的点开始,随机在某一个特定碱基处终止,并且在每个碱基后面进行荧光标记产生以 A、T、C、G 结束的四组不同长度一系列核苷酸,然后在尿素变性 PAGE 胶上电泳进行检测,从而获得可见的 DNA 碱基序列。第二代基因测序技术即目前应用最广泛的 NGS 测序,核心思想是边合成边测序或边连接边测序,通过物理或化学的方式将模板 DNA 随机打断成小片段并通过 PCR 对文库进行扩增,同时对几十万到几百万条 DNA 模板进行测序,最后通过生物信息学分析将小片段拼接成长片段。第三代基因测序技术为单分子荧光测序技术,应用了边合成边测序的思想,并以 SMRT 芯片为测序载体,芯片上有很多小孔,每个孔中均有 DNA 聚合酶。测序基本原理是:DNA 聚合酶和模板结合,4 色荧光标记 4 种碱基 (即是dNTP),在碱基配对阶段,不同碱基的加入,会发出不同光,根据光的波长与峰值可判断进入的碱基类型。第四代基因测序技术为纳米孔单分子测序技术,其基于电信号的纳米孔单分子测序技术,在多聚合物膜上布满穿膜孔的跨膜通道蛋白(纳米孔)的基础上,由DNA马达蛋白牵引,解旋成单链的核酸匀速通过纳米级的孔蛋白。在孔蛋白两侧施加的电压作用下,不同的碱基会形成特征性离子电流变化信号,经过后期对电信号的采集、处理、分析来识别碱基。图 | 历代基因测序仪代表厂商及其各平台产品面世编年表(来源:CB Insights 中国)
NGS 引领基因测序黄金十年。过去十年来,在基因组学研究中占主导地位的 DNA 测序技术无疑是 NGS,NGS 利用逐个合成方法来确定 DNA 中核苷酸的顺序。NGS 测序技术可以较低的批量生产成本产生高度准确(大于99.9%)的测序读段,已经成为了当前临床和研究测序的金标准。在过去的十年中,NGS 已经助力了无数的科学发现,通过发现病原体变体,包括单核苷酸变体,拷贝数变体以及插入或缺失,增强了人类对进化、适应性和疾病的理解。更为重要的是,NGS 的高通量使其可以用作数字读出的一种分析方法来研究多种生物现象,包括染色质可及性、转录因子占用、基因表达和 RNA 结合等诸多应用场景。目前全球基因测序行业的基石依然还是 NGS 测序仪。通过 NGS 这一平台基础,众多面向终端用户的临床、医疗类的基因检测服务提供商纷纷涌现,服务内容涵盖无创产前基因检测、肿瘤液体活检(伴随诊断、早筛)、遗传缺陷基因检测、病原微生物检测、疾病风险评估等。肿瘤液体活检是当下 NGS 最火的应用赛道
相对于医学影像、穿刺活检、肿瘤标志物检测等传统肿瘤诊断技术,液体活检的采样更为方便、可检测类型多。液体活检技术仅需采集患者 5-10ml 血液,通过检测血液中遗传信息,即可覆盖癌症诊断与治疗的全部领域。与传统的检测方式相比,液体活检在 NGS 平台的支撑下把肿瘤发现的时间点从“发病期”提前到了“潜伏期”,可达到早发现、早预防、早治疗的目的。在 2015 年,液态活检技术入选《麻省理工科技评论》年度十大科技突破。图 | 四种常用肿瘤诊断技术对比(来源:CB Insights 中国)
液体活检之于早筛:多数癌症的早期治愈率可达到 90% 以上,发展恶化到了中晚期时治愈率则会急剧下降。目前常规的医学影像学和肿瘤标记物检测的特异性、敏感性以及标准化程度几乎无法在人体内探测到极早期数量极少的肿瘤细胞,通常癌症在发展至中晚期时才会在常规体检中显示出异常信息。所以精确的早筛将对癌症治愈率的提高至关重要。液体活检之于伴诊(诊断、用药指导、后期监控):在肿瘤治疗过程中,也存在药物的选择和实时调整的需求。相同癌症具有的不同突变可能对不同的药物产生耐受,并且病人在开始接受治疗后也会有相当比例会出现耐药的情况。而液体活检分析则可帮助医生判断病人肿瘤的突变类型及其在治疗过程中的变化,以有针对性地制定用药方案,从而有效提高疗效。图 | 以 ctDNA 为例展示液体活检在肿瘤发病全周期内作用节点,非实际诊疗过程(来源:CB Insights 中国)
肿瘤早筛是增速最大的 NGS 应用场景。CB Insights 中国 预计到 2023 年液体活检应用于早筛的市场规模将达到 3.44 亿美元,15 倍于 2018 年 2300 万美元的市场规模,是 NGS 增长速率最大的应用场景。目前专注于此领域的公司包括 GRAIL、Freenome、Thrive Early Detection、Guardant Health 等。NGS 治疗指导是当下市场规模最大、液体活检企业最为聚集的细分场景。CB Insights 中国 预计到 2023 年,该领域全球市场规模将达到 11 亿美元。治疗指导的主要作用是使用 NGS 帮助医生实现对患者的精准用药,当然还可进行检测疗效反应、发现耐药机制、追踪肿瘤演绎过程等工作。该领域中国公司已有燃石医学和泛生子先后登录纳斯达克,泛生子更是实现了史上最大癌症精准医学 IPO。图 | 不同应用场景下,全球癌症液体活检的市场规模,单位百万美元(来源:CB Insights China)
除肿瘤液体活检之外,NGS 在单细胞分析、病原微生物检测等领域也大放异彩,更多相关的应用领域及优秀企业分析可参考 CB Insights 中国此前发布的《中国最具前景的 41 家分子诊断公司》榜单报告及《引领肿瘤液体活检的 28 家中国企业》榜单报告。亟待越过的 NGS 垄断大山
长期以来,中国的上游基因测序设备及耗材供应基本为外资企业所垄断,NGS 关键技术掌握在包括 Illumina 在内的欧美生产商手里。整个 NGS 液体活检行业对 Illumina 的测序仪及配套试剂依赖严重,从而导致了居高不下的检测成本。Illumina 几乎垄断全球二代测序仪市场。根据中国产业信息网的统计数据,目前全球范围内的 NGS 基因测序仪不足 8000 台,分布于 60 多个国家和地区,其中 Illumina 公司的 HiSeq 2000、Genome Analyser 2x、MiSeq 和 NextSeq 等测序平台市场份额占比高达 83.9%;赛默飞的 SOLiD、Ion Torrent 和 Ion Proton 等测序平台市场份额占到 9.9%;Roche 公司的 454 平台市场份额占比 5.3%。Illumina 和 Thermo Fisher 设备占比超过 90%,上游基因测序设备制造已形成垄断。图 | 全球二代测序仪市场构成(来源:中国产业信息网,CB Insights 中国)
虽然华大智造发展迅猛,但下游应用企业平台迁移成本巨大。在 NGS 测序仪器几乎被寡头垄断的环境下,NGS 下游应用企业购买仪器运行所需的耗材和试剂时基本上不具有议价能力。尽管目前华大智造势头迅猛,但由于更换全套体系存在巨大的迁移成本,对于使用 NGS 的液体活检厂商来说,换用测序设备需要将整个已经建成的核酸 NGS 体系全部推倒,然后在新的 NGS 平台上进行重新构建,所以目前国产二代测序仪的发展依然面临着巨大的压力。将如 NGS 这样的短读长测序技术更广泛地应用在结构变异检测和基因组组装中时,它的缺点就开始逐步显现:基因读取长度有限。短读长测序仪如 Illumina 的 NovaSeq、HiSeq、NextSeq 和 MiSeq 测序仪;华大智造的 MGISEQ 和 BGISEQ 测序仪或者 Thermo Fisher 的 Ion Torrent 测序仪读取长度为 600 个碱基,这就意味着有超过 70% 的人类基因组结构变异(即影响序列长于 50bp 的变异)无法在 NGS 平台上被检测到。此外,人类超过 15% 的基因组仍然无法实现装配或发现变异,因为这些基因组上有着重复序列或非典型的 GC 含量。例如,当某段基因的 GC 含量超过 45% 时,即使没有经过 PCR 扩增,短读基因组文库的序列覆盖率也会下降两倍,这极大的限制了对基因组中一些最重要的功能区域进行研究从而发现遗传变异的机会。基因组中这些难以探测的、大量的串联重复序列占主导的区域包括着丝粒、端粒和顶体基因组,并且更值得关注的是,这些区域不管是在生殖细胞还是体细胞中都有着最高的突变率。然而这些最易变的区域在此前并未能被充分研究,这些 NGS 现有的局限性也使得开发能够检测基因组中这些更复杂和动态区域的方法变得更有必要且更为急迫。“长读长测序技术的出现照亮了过去从未看到的基因组的黑暗角落”。理想的测序方式应该是对原始的 DNA 模板进行直接、准确测序且不受读长的限制。早在 20 世纪 80 年代,研究人员已经开始为实现这个目标而努力,虽然其中的很多尝试都失败了,但是第三代单分子实时测序技术和第四代纳米孔测序技术最终实现了长读长、单分子测序,再次颠覆了测序领域。这些技术一次可读取长达数万碱基的片段,大大降低了拼接难度,更重要的是大大减少了过去无法定位的漏洞。有学者称“长读长测序技术的出现照亮了过去从未看到的基因组的黑暗角落”。长读长测序技术可轻松完成人类基因组最重复区域的读取。与短读长方法相比,长读长技术可以直接读取长度在 10kb 到数兆碱基之间的天然 DNA 连续序列,近年来在通量和准确性上的新进展也大大提高了其实用性和可用度。PacBio 和 ONT 的测序技术均产生可轻松完成人类基因组最重复区域的读段,但两者之间在测序原理上的根本差异会影响其读长、碱基准确度和通量。长读长测序可以改善从头测序、鉴定的准确性、转录亚型鉴定以及结构变异的检测。此外,对 DNA 和 RNA 的长读长测序可消除 PCR 扩增所导致的偏差,同时保留对碱基修饰的检测。长读长测序这些优势能力,以及其在测序准确性、通量和降低成本方面的不断迭代进步,已经使其开始成为对模式和非模式生物在广泛的基因组学研究中的新选择。未来十年,全球长读长测序市场将以 24% 的年复合增长率持续增长。根据 Straits Research 的数据,2019 年长读长测序市场规模估计为 9.74 亿美元,预计在 2020 年到 2029 年之间将会以 24% 的年复合增长率增长。市场规模的预期增长可以归因于长读长测序技术包括 SMRT 和纳米孔测序技术的快速进步以及顺利的商业化落地进程。图 | 全球长读长测序(三代/四代测序)市场规模(来源:Straits Research,CB Insights 中国)
遗传性和代谢性疾病筛查为主要增长动力之一。全球范围内遗传性疾病的日益增多使基因组学领域的研发支出激增。根据 WHO 的资料,镰状细胞贫血是一种严重的遗传性疾病,每年超过 72000 名新生婴儿患有此病;在英国每年超过 6000 人诊断出遗传性血友病。随着基因治疗的发展和人们对产前诊断意识的不断提高,新生儿筛查的普及率在不断提高、改善患者生活质量的意愿在不断加强,这些因素一并为市场增长提供了动力。对人类基因组的科研活动的巨额投资也在催化市场增长。根据 Battelle 的数据,从 2009 年到 2014 年间亚洲地区在基因组测序领域的研发投资增加了 7%。此外,全球测序行业巨头也在开展广泛的研究,以开发更为创新的长读长测序技术,从而获得竞争优势,MinION、GridION、PromethION、PacBio RS System、Sequel System 等测序仪器推陈出新,广泛应用于人类基因组学、癌症、表观遗传学、转录组分析中的基因测序过程,进一推动了该领域的发展。图 | 中国长读长测序(三代/四代测序)市场规模及应用领域分布走势(来源:Grand View Research,CB Insights 中国)
单分子实时测序和纳米孔测序这两种技术在当下长读长测序领域占据主导地位。SMRT 和纳米孔测序技术分别于 2011 年和 2014 年商业化发布,目前 SMRT 技术的主要拥有者及实践者为 Pacific Biosciences,纳米孔测序技术则由牛津纳米孔领衔,中国的齐碳科技也于 2020 年 9 月发布了首款自主研发的纳米孔测序仪 QNome-9604。图 | 长读长和短读长技术和平台的数据类型、读长、精度、测序通量和成本(来源:Nature,CB Insights 中国)
在普通模式下,四代纳米孔测序仪的读长和精度均优于 PacBio 三代测序仪。通过产生数百至数千碱基的连续序列,ONT 读长度可以超过 PacBio 读长度至少一个数量级。通过 ONT 测序产生的最常见的 read 类型是标准的 ONT long read,Nature 的分析表明,这一模式下 ONT 读取的长度一般为 10-100kb,平均准确率为 87-98%,在 raw ONT long reads 中,约有 91% 的均聚物被准确地称为至少5个碱基长的均聚物,比 PacBio 常用的 CLRs 模式高 3 个百分点。图 | SMRT 及纳米孔测序原理对比(来源:Nature,CB Insights 中国)
相对于 NGS,纳米孔测序仪仍有颇多亮点。纳米孔测序仪读长更长,更适合检测基因组结构变异,进行宏基因组测序;可以实时输出测序结果,因而可用于即时检测和快速诊断;可直接检测过孔核酸,所以能检测 DNA 甲基化、RNA 及其修饰;文库制备简单,便于提供一站式解决方案;同时,它的仪器本身小巧便携,能把基因测序从专业实验室里解放出来,走进基层、社区,随时随地现场检测,极具消费级应用的潜力。实时和便携
纳米孔测序不需要成像设备来检测核苷酸,从而可以将系统缩小到便携式水平。例如牛津纳米孔的 MinION Mk1B 设备仅重 90 克,尺寸仅为 3.3×10.5×2.3 厘米,可实现单手握持。与其他大规模并行测序仪相比该设备的成本也低得多,包括设备和试剂在内的初始成本仅为 1000 美元左右。可以通过移动 PC 总线供电的纳米孔测序仪的出色便携性弥补了现场测序的空缺,它的便携性已经在诸如煤田、北极、南极洲甚至国际空间站这样的极端地方得到了验证。在太空飞行中发掘细菌和病毒是很困难的事情,所以大部分研究是将样品带回地球进行测序鉴定,但得益于纳米孔测序仪的便携性,目前 NASA 已经开始利用纳米孔测序仪在国际空间站进行病菌的实时测序。纳米孔测序仪也被用于监视医疗资源有限的地区的病毒暴发。WHO 于 2016 年宣布寨卡病毒爆发为国际公共卫生紧急事件,并建立了巴西寨卡病毒实时分析(ZiBRA)项目,使用 MinION 测序仪从临床样品中快速获得寨卡病毒的完整基因组以对来自巴西的一千个基因组进行测序以监测流行病学信息;该项目组还开发了一种利用纳米孔测序仪的基因组监测系统,用于西非埃博拉疫情的监控,该系统在接收血样后只需 15-60 分钟的测序时间就可以出检测结果,无需承担运送危险标本的风险即可实现现场病毒检测。实时分析 DNA/RNA 序列。对于临床实践,实时获取和分析 DNA/RNA 序列是一件很重要的事情。对于传统的 NGS 测序,做到这一点非常不易。但对于纳米孔测序仪,实现起来相对容易。这不仅是因为纳米孔测序仪体积小,易操作等,更是因为在测序过程中单分子穿过纳米孔时电流变化可以被检测并识别的,这一设计允许用户在测序过程中根据实时结果做出一些及时的判断。检测结构变异
NGS 对与人类健康密切相关 DNA 结构变异的检测束手无策。虽然 NGS 在识别单核苷酸变体(SNV)和小的插入和缺失(indels)方面表现良好,但其并不适合检测较大的序列变化,类似于插入,缺失,重复,倒位或易位这些影响 ≥50bp 的结构变异(SV)更适合于长读长测序。尽管结构变异是基因组之间多样性的重要来源并且与人类健康密切相关,但是由于过去 NGS 的技术局限性,对这种结构变异的研究仍很少。适当的长读长测序深度便足以检测出人类的致病 SV。纳米孔测序跨重复元素或重复区域的能力提供了独特的定位点,从而有利于从头测序和结构变异检测。甚至相较于纳米孔测序读长相对较短 SMRT 测序的读数也可以鉴定人类基因组中之前 NGS 技术所无法检出的结构变异。目前长读长测序对哺乳动物基因组的深度测序成本仍然较高,但是对于人类一般的致病病变适度的测序深度可能就足够了:根据 2019 年一份发布于 Nature 的研究数据,8.6 乘 SMRT 测序深度或者 15 到 17 乘纳米孔测序深度就已经足够可以检测出人类的致病变异。检测碱基修饰
在 NGS 触不可及的核酸碱基修饰检测领域,纳米孔测序的识别精度已最高可达 98%。核酸碱基修饰在真核生物的一系列细胞过程中起到了不可或缺的关键作用,尤其是在基因表达调控方面。NGS 技术无法直接检测天然 DNA 中的碱基修饰,而纳米孔测序对天然 DNA 和 RNA 进行单分子测序则可以检测单个核苷酸的修饰。根据发布于 Nature 的最新研究数据,目前在已知序列的背景下,纳米孔测序对目标碱基修饰的鉴别精度范围已经可以达到 92% 至 98% 。检测碱基修饰可助力洞察 DNA 损伤。除了典型的 A、T、C 和 G 碱基,DNA 还可以包含在不同生物和组织中性质和出现概率不同的修饰碱基。比如在细菌中常见的 N 6-甲基ladenine(6mA)、4-甲基胞嘧啶(4mC)和 5-甲基胞嘧啶(5mC)。而 5mC 也是真核生物中最常见的碱基修饰,其氧化衍生物 5-羟甲基胞嘧啶(5hmC)、5-甲酰胞嘧啶(5fC)和5-羧基胞嘧啶(5caC)在某些哺乳动物细胞类型中被检测到。并且更多的碱基修饰是由 DNA 损伤导致的,所以对碱基修饰的检测意义重大。RNA 碱基修饰检测仍可深挖。组成 RNA 的核苷酸甚至更多, 迄今为止已有超过 150 个在 RNA 上的碱基修饰被发现,这些修饰也具有对应的功能性作用,如影响 mRNA 稳定性、转录抑制以及影响翻译效率等。然而,由于现有测序技术的限制,大多数 RNA 修饰仍然无法被表征,但是随着纳米孔测序技术的不断迭代推进,对 RNA 碱基修饰的探测也将进一步深入,这在某种意义上也将为生命科学的发展带来新的深刻影响。图 | 纳米孔测序不需要扩增、链合成或亚硫酸氢盐转化,可减少偏差,并允许检测核苷酸序列旁的修饰碱基(来源:Oxford Nanopore Technologies,CB Insights 中国)
纳米孔测序为探索表观遗传异质性提供了机会。传统的核酸修饰检测依赖于对核酸进行特定的化学处理(例如,亚硫酸氢盐转化将未甲基化的胞嘧啶变为尿嘧啶)或免疫沉淀,然后再进行测序,但这一过程可能会对 DNA 产生损坏。纳米孔测序平台的出现颠覆了这一流程,其可以帮助实现在无需损坏 DNA 前提下以单分子的分辨率对更多的碱基修饰进行检测,为探索表观遗传异质性提供了机会。全长转录组测序分析
克服 NGS 读长短导致转录本结构不完整的缺陷,纳米孔测序可无需组装直接识别转录本。转录本非常多样和复杂,绝大多数哺乳动物的基因不符合“一基因一转录本”的模式,这些基因往往存在多种剪切形式。虽然 NGS 可以很准确地进行基因的表达及定量的研究,但是由于其读长的限制,基于短读长测序平台的转录组在组装的过程中存在较多的嵌合体,所以无法准确地得到完整转录本的信息,从而对后面的表达量分析、可变剪接、基因融合等分析造成了较大的影响。而纳米孔测序技术实现的全长转录组测序可克服传统二代转录组 Unigene 拼接较短、转录本结构不完整的缺陷,可直接获得单个 RNA 分子从 5’ 端到 3’ 端的高质量全部转录组信息。图 | 纳米孔长读长可以跨越全长转录本,简化其鉴定(来源:Oxford Nanopore Technologies,CB Insights 中国)
正不断得到提升的准确率
通过增加测序深度可将纳米孔测序错误率降至与 NGS 同一水平。较高的测序错误率是所有长读长测序平台的通病,但是这类错误都属于随机错误,而随机错误通常可以通过增加测序深度来解决,分子测序的次数越多,最终的错误率就越低。增加测序深度已经被证明可以将错误率降低到与短读长相当的水平,甚至更低。新加坡基因组研究院通过环化模板 DNA 分子、然后利用滚环扩增来扩增分子、生成由多个重复单元组成的环状分子、将这些环状分子在测序前被打断成线性 DNA 链、然后再进行反复测序,从而计算出一致性序列,进而提高准确性。此外,也可以结合短读长序列数据来获取序列全貌。另一方面,用于碱基检出和纠错的生物信息学的迅速发展以及文库制备步骤的优化,这一问题正在迅速改善。同时纳米孔测序的系统通量也在得到大幅提高,例如牛津纳米孔最新的 PromethION 系统,单个流通池可以产生 50–100Gbp 数据(MinION 系统的典型产出是 5–10 Gbp),且可以并行运行 24 个流通池。图 | 纳米孔测序仪优势特性(来源:公开资料,CB Insights 中国)
四代测序是中国企业在测序仪领域弯道超车的机会。在中国,位于基因测序产业链上游的公司屈指可数。测序仪及其耗材的高价垄断严重限制了中下游的发展,对于市场议价极不利好。随着基因测序行业的发展,中下游提供各种基因测序产品和服务的公司层出不穷,全球基因测序市场以前所未有的速度发展,引领技术革新是走出基因测序下游产业竞争红海的关键,国产替代已成一大趋势。而四代测序则是中国企业弯道超车欧美传统巨头的一大机会。首款中国国产纳米孔测序仪将会为中国测序行业带来正向蝴蝶效应。目前国内纳米孔测序仪行业的发展仍处于早期阶段,但也已有部分企业比如齐碳科技已经推出相关测序仪产品,这将对中国测序行业企业在保证业务安全可持续、争取更佳的价格谈判权等方面带来微妙而重要的变化。我们有理由相信这一变化将会随着中国纳米孔测序行业的不断发展而不断发酵放大,对行业发展起到正向协同作用。Illumina:基因测序行业的全球龙头
Illumina(Nasdaq:ILMN)是全球测序公司龙头,目前市值 464 亿美元。 业务模式优异,属于基因测序行业中的“刀片模式”。通过仪器投放带动试剂消费,其中测序试剂占公司营收约三分之二。创新能力强,产品覆盖面广。公司在基因测序行业上游优势明显,所产测序仪可满足各种规模的机构。包括适用于低通量环境下的小型测序仪 MiniSeq、MiSeq 和 NextSeq,工业级用途的大型测序仪 HiSeq 和 HiSeqX 和现在市面上最强大的测序系统 NovaSeq。最新的 NovaSeq 6000 V1.5 版本的测序试剂盒,预计可将测序成本降低至 600 美元/WGS,极大的推动了大数据量需求的应用如单细胞基因组、人全基因组、液体活检的研究进展。后续 NovaSeq Dx 有望成为 NIPT 领域的主力机型,按照 10M reads /样本计算,NovaSeq 一轮最多可完成约 2000 个 NIPT 样本的检测工作。图 | IIIumina 2018/2019 年全球仪器装机量统计(来源:J.P.Morgan,CB Insights 中国)
2020 年上半年,Illumina 发布了 TruSight 软件套装、DNA PCR-free Prep 建库试剂盒等产品,并收购了两家数据处理公司 BlueBee 和 Enancio,积极布局测序行业中下游检测领域。华大智造:中国基因测序上游设备研发龙头
华大基因在 2013 年耗资 7.2 亿元收购美国测序仪生产商 Complete Genomics(CG),开始布局上游设备研发,之后华大智造从华大基因中独立。其产品 BGISEQ-500、BGISEQ-50、MGISEQ-2000、MGI-200 四款测序仪均获得 CFDA 认证且实现规模化量产。具有自主知识产权的 DNBSEQ 核心测序技术和全新的碱基识别技术 CoolMPSTM 等将基因组测序带入“全高清”时代,对于更全面和准确地获取遗传信息具有里程碑式的突破意义。图 | 华大智造基因测序仪主力机型介绍(来源:华大智造,CB Insights 中国)
根据公开资料,公司三年来收入复合增长率超过 200%,在中国基因测序仪市场占据约 1/3 的市场份额,全球装机量超 1100 台,涵盖 16 个国家及地区,用户超过 300 家。2020 年华大智造相关仪器产能增长超过 400%,8 月成功上市其自主研发的全球首款全自动分杯处理系统 MGISTP-7000,15 秒即可完成单个样本分装。实现了基于 MGISTP-7000 分杯处理系统 + MGISP 系列自动化核酸提取设备 + ZLIMS 自动化实验室信息管理系统的全套自动化解决方案。牛津纳米孔:全球四代测序引领者
Oxford Nanopore 公司是四代测序技术最具代表性的龙头企业,旗下产品包括 Flongle、MinION、GridIONMk1、PrometnION 以及在研产品 SmidgION 和 Plongle。2020年10月 Oxford Nanopore 的 LamPORE 测试已获 CE-IVD 标记,该测试可检测出导致Covid-19 疾病的病毒 SARS-CoV-2, 临床数据显示 99.1% 的灵敏性和 99.6% 的特异性,该数据展现出了四代测序技术在临床应用上的巨大潜力。图 | Oxford Nanopore 主要产品介绍(来源:牛津纳米孔,CB Insights 中国)
齐碳科技:中国四代测序开拓者
齐碳科技自主研发的四代纳米孔单分子基因测序仪 QNome-9604 填补了中国四代测序仪器市场的空白。QNome-9604 与测序芯片 QCell-3841 和测序试剂盒 Qeagen-8 三者配合,可以达到 150k 以上的超长读长,8 小时稳定产出 500M。作为中国首款自研纳米孔基因测序仪的 QNome-9604 不仅具备超长读长的单分子基因测序能力,并且可以实时输出测序结果,单次运行成本低,且仪器小型便捷,可以与 NGS 互补提供高性价比的基因测序解决方案,有望在纳米孔基因测序仪赛道实现对传统欧美测序仪领域巨头的追赶与超越。公司于 2020 年 5 月 8 日宣布完成 A 轮融资,融资金额超 1 亿元人民币,由高榕资本领投、银杏谷资本与雅惠投资等老股东跟投完成。图 | 齐碳科技主要产品介绍(来源:齐碳科技,CB Insights 中国)
PacBio:三代测序技术代表
Pacific Biosciences of California 于 2004 年成立,目前市值 22.7 亿美元。公司是第三代基因测序技术领域的代表,专注于单分子实时测序技术。产品 Sequel II 和 IIe 系统具有高读长(10kb 到数百 kb),99.999% 的准确度,无 GC 含量偏差,无需 PCR 扩增便可在测序过程中直接检测碱基修饰等优势。在基因组结构变异,全长 mRNA 可变剪接体检测,表观甲基化直接检测等二代测序难以涉猎的应用领域,有广阔的发展空间。依赖其在三代测序领域的绝对实力,公司与多家企业和机构开展合作研究。2020 年 10 月国际著名遗传公司 Invitae Corporation (NYSE:NVTA) 与 Pacific Biosciences 展开了癫痫病检测领域的合作,也促进了 Pacific Biosciences 在大规模全基因组测序计划中加速使用高精确度长读测序平台的战略布局。Grail:癌症早筛独角兽与 NGS 龙头强强联合
Grail 是全球癌症早筛领域独角兽,其癌症及非癌症甲基化特征测序数据被认为是同类数据库中规模最大的,涵盖了整个基因组中约 3000 万个甲基化位点,涉及超过 20 种不同阶段的癌症类型。预计产品 Galleri 会在 2021 年投入商用,据循环游离基因组图谱研究结果显示,Galleri 的早期版本可以识别出 50 多种癌症,定位 96% 的样本中的癌症信号且正确率达 93%。2020年9月21日,癌症早筛公司 Grail 被基因测序巨头 Illumina 以 80 亿美元的现金和股票对价收购。Illumina 将利用其全球市场、制造和临床等业务能力,加速 Grail 实现产品商业化,推动其临床价值的增长。Grail 也可将 Illumina 的二代测序产品组合扩展到癌症筛查、诊断和癌症监测等各领域。肿瘤早筛催生了千亿市场,NGS 早筛产品的商业化势在必行,此次 Grail 和 IIIumina 的强强联合势必会在此掀起一番波澜。泛生子:基因检测服务癌症早筛
泛生子 2020 年赴美上市,目前市值 10.25 亿美金。业务模式为“LDT+IVD”双轨并行,服务及产品涉及中国前 10 大高发癌症中的 8 种。拥有中美双研发中心,两家通过 CAP、CLIA 双认证的医疗器械生产基地和位于北京、上海、杭州、重庆和广州的医学检验实验室。招股书显示,泛生子 2017 年、2018 年、2019 年营收分别为 1.01 亿元、2.25 亿元、3.23 亿元。目前公司的主力基因测序产品为 GENETRON S5 全新一代半导体测序仪,GENETRON S2000基于联合探针锚定聚合(cPAS)技术开发的中高通量测序平台,以及基于泛生子独创的“一步法”专利技术(发明专利, ZL 201710218529.4)的人类 8 基因突变联合检测试剂盒。该试剂盒只需要 20ngDNA 和 50ng RNA,便可一次性检测与非小细胞肺癌靶向治疗密切相关的 8 个基因:EGFR / ALK / ROS1 / BRAF / KRAS / HER2 / MET / PIK3CA。2020年 9 月 30日,美国 FDA 授予泛生子 (GTH.US) 基于高通量测序技术(NGS)的肝细胞癌早筛液体活检产品 HCCscreen™ “突破性医疗器械”(Breakthrough Device Designation)认定。希望组:中国首家长读长测序服务公司
为中国首家三代/四代测序服务公司。拥有牛津纳米孔 PromethION 48 四代测序仪、PacBio Sequel II 三代测序仪、华大智造 MGISEQ2000 二代测序仪、Bionano Saphyr 光学图谱等全套二代至四代测序仪。构建了华为云测序高性能计算集群,提供测序分析和存储服务。在北京、武汉和苏州建设了合计超过 7000 平米的科研服务平台、医学检验实验室与 GMP 生产厂房。2020年希望组与天津生物芯片联合首推 Nanopore Ultra-long Reads + PacBio HiFi Reads + Bionano + HiC 的基因组近完成图解决方案,突破现有基因组技术指标,为后续基因组进化、结构变异、功能研究等奠定基础。其自主组装算法可以针对不同物种的基因组特点进行优化,是实现基因组近完成图的核心工具。Microbes NG:创新型微生物测序服务商
Microbes NG 是来自英国的微生物基因组测序服务公司,业务包括标准基因组服务和增强基因组服务。其中标准全基因组服务为 Illumina 提供下一代测序数据,最低覆盖面积为 30 倍 。增强基因组服务则结合了 Illumina 的短读技术保证高碱基质量和 Oxford Nanopore 的长读技术来获得长序列连接重复区域和支架群。业务涵盖全球 49 个国家。图 | Microbes NG 测序服务简介(来源:Microbes NG 官网,CB Insights 中国)
BaseClear:欧洲微生物基因组学服务先锋
BaseClear 成立于1993 年,是欧洲领先的微生物基因组学服务商。2018 年获得数据安全ISO27001 认证,是第一家获得此证书的基因组学解决方案提供商。服务包括人类肠道、血液、皮肤等微生物菌群基因组测序分析和动物微生物菌群的研究。测序服务体系完整包含二代、三代和四代测序,利用由 Illumina、PacBio 和 Oxford Nanopore 的测序仪提供下一代测序、宏基因组学、基因组分析、转录组学和桑格测序服务等。合作机构遍布全球包括 BaseGene、Future Genomics Technologies、Probase Pharma、Mymicrozoo、Spadix 等。图 | BaseClear 业绩概况(来源:BaseClear,CB Insights 中国)
Genexa AG:瑞士长度长测序优质服务商
Genexa AG 是一家位于瑞士的基因组数据分析提供商,公司依靠提供高特异性的基因组标志物,实现了个性化的分子检测服务。Genexa AG 应用长读长测序仪提供测序服务的同时也帮助用户定制化建立长读长测序服务技术。与 Agroscope、Sefunda、Mabritec AG、Genomsys、Fachhochschule Noedwestschweiz、Monzino Cardiology Center 等多家机构保持合作。已与 Immagina BioTechnology 达成合作为 CircAID-p-seq 开发数据分析方案,这是牛津纳米孔技术平台上唯一可用的 3 '磷酸核糖核酸测序产品。图 | Genexa AG 基因组测序服务流程(来源:Genexa AG,CB Insights 中国)
点击“阅读原文”获取 PDF 版完整报告,提取码:a15w