单细胞基因组单分子测序技术评论 | Genome Biology
The following article is from BMC科研永不止步 Author BMC 中国
海归学者发起的公益学术平台
分享信息,整合资源
交流学术,偶尔风月
近年来,随着高通量测序技术的飞速发展,全基因组测序已经逐渐普及。全基因组测序技术能帮助研究者获得整个基因组的序列信息。但是目前常用的全基因组测序通常需要数十万个细胞作为起始样本,测序结果无法准确反映样本中细胞异质性的很多信息,例如常常无法判断两个基因突变是否发生在一个癌症患者肿瘤细胞的同一个肿瘤亚克隆中,还是发生在不同的肿瘤亚克隆中。而单细胞基因组测序技术的发展一方面解决了微量样品无法进行检测的难题,另一方面也更好地解析了不同细胞之间的遗传变异的异质性。
自2011年首个基于二代测序平台的单细胞基因组测序技术问世以来,短短的十年间基于二代测序平台的单细胞基因组测序相关文章已多达数百篇,推动了生物医学领域多个相关重大问题的解决。基于二代测序平台的单细胞基因组测序技术(scWGS)作为一种功能强大的工具,能够在单细胞层面研究全基因组水平的遗传变异,包括拷贝数变异(CNV)和单核苷酸变异(SNV)等,进而可用于研究细胞间的遗传异质性、细胞谱系分化、以及克隆演化等问题。然而,二代测序平台虽然具有测序准确度高的优点,但是其测序读长相对较短(150bp X2),目前已有的基于二代测序平台的单细胞基因组测序技术更适用于检测基因组拷贝数变异(CNV)、短的插入缺失(Indel,<50bp)、以及单核苷酸变异(SNV)等,而对于基因组结构变异(SV>50bp)的检测仍然具有很大的局限性。
为了克服二代测序平台测序读长短的缺点,三代测序技术应运而生。在过去的十年中,长读长单分子测序(三代测序)技术的出现极大地促进了基因组学领域的发展。但是人体一个单细胞中的基因组DNA只有6pg(0.000006微克)左右,而目前长读长单分子测序通常需要1微克以上的基因组DNA(相当于数十万个细胞的基因组DNA含量)作为起始样品,因而无法用于微量样品以及单细胞样品的基因组测序。为了解决以上难题,来自北京大学的汤富酬研究组近日在国际上率先开发了一种高精度的基于三代测序(单分子测序)平台的全新的单细胞基因组测序方法:SMOOTH-seq(Single-MOlecule real-time sequencing of LOng Fragments amplified THrough Transposon insertion)。
该方法使用优化后的Tn5转座反应,能从单个细胞中扩增出平均长度约6kb的基因组DNA片段(测序读长相比于基于二代测序平台的单细胞基因组测序技术增加了20倍)。通过引入与单分子测序平台兼容的细胞条形码,并巧妙使用单引物序列扩增基因组DNA,使SMOOTH-seq技术适用于Pacbio sequel II平台的HiFi测序模式。测序后的数据中,产生的环化测序(circular consensus sequencing, CCS)片段的平均读长在6kb左右, 最长可达43kb (如图1所示)。
图1 SMOOTH-seq的实验流程和数据评估
SMOOTH-seq方法能以较高准确度检测基因点突变(SNV,在单个细胞中测序错误率为2X10-5),并且能以 1Mb 的分辨率准确检测出K562两个克隆之间的不同拷贝数变异(CNV)事件;最重要的是,SMOOTH-seq方法能够在单个细胞中高效检测基因组结构变异事件。该研究对K562细胞系的91个单细胞进行了SMOOTH-seq分析。当测序深度仅为0.4X时,单个细胞中的基因组覆盖度已达19%。结果共检测到1,376个插入事件, 1,661个缺失事件, 230个易位事件以及303个重复事件。当使用K562大量细胞的基因组三代测序结果作为比较基准时,该研究中使用的K562细胞系的每个单细胞中的结构变异检测的平均精确度为75%,特别是对于二代测序平台很难检测的基因组插入事件的平均检测精确度为85%。
同时, SMOOTH-seq方法能够在单个细胞中高效检测染色体外环形DNA(ecDNA)。已有的研究报道表明,染色体外环形DNA在肿瘤发生中很常见,且致癌基因能够在染色体外环形DNA中进行大量拷贝数扩增,并且在不同癌细胞之间有很大的异质性。因此对单个细胞中的染色体外环形DNA的检测对于理解肿瘤发生过程具有重要意义。SMOOTH-seq产生的长读长数据,使其能够被用于在单个细胞中精准捕获全长小于10kb的染色体外环形DNA。在此基础上,该研究同时开发了用于准确鉴定染色体外环形DNA的生物信息学分析方法。当仅有一个拷贝的Tn5转座酶转座插入一个染色体外环形DNA分子时,整个环形DNA分子就可在后续PCR过程中被完整扩增为一个线性片段,即单个读段即可覆盖一个染色体外环形DNA分子的全长序列。通过统计Tn5插入位置不同但长度完全相同的一组读段,即可判断它们是否来源于同一个环形DNA。
为了验证SMOOTH-seq方法对癌症患者肿瘤样本的检测效果,该研究收集了一例结直肠癌手术样本并使用SMOOTH-seq技术对其进行检测。在对患者结直肠癌肿瘤样本的分析中,以在结直肠癌样本的至少2个单细胞中同时检测到为标准,该研究检测出4,089个插入事件、3,852个缺失事件、341个易位事件、以及312个重复事件。通过将结直肠癌肿瘤样本和K562细胞系中共有的结构变异去除后,该研究最终得到了3,570个结直肠癌肿瘤细胞特异性的结构变异事件,包括1,376个插入事件、1,661个缺失事件、230个易位事件、以及303个重复事件。同时,该研究通过设置多个基因组样品对照的方式(包括对应的肿瘤组织、与肿瘤相邻的正常组织、GM12878细胞系、以及另一个体的外周血单核细胞的基因组DNA),对检测出的结构变异事件进行了PCR验证。此外,该研究发现结直肠癌肿瘤样本和K562细胞系中共有的结构变异在所有被检测的人类基因组DNA样品中均存在,说明这些“结构变异事件”实际上是由于当前的人类参考基因组序列不够准确和完善,缺失了部分关键序列信息引起的。今后单细胞基因组三代测序将有助于组装出更完整精准的人类参考基因组序列。
总之,该研究在国际上率先开发出了单细胞基因组单分子测序技术(SMOOTH-seq),将长读长的三代测序技术创造性地运用到了单细胞基因组测序上,实现了对于基因组结构变异以及ecDNA等多种分子事件的高精度检测,大大提高了单细胞基因组测序技术的适用范围,具有广阔的应用前景,开创了单细胞基因组单分子测序的新时代,使得单细胞基因组测序领域从“II”时代进入“III”时代。单细胞基因组单分子测序技术将揭开更多的人类基因组中“暗物质”的奥秘,给人类生物医学研究带来全新的发展机遇。
上述研究成果已于近日在Genome Biology 在线发表,题目为“SMOOTH-seq: single-cell genome sequencing of human cells on a third-generation sequencing platform”。北京大学汤富酬教授为通讯作者,生物岛实验室研究员范小英、北京大学杨成、以及博士生李文为该论文的并列第一作者。
作者简介
基因和遗传学 | JCR Q1
BMC旗舰刊Genome Biology 是基因组生物学中排名最高的开放获取期刊, 致力于以基因组和后基因组为对象,研究生物学和生物医学各个领域的重大研究突破。
Genome Biology
点击“阅读原文”阅读论文原文。
扩展阅读
学术界如何回应病毒,从寨卡和SARS-CoV-2说起 | BMC Medical Research Methodology
【为您选刊】肿瘤学 | Springer Nature 期刊
直播预告 | 肿瘤学中的新兴治疗方法 | Springer Nature
【荐刊】Journal of Translational Medicine | 一年千万次访问的转化医学期刊 | 开放获取期刊
本文系网易新闻·网易号“各有态度”特色内容
媒体转载联系授权请看下方