利刃出鞘:单细胞测序技术如何对抗疾病?
The following article is from 高瓴创投 Author HCare
编者按:本文转载自高瓴创投,动脉网获授权转载。
从孟德尔在自己的豌豆田里找到了基因决定生物性状的秘密,到后来人类发现核酸序列能够编码生命,再到生物克隆与基因编辑,基因技术的发展让生命的蓝图变得逐渐清晰。
我们都是从精子和卵子的结合发育而来,但是我们身体的细胞之间却大不相同:有的细胞承担力量,有的细胞保护机体,虽共享相同的DNA却展现着不同的形态和功能。
这一切都源于基因本身在不同细胞中差异表达的复杂性。虽然我们所有的体细胞都具有基本相同的基因,并不是所有的基因都会被表达。这就像我们在高中毕业之后,绝大多数的人都不会用到圆锥曲线的知识一样,尽管我们都学过。细胞具有或执行哪些基因,能够通过检测细胞中的核酸序列,来判断细胞正在表达哪些基因,也就可以推断细胞在进行怎样的任务。
单细胞测序作为可以高效检测不同细胞中基因异质性表达的工具,被推上了时代的前沿,成为了生命医学领域不可或缺的一项强劲技术。我们也能够通过这个技术,分析我们身体中形形色色的细胞的差异和起源,帮助我们对抗疾病。
为什么要单细胞RNA测序?
细胞的特性被它所具有的DNA决定,多细胞生物由单一受精卵复制分化而来,意味着一个生命个体中的所有细胞都共享了DNA。即使具有高度相似的DNA,细胞们却各不相同,这其中就包括癌细胞。癌细胞和其它体细胞共享了同一套遗传信息,但是它的行为却完全不是我们身体所希望的。
如何把藏在身体里的癌细胞揪出来,成为了医学上的一大难题。
癌细胞和其它正常细胞的区别很小,可能只是某一个基因的一个位点突变,或者在表达上将一个蛋白多合成了一点,就将这个细胞推向了不归路。这些微小却又关键的突变,需要仔细的甄别筛选,如果我们一口气对一大片组织测序,这些细小的差异就可能被当作误差忽略掉,让我们错过发现癌细胞。
因此,对细胞进行逐个排查,对于癌症治疗是必要的。
直接对细胞的蛋白分析是困难的。细胞蛋白质结构极其复杂,分离这些蛋白又是极其困难的事情,这使得我们无法对单个细胞的蛋白质精确分析。我们没有必要蹲在蛋糕店门口数有多少个客人买了蛋糕,找到账本是更快捷的方式:科学家们便将目光瞄准在决定蛋白质表达的“账本”mRNA上。
mRNA是基因表达的信使,当一个基因需要被翻译成蛋白时,会先转录出对应的mRNA。一个蛋糕店什么蛋糕在热卖,分析后厨订单的打印数量即可:我们也能分析mRNA的种类与数量,判断一个细胞的运行情况。相比于蛋白质,mRNA信号能够精确放大,使得单细胞RNA测序技术能够更容易得出细胞表达蛋白质种类及数量,从而判断细胞潜在的功能。
除了肿瘤,单细胞RNA测序技术还可以检测胚胎发育阶段不同细胞的mRNA表达谱,从而筛选出不同器官发育时期的关键基因,为干细胞器官移植提供参考。
另外,我们也可以直接对癌细胞中常见的DNA突变位点进行测序,分析这些关键DNA序列是否有潜在的变异风险,从而判断这一细胞的情况。
目前,单细胞测序已经应用于肿瘤检测、胚胎发育、免疫细胞治疗及干细胞分化等等一系列生物医学的研究和临床试验中,为人类探索生命秘密与对抗疾病做出了十分重要的贡献。
如何实现单细胞测序?
单细胞测序的步骤非常简单,只需要三步:提取核酸,测序,构建测序文库。而对于mRNA测序,一般需要将mRNA进行反转录成cDNA提高测序的稳定性。
对于单个细胞测序,我们也就只需要将每一个细胞分离出来,再对细胞单独测序就好了。
逐个分析这样的测序思路:通过流式细胞分选或者激光捕获显微切割等技术将单个细胞分离,再进行核酸提取。但这样的方法,像把米一粒粒从谷子里剥出来,而面对一个组织样本上万的细胞数量,这样测序显然是杯水车薪。
标签(barcode)的巧妙应用让单细胞识别提高了效率:我们不需要挨个分离并提取出单个细胞,只需要给每个细胞加上一个独一无二的核酸序列标签再测序分析即可。
这种策略就好像银行的取号排队系统:将不同的客户打上不同的标记,并分配特定的窗口,按需排队。无数的“大堂经理”水凝胶将不同的“核酸标签”编号交给不同的顾客,并带着顾客们一个个排队进入大厅办理“测序”业务。一次实验,就能测得数百上千个单细胞的信息。
单细胞分离示意图 插画师|雾岛月阳
此外,对单细胞测序结果的验证是有必要的,常用的方法是Bulk(混池)测序与蛋白质组学分析。Bulk测序通过直接整体对组织测序,它和单细胞测序相辅相成。Bulk测序就像把所有水果丢在一起榨出的综合果蔬汁,它能够来与单细胞测序的结果比对,判断单细胞测序结果与整体之间的关系,进而精准定义“异常”。蛋白质组学则直接分析细胞群中关键蛋白的表达,与mRNA测序形成呼应。
DNA是怎么被测序的?
最早的基因测序技术是基于DNA复制过程,将DNA的序列信息转变为可读的信号。
基因的复制过程像拼接乐高积木:以一条原有的DNA链为模板,根据碱基互补配对,DNA合成酶将核苷酸一个个的拼接在一起。
一代测序(Sanger法)利用DNA聚合酶合成反应(PCR),向正常的PCR反应体系中掺入少量放射性同位素标记的ddNTP来测完一条完整的DNA序列。
ddNTP特殊的结构会终止PCR反应,像一个没有凸起的乐高积木一样,后面的积木无法再继续链接,因此积木就无法继续延长了。由于ddNTP在整个PCR反应中出现的位置是随机的, PCR反应可以在任意位置终止,如果我们让该碱基所有出现的位点,都至少出现一次合成终止,每一个终止的位置就是该碱基出现的位置;最后通过凝胶电泳和放射性自显影成像,我们就可以得到所有终止位点的碱基信息,从而获得一条完整的DNA序列。
一代测序最为简单,准确度也较高,但是一次只能测有限的长度。就像玩贪吃蛇一样,玩到后面蛇越长越难操控,一代测序也是越长越不稳定。一代测序最长也就能测1000bp左右的序列,对较长的测序无从下手,面对上亿碱基的全基因组更是毫无应对办法。
一代测序原理 插画师|雾岛月阳
既然我们不能一次测完全部的序列,我们可以测基因组的一部分,再拼接在一起呀!
二代测序(Next Generation Sequencing, NGS)正是基于“鸟枪法”将冗长的基因组打碎,再分别测序片段,最后拼接成完整的序列。由于常见物种详尽的DNA文库已经完成构建,在诊疗应用中,我们只需要一小段DNA与数据库比对,就可以在这个文库中找出原始DNA。整个过程就像搜索一样,而不需要像拼拼图一样寻找一块又一块关联的序列片段。
虽然二代测序仍然基于PCR的DNA扩增过程,但它运用了“边合成边测序”的原理,让四种碱基在DNA合成期间产生各自特异的荧光信号,同步使用精密光学摄像头捕捉,直接即时读取碱基信息。
二代测序极大的提高了测序的通量,降低了测序成本和周期,且自动化程度高,一举成为现今市场上最瞩目的测序技术。
二代测序依然有自身的缺点:单个碱基的荧光很弱,光学仪器读取容易出现误差;测序片段需要复制扩增,复制过程会偶尔发生碱基的错配和丢失,这些错误会因为测序样本量的增加而累积;单次测序长度较小,与数据库比对容易出现错配。
由于这些技术缺陷,使得人们对无需扩増、读长更长的技术便呼之欲出。
三代测序在保留了二代测序的高通量特征的同时,利用单分子读取技术,不再需要PCR中的扩增过程,有效减少了因为扩增而导致的碱基信息的丢失和错配,并且将测序长度提高到了10kb左右。
目前,第二、三代测序技术均是基于捕捉微弱的荧光信号,因此需要配备昂贵的光学监测系统;基于DNA复制的原理使得他们过度依赖DNA聚合酶的活性,这些特性都大大地増加了测序的成本。
第四代测序技术则尝试在不需要DNA合成的条件下完成测序。
第四代测序通过引物将待测序列通过一个纳米孔,读取不同碱基通过纳米孔时的电信号差异来实时测序。这一技术不仅降低了仪器和耗材开销的同时也能够获得优秀的精确度,还能够做到减少机械体积,将原本台式机那么大的测序仪器做到U盘大小。齐碳科技研制出的第一台国产第四代测序仪,为大范围的单细胞测序临床应用提供技术保障。
单细胞RNA测序的应用与未来
2009年,第一种单细胞转录组测序技术mRNA-Seq掀开了单细胞测序在生物医学领域中举足轻重的历史。2014年单细胞测序技术被国际顶级学术杂志《自然-方法》评为年度技术。同年,《科学》杂志将单细胞测序列为年度最值得关注的领域榜首,认为该技术给生物界和医学界带来前所未有的改变。
2017年,一个媲美“人类基因组计划”的“人类细胞图谱计划”诞生。“人类细胞图谱计划”是一项国际化的大型合作项目,其目的是根据独特的生物大分子信息,对所有人类细胞进行功能分型和定义。这个计划中一项极其关键的技术就是单细胞RNA测序。单细胞RNA测序可以揭示单个细胞的基因结构和基因表达状态,反映细胞间的不同点,其在生命医学领域中的应用越来越广泛。
在不久的将来,单细胞测序技术能够将精准医疗推向更广阔的空间,更多的患者能够享受负担得起的特异性高效疗法,提高治疗效率和治疗过程的体验。
单细胞RNA测序作为时代的弄潮儿,已经成为生命医学领域中不可或缺的技术。现如今在肿瘤、发育生物学、微生物学、神经科学等领域发挥重要作用。随着技术的不断改进和突变,将使单细胞测序技术在未来疾病精准研究与治疗具有十分广阔的应用前景,在人类健康的舞台上绽放更加绚烂的光芒。
关于高瓴创投
高瓴创投(GL VENTURES) 是高瓴旗下专注于早期创新型公司的创业投资基金,覆盖硬科技、 软件、 生物科技、 新材料、 新兴消费品牌等重点领域。高瓴创投 寻找一 切热爱技术、 相信创新的创业者, 我们希望成为创业者寻求融资时的FIRST CALL,更期待能长期陪跑创业者的创业旅程。
参考资料:
1. Sanger F, Nicklen S, Coulson AR. DNA sequencing with chain-terminating inhibitors. Proc Natl Acad Sci U S A. 1977;74(12):5463-5467. doi:10.1073/pnas.74.12.5463
2. MardisE R. Next-Generation DNA Sequencing Methods[J]. Annual Review of Genomics &Human Genetics, 2008, 9(9): 387-402
3. Van Dijk EL, Jaszczyszyn Y, Naquin D, Thermes C. The Third Revolution in Sequencing Technology. Trends Genet. 2018 Sep;34(9):666-681.
4. Stark R, Grzelak M, Hadfield J. RNA sequencing: the teenage years. Nat Rev Genet. 2019 Nov;20(11):631-656.
5. Potter SS. Single-cell RNA sequencing for the study of development, physiology and disease. Nat Rev Nephrol. 2018 Aug;14(8):479-492.
6. Svensson V , Vento-Tormo R , Teichmann S A . Exponential scaling of single-cell RNA-seq in the past decade[J]. Nature Protocols, 2018, 13(4):599.
7. Kolodziejczyk AA, Kim JK, Svensson V, Marioni JC, Teichmann SA. The technology and biology of single-cell RNA sequencing. Mol Cell. 2015 May 21;58(4):610-20.
8. Method of the Year 2013. Nat Methods 11, 1 (2014).
9. Tang F , Barbacioru C , Wang Y , et al. mRNA-Seq whole-transcriptome analysis of a single cell.[J]. Nature Methods, 2009, 6(5):377-382.
10. 生物百科大全. 双剑合璧|scRNA-seq与bulk RNA-seq联合分析. 知乎. https://zhuanlan.zhihu.com/p/334309279
封面图片来源:123rf
想要联系动脉网报道的企业,请点击文末左下方“阅读原文”填写表单,我们的工作人员将尽快为您服务。
左右滑动查看更多
近
期
推
荐