————随着越来越多的研究人员关注RNA表观修饰,一系列与表观转录组学相关的研究工具正在学术界慢慢形成规模
2012年,来着以色列特拉维夫大学的Gideon Rechavi教授发表了世界上第一篇m6A测序论文,表观转录组学从此迈入了高通量时代。但是中间的曲折只有Gideon Rechavi教授自己知道。
在2004年,Gideon Rechavi和他的同事们当时将所有的人类基因组DNA序列与相应的mRNA进行了比较。他们正在寻找一种信号,用来证明RNA序列中的一个核苷酸组成部分称为腺苷(A),已转变为另一个肌苷(I)。这种“从A到I的编辑”可以改变蛋白质的编码序列,这对于控制先天免疫反应至关重要,中科院上海细胞生化所的陈玲玲教授也贡献巨大。Rechavi回忆说:“这听起来似乎很简单,但是想要借助合理的工具和手段来实现却非常复杂。”
来自全球的多个顶级实验室曾尝试过类似的研究,但无一例外都失败了,因为测序产生的错误和突变使得数据中充满着噪音与假阳性。但是,Rechavi的团队正在借助一种新型的工具——生物信息学来帮助自己从转录组的测序数据中去挖掘成千上万条完整的mRNA表达信息。
与mRNA结合的细菌核糖体的分子3D模型,mRNA是在蛋白质合成过程中形成的复合物。图片:Laguna Design / SPL
肌苷是一种特殊情况:研究人员通过比较DNA和RNA序列,可以很容易地检测到其中的蛛丝马迹。至少有四分之一的mRNA带有化学修饰。已知A/C/G/U上带有160多种修饰或标记,而这些标记在当前的技术条件下很难捕捉到全部信息。当时人们已经在DNA上也发现了类似的标记,最常见的就是5mC也就是胞嘧啶甲基化。研究人员不确定RNA中的这些化学修饰会产生什么作用,但他们正在努力寻找答案。
过去七年中,许多研究集中在称为N6-甲基腺苷(m6A)的特定RNA碱基修饰上。来自全球各地的科学家们在各个物种各个疾病中的mRNA上均绘制m6A转录图谱,并证明了这些修饰对健康和疾病的重要性。但是这也带来了一个新的问题,这些修饰不仅存在于mRNA上,在其他RNA如tRNA、rRNA、lncRNA、circRNA等也大量存在。甚至目前有大量文献报道,在病毒上也存在这种m6A修饰。
其中这种名为m6A的RNA修饰并不是新鲜事物,早在上世纪70年代的一篇PNAS论文中,科学家就已经发现了m6A修饰,只不过受限于当时的技术手段,只能猜测这种修饰可能会对生命活动产生一定的影响。真正把RNA表观修饰推向研究高潮的是来自芝加哥大学的何川教授。2011年来自何川教授实验室的贾桂芳和付晔在Nature Chemical Biology发表论文称,与肥胖相关的蛋白FTO可以对RNA上A碱基的m6A修饰有去甲基化作用。何川教授坚信,这些修饰不是没有任何意义的噪音。这种可逆的RNA碱基修饰是能够在生物体内调节基因的表达的一种重要调控手段。
所以FTO的发现意味着m6A不仅仅是一个被动存在的RNA碱基修饰,而是一种可以被细胞主动调节的修饰。与此同时,高通量测序技术的发展也能够使得低通量局部检测m6A的方法一下子跨越到了高通量时代。于是就有了前面提到的Gideon Rechavi教授在2012年Nature上发表的工作。
甲基化的RNA双链体(在凹槽中的N6-甲基化腺嘌呤以浅蓝色突出显示)
对比十多年前高通量测序刚刚起步的2008年,现如今转录组学以及表观转录组学正在蓬勃发展。高通量测序几乎已经成为所有分子生物学实验室家常便饭的存在,做转录组就跟做RT-qPCR、Western Blot那样变得稀疏平常。
目前,我们每天都能在许多高水平的学术期刊上查阅到大量的高通量测序方法学论文(Protocol or Method of NGS)。即便如此,研究m6A等RNA碱基修饰的方法依然匮乏,这些表观转录领域的科学们仍有许多问题需要解决。许多实验室无法降低m6A测序的样本起始量(常规total RNA的建库起始量仍然需要超过10-20μg),也无法做到几乎精确的单碱基分辨率。尽管miCLIP-seq能够达到对m6A修饰单碱基的分辨率,繁琐的操作过程会耗费一个熟练的研究生至少5-7天。而ACA剪切酶MazF号称能够对低起始量的RNA做到单碱基m6A分辨率,但是存在的问题也不少。
所以当前的方法缺乏对稀有和珍贵样品所需的灵敏度,也不可能做到真正量化转录组中给定修饰的数量,更不可能在单次实验中同时对多种修饰进行鉴定。何川的同事,来自芝加哥大学的分子生物学家潘滔教授也参与了FTO对m6A去甲基化修饰作用的工作。他表示,现在急需开发全新的RNA碱基修饰的鉴定技术。
也就是说,表观转录组学的相关研究人员对他们的研究领域正在前进的方向感到兴奋。康奈尔大学医学院的遗传学家Chris Mason教授正在领导着一个研究小组专注于m6A修饰,他感慨道:“如果你不考虑DNA是如何折叠包装,就不会想到DNA。也许在未来的某一天,几乎不会有人在想到RNA时,居然还不会考虑碱基修饰?”。
在1970年代初期,来自密西根州立大学的Fritz Rottman教授就在腺嘌呤上发现有甲基修饰,并试图了解RNA在调节基因表达中的作用。这种带有甲基化修饰的腺嘌呤碱基被称作N6-甲基化腺嘌呤,当然它还有一个更加顺口的缩写名字——m6A。Rottman和他的学生Karen Friderici已经是密西根州立大学的荣誉退休教授了。在当时那篇发表在PNAS的论文里,他们写道RNA甲基化可能是选择某些转录本以翻译成蛋白质的一种方式。当时他们使用的是m6A放射性同位素标记来研究mRNA上的这种碱基化学修饰。但是由于这些研究只选择3’ UTR区上碱基,因此他们担心可能还混入了其他类型的RNA分子或其他修饰。康奈尔大学医学院的Samie Jaffrey教授与Rechavi教授一样,也是全球第一篇m6A测序的发明人之一。Jaffrey认为,早期的研究似乎很难获得比较纯的样本来判断mRNA中的m6A修饰是否存在污染。但是即便通过高通量转录组测序,科学家对于mRNA上m6A修饰的位置也很难做出准确的判断。常规的转录组测序建库步骤中需要对RNA进行逆转录,即把RNA反转录成cDNA,然后扩增成illumina测序文库进行测序和分析。在反转录成cDNA的过程中,常规的逆转录酶无法区分A上是否携带m6A修饰,最后的cDNA上的碱基修饰信息会全部丢失。“这些m6A一旦反转录后,就跟常规的A一样,没多大的区别。”Jaffrey无奈地说道。尽管在当时,技术瓶颈带来了种种困难,细菌中偶然发现的RNA碱基修饰最终激起了Jaffrey的兴趣,于是他决定在哺乳动物的RNA中也去碰碰运气。Jaffrey和Mason一起合作,将哺乳动物的RNA进行片段化,然后使用m6A抗体将这些RNA片段富集下来进行测序。几乎在同一时间,以色列的Rechavi课题组也在进行着同样的工作。虽然这两个实验室彼此并不知道对方正在进行的工作。由此可见,m6A的竞争即将进入白热化阶段。就在2011年何川教授公布FTO为m6A去甲基化酶后的2012年,这两个独立的实验室各自在Nature和Cell上发布了全球第一篇m6A测序文章,这种高通量检测m6A修饰的方法被称作m6A-seq或MeRIP-seq。“我们通过对测序的结果进行分析后发现,mRNA上存在大量的m6A修饰。Jaffrey激动地表示,他们实验室发表在Cell上的工作非常了不起,他的团队终于可以证明这些修饰不是污染物了。同样Rechavi课题组的相似结果也发表在Nature上。他们通过m6A测序也发现,7000多个人类基因上一共有12000多个m6A富集的Peak。这些Peak并不是杂乱无章地随机分布,而是有序地分布在CDS区、终止密码子区及3’ UTR区。目前,全球各地的RNA表观遗传工作者都在使用m6A-seq和MeRIP-seq。自此这个强大工具的应用场景逐渐拓宽到不同疾病乃至不同的物种中,各个领域科学家都绘制了自己m6A图谱。包括Synaptic Systems、NEB、Abcam、Merck Millipore等公司均可提供m6A的多克隆抗体或单克隆抗体。这种抗体既可以对哺乳动物也可以对病原微生物及植物RNA中的m6A修饰碱基进行富集。研究人员通过m6A测序后发现,这种修饰可以控制细胞发育成不同类型,而这一精准的调控过程在肿瘤中会出现异常。实际上,早在2016年陈建军教授与何川教授一起合作后就发现,在急性髓细胞白血病AML中,FTO表达量显著高于正常水平,可能会刺激细胞分化(m6A去甲基化酶FTO对急性骨髓白血病有致癌作用)。几乎在同一年,Jaffrey所领导的研究小组使用单碱基分辨率的miCLIP-seq发现,m6A抗体除了与m6A能结合外,还能富集到另一种腺嘌呤修饰——N6, 2'-O-二甲基腺苷(m6Am)。当时Jaffrey并不知道m6Am是否有生物学意义,但是他在这篇Nature中委婉表示,m6Am才是FTO的靶标而不是m6A,并且m6Am能够影响mRNA的稳定性和亚细胞定位。然而当时已经归国的贾桂芳博士以及她的学生段洪超博士则有不同的看法。关于究竟是m6Am还是m6A才是FTO底物,Jaffrey与何川之间的恩恩怨怨详见m6A去甲基化酶FTO的难产之路 | m6A八卦故事。斯坦福大学著名的华人表观遗传学家,同样也是单细胞ATAC测序技术的推广人之一Howard Chang教授认为这种争议其实在一个新的研究领域太常见了。他认为这个问题其实与组蛋白修饰刚兴起不久的那种争论太相似了。除了m6A,RNA上的其他修饰也引起了研究人员的注意。2016年,已经回到北京大学建立独立实验室的伊成器教授(师从何川教授)、Rechavi教授以及何川教授各自在Cell上绘制了人及小鼠细胞中N1-甲基腺苷(m1A)动态图谱。这几个独立研究小组使用不同的方法防止m1A收到逆转录的干扰,并发现在RNA上的m1A修饰几乎都集中富集在mRNA上用于蛋白翻译启动的区域。随着压力胁迫等外界刺激条件的改变,这些m1A修饰也会发生动态变化。这些科学家也许还不知道m1A的具体机制是什么,但是他们找到了一个看上起极其诱人的线索——绝大多数mRNA上只有一个m1A位点,而且与未发生修饰的区域相比,这些发生m1A的区域似乎翻译频率会更高。Rechavi表示这个发现令人非常兴奋,当然对他们来说也是一个新的挑战,因为这极有可能是mRNA上一种全新的翻译调控机制。从整体水平研究RNA上的其他修饰方法也类似,最关键的是这些碱基上需要携带有特殊的修饰并且能够被富集到。伊成器在何川教授的实验室完成学术训练后于2011-2013年期间回到北京大学建立自己的独立实验室。当时他发现一种称之为假尿苷或pseudoUs的修饰碱基,但是这种修饰在mRNA上并不常见。伊成器课题组的第一个博士李笑雨在哺乳动物转录组中鉴定假尿嘧啶修饰的课题中一度因为合成的标记物富集效率的问题陷入困境,踟蹰不前。当时正值暑假时间,她和课题组的同学们都放弃了休息时间,夜以继日,终于突破瓶颈,解决了技术上的难题,在这个竞争激烈的领域赢得了时间上的先机。终于在2015年,伊成器带领他课题组的小伙伴们采用pulldown的方式在转录层面对假尿苷进行了整体鉴定。后来,伊成器接连在m6Am去甲基化酶PCIF1鉴定以及高灵敏度羟甲基化鉴定工作上取得重大突破。伊成器认为假尿苷可以在mRNA上行使多种功能,但是这取决于何时何处以及如何在转录本进行。据说目前,伊成器课题组已经在假尿苷转移酶(writers)取得了一些进展,但是去修饰酶的鉴定工作目前仍然充满挑战。无论使用抗体还是那种偏分析化学的质谱法,绘制RNA修饰图谱一直都不是一项容易的工作,Mason认为抗体存在一些非特异性富集的情况,例如m6A抗体可能也会与m6Am以及其他一些RNA修饰发生特异性结合情况。这就使得研究人员至少要使用两种抗体以上才能富集到纯度较高的特异性修饰碱基(即一抗二抗)。同样被认为是金标准的质谱法,在前期预处理上需要把核酸消化成单个碱基,中间操作步骤也是较为繁琐,稍微不慎就会产生很大误差。伊成器认为二代测序的测序深度以及生信算法均会严重影响到修饰位点鉴定的准确性。Mason说,即便是同样的细胞在几乎完全相同的培养基中培养时间长短也会影响修饰水平,因此对捕获基线比对校正至关重要。但是仅仅了解样本中的部分RNA碱基修饰是不够的,潘滔教授认为对所有RNA上的碱基修饰进行精准定量至关重要,因为在细胞中只要RNA修饰达到一定的精确数量即可发挥正常的生物学功能。对于那些研究通过writers或erasers来调节修饰水平的研究人员来说,定量分析尤其重要。潘滔解释,这些酶的存在表明RNA修饰水平调节在生物体内其实是一个十分精确的调控过程,2015年,潘滔教授所领导的研究小组在Nature Methods上发表了一项可以对tRNA碱基修饰进行精准定量的论文。该方法通过一种特殊的逆转录酶,尤其是这种方法可以捕获到第一个修饰碱基下游的序列,可以说基本无惧tRNA上的修饰从而对tRNA达到精确定量。现在潘滔教授正在努力将相同的策略应用于mRNA修饰,如m1A。但是定义这些碱基修饰功能最快的方法便是鉴定出这些碱基修饰的writers、erasers和readers。2012年Rechavi那篇m6A测序论文中,利用带有m6A修饰的oligo来抓取任何可能与这些oligo结合上的蛋白。这种称为RNA pull-down的策略在2014年何川教授的另一篇文章也有出现过。利用这种pull-down的方法对蛋白进行质谱鉴定方法,人们已经陆续发现了多种甲基化转移酶(也叫writers)、去甲基化酶(也叫erasers)以及甲基化阅读蛋白(也叫readers)。现在Rechavi正在尝试使用pull-down的方式来鉴定m1A上的一些RNA结合蛋白。但是他们似乎遇到了一些困难,m1A修饰在RNA上的位置更加集中在蛋白翻译起始位置,而不像m6A可能存在各个部位。这就给m1A前期富集工作以及后期蛋白鉴定工作带来了很大困扰。目前暂时已鉴定的m1A的writers有TRMT6/10C/61A/61B,erasers有ALKBH1/3,readers有YTHDF1/2/3及YTHDC1。一旦这些酶被坚定出来后,后面的工作实现起来就会容易很多。基因编辑技术可以在细胞和动物水平轻松实现对基因表达的调节,从而使研究人员可以从碱基修饰的全局变化中进行更深一步的研究。例如在2014年,Chang所在的研究小组就在人和小鼠的胚胎干细胞中对一种名为METTL3的writer进行敲除后发现,干细胞分化受到了很大影响。但是与其他先前的一些表观遗传学的研究相似,解释这些现象可能会比科学家们想象的还要复杂。以m6A为例同一种甲基化酶可能会对几千条mRNA和lncRNA乃至核糖体RNA及circRNA上的碱基修饰都会产生影响。并且每一个RNA分子上的碱基修饰可能行使的生物学功能不尽相同。“如果某些影响是通过目前还无法我们检测工具所能企及的范围内发生,那我也不会感到惊讶,但它们仍然在细胞中广泛存在并且十分重要”Chang解释道。在过去的几年中,何川所在的研究小组与全球其他实验室开发了诸多研究工具,能够帮助科学家更好研究RNA碱基修饰,从而更加深入理解细胞中的一些转录本调控方式,如细胞分化程序启动等。全球的表观转录科学家们急需更好的工具来帮助他们实现相应的研究。2016年,NIH决定向何川教授和潘滔教授提供一项为期五年总额高达的1060万美元的funding资助,用于开发一种鉴定和定位RNA修饰的新方法。何川认为,一个十分关键的技术瓶颈就是如何在碱基修饰位点产生突变并对其进行扩增的方法。在电子显微显下RNA聚合酶蛋白与DNA链相连。图片来源:Omikron / SPL
采用新型的成像技术,可以使得从单分子层面上观察m6A修饰逐渐成为可能。何川神秘地笑道:“我很想说其实已经有人正在开发一种在mRNA中对m6A修饰的成像技术啦!”这就是何川教授的秘密武器——他曾经的学生付晔。在何川教授实验室拿到博士学位的付晔博士,与贾桂芳博士一样都是FTO历史的见证者。目前他正在哈佛大学著名华人女科学家庄小威实验室进行博后训练。
付晔将超高分辨率显微技术与另一种方法结合来观察RNA上的m6A修饰。在过去的几年里,庄小威实验室率先开发了一种被称之为MERFISH(multiplexed error-robust fluorescence in situ hybridization)的单细胞层面RNA可视化工具。付晔表示,自己在过去的几年里已经取得了巨大的进步,但是数据中仍然存在诸多噪音,需要对各个细节进行优化。近几年兴起的三代测序也逐渐在RNA碱基修饰的检测领域大显神威。来自英国Nanopore(也叫牛津纳米孔)公司已经在超长reads读长的DNA测序领域取得了巨大的进步。现在Nanopore公司的科学家们通过将DNA和其他聚合物一起通过嵌入膜内的纳米孔技术从DNA层面拓展到了RNA层面。同样已经被illumina公司收购的著名三代测序公司Pacbio也展示了一项能够直接对RNA全长进行单分子实时测序的新技术——SMRT。“这个想法肯定和SMRT测序本身一样古老”Pacbio首席科学家Jonas Korlach说道。SMRT测序使用一种称为DNA聚合酶的酶复制DNA链,实时捕获带有不同荧光标记的核苷酸。为了使该技术同样也适应RNA测序,Korlach及其合作者用HIV的逆转录酶替代了聚合酶。他们发现,带有修饰的碱基相比于那些不带有任何修饰的碱基而言,带上荧光标记的速度要整体偏慢,最终每个碱基修饰都有属于自己的“动力学特征(kinetic signature)”。但是利用三代测序技术直接对RNA进行测序也暴露出很多原有DNA三代测序中未曾遇到的问题。其一是RNA非常容易自折叠成茎环结构,最终形成稳定的二级结构。Nanopore的科学家们尝试将RNA附着在cDNA上,这有助于消除RNA的二级结构并帮助其顺利通过纳米孔。另一个挑战是,RNA降解速度远远大于DNA,这一问题最终会严重干扰到长reads测序准确度。数据分析上的一大挑战就是正确识别大量不同的RNA碱基修饰。识别同一个碱基上的100多种修饰需要大量的优质数据提供训练集,才能帮助软件把其中的一种碱基修饰与另一种碱基修饰区分开。约翰·霍普金斯大学的生物医学工程师Winston Timp一直在使用Nanopore技术来开发检测特定DNA修饰的新方法。他现在计划着手进行RNA修饰的鉴定工作,开发一套有助于识别m6A修饰的数据训练集。也行他自己可能都不知道修饰在给定分子上的多样性,但他认为这个令人兴奋领域仍然值得探索的。m6A八卦故事还没看够吗,更多的精彩尽在联川生物m6A新书中。
一个好消息:新书下周到货,27.8元/本,想预定的老师千万别错过。联川m6A新书预订,国自然和高分文章神器!
1. Levanon, E. Y. et al. Nature Biotechnol. 22, 1001–1005 (2004).2. Jia, G. et al. Nature Chem. Biol. 7, 885–887 (2011).3. Kowtoniuk, W. E., Shen, Y., Heemstra, J. M., Agarwal, I. & Liu, D. R. Proc. Natl. Acad. Sci. USA 106, 7768–7773 (2009).4. Meyer, K. D. et al. Cell 149, 1635–1646 (2012).5. Dominissini, D. et al. Nature 485, 201–206 (2012).6. Li, Z. et al. Cancer Cell 31, 127–141 (2017).7. Mauer, J. et al. Nature 541, 371–375 (2017).8. Dominissini, D. et al. Nature 530, 441–446 (2016).9. Li, X. et al. Nature Chem. Biol. 12, 311–316 (2016).10. Li, X. et al. Nature Chem. Biol. 11, 592–597 (2015).11. Zheng, G. et al. Nature Methods 12, 835–837 (2015).12. Wang, X. et al. Nature 505, 117–120 (2014).13. Batista, P. J. et al. Cell Stem Cell 15, 707–719 (2014).14. Zhao, B. S., Roundtree, I. A. & He, C. Nature Rev. Mol. Cell Biol. 18, 31–42 (2017).15. Garalde, D. R. et al. Preprint at http://biorxiv.org/content/early/2016/08/12/068809 (2016).16. Vilfan, I. D. et al. J. Nanobiotechnol. 11, 8 (2013).17. Simpson, J. T. et al. Nature Methods (2017).18. Roost, C. et al. J. Am. Chem. Soc. 137, 2107–2115 (2015).联川m6A新书预订开始,国自然和高分文章神器!
RNA m6A阅读蛋白IGF2BP增强mRNA稳定性&促进翻译 | m6A专题
干货收藏-植物m6A论文大致内容和框架简介 | m6A专题
Nat Com用户m6A文章:YTHDF1影响NSCLC进展 | m6A专题
用户10分文章 | m6A lncRNA GAS5抑制结直肠癌发生且受到YTHDF3负调控 | m6A专题
拟南芥m6A阅读蛋白ECT2调控皮毛发育 | m6A专题
RNA表观遗传学的淘金热(下)——基因调控的新途径 | m6A八卦故事
Nat Commun用户m6A文章 | 热烈祝贺中科院昆明动物所陈勇彬老师发表最新研究成果