通过改善的低起始量样本RIP-seq方法进行表观转录组学分析
作为mRNA中丰度最高的修饰,m6A在动物mRNA中占比0.2%-0.6%。MeRIP-seq是一种在全转录组范围内定位m6A的方法。然而,这种方法需要起始量为300ug的总RNA,这就使其在疾病肿瘤方向的应用很受限。本文中,我们呈现了一种改善的m6A MeRIP-seq方法和分析准测,使其可以应用于低起始量的肿瘤样本。我们优化了m6A MeRIP-seq的关键参数,包括RNA的起始量、RNA片段化条件、抗体的选择、MeRIP清洗/洗脱条件、RNA文库构建方法、生信分析准则。由于IP条件的优化和rRNA去除后的扩增,我们可以把起始量降低到500ng。从两个肺腺癌(ADC)病人的肿瘤中,我们鉴定到了接近12,000个m6A峰,这些m6A峰有着高的信噪比。通过对同一肿瘤病人的转录组学、m6A表观遗传学和蛋白质组学的数据分析,我们发现m6A的动态变化可以影响mRNA和蛋白含量的失调。这个优化的m6A MeRIP-seq方法适用于研究样本量受限的肿瘤样本的m6A表观遗传学研究,奠定了临床背景下m6A表观遗传的动态变化和潜在机制。
表观转录组是一种基于RNA生物化学修饰的功能相关的转录组组学,它开启了研究基因表达的转录后调控之门。迄今为止,已发现超过150种RNA修饰。自1970s首次被发现以来,m6A被认为是哺乳动物mRNA中丰度最高的修饰之一。最近关于m6A定位、功能及分子机制的研究证明这种修饰是可逆动态的,参与调节RNA周期的多个步骤,包括RNA剪切、RNA衰老、pre-miRNA加工和蛋白翻译等过程。
mRNA 中M6A修饰的动态的变化已经被证明与干细胞分化、应激反应、DNA损伤修复、性别分化和生物钟周期紧密相关。此外,最近的研究发现,m6A的失调在人类癌症的发生和发展过程中发挥着至关重要的作用。M6A相关的酶,包括writers、readers、erasers,在许多肿瘤样本中都表达异常。例如,由缺氧引起的m6A去甲基化酶ALKBH5可以引起干细胞的marker基因NANOG的去甲基化,进而导致NANOG基因表达和乳腺癌干细胞的量增加。此外,ALKBH5通过增强FOXMM1基因的表达来维持胶质母细胞瘤增殖和肿瘤发生。类似地,m6A去甲基化酶FTO和甲基化转移酶3(METTL3)的致瘤功能已经分别在急性骨髓性白血病和肺癌中得到证明。
MeRIP-seq被开发用来在全转录组范围内识别m6A修饰。在人类细胞中接近7000个编码蛋白的基因中,已发现超过10,000个m6A位点。尽管最近这这项技术已经得以改进,并且已有商业化的试剂盒,但是仍然RNA的起始量量仍然需要几百微克。因为临床样本可以获得的RNA总量很少,这就使得m6A在临床样本中的研究受限。尽管m6A是动物mRNA中丰度最高的修饰,但是由于缺乏有效的方法,m6A在人类疾病,尤其是癌症中的作用还有很多未知。因此,一种低起始量m6A的测序方法有助于对癌症中M6A动态变化机制进行研究。
为了研究病人肿瘤样本中的表观转录轮廓,我们优化了m6A MeRIP-seq中的关键实验参数,包括RNA的起始量,RNA片段化条件,m6A抗体选择,MeRIP清洗/洗脱条件和RNA文库构建方法。“peak”的寻找和m6A分析方法的不同也被探索。用优化后的方法,我们用来自肺癌病人肿瘤的2ug起始的总RNA进行建库测序分析,发现了接近12,000个m6A峰,这些峰具有高的信噪比。
清洗/洗脱条件的优化
M6A MeRIP的第一步是化学片段化。在高温时,通过重排反应,m1A可以转化为m6A,为了使这种重排反应最小化,RNA片段化温度由原来的94 ˚C改为70 ˚C。由于我们旨在挑战个位数微克级别的RNA作为m6A MeRIP,因为我们用的是总RNA而不是poly(A)富集的mRNA去片段化的。RNA片段化后主峰在200nt左右而非100nt,以尽量减少损失。
目前主要有两种m6A MeRIP方法。第一种,称为方法II(图1A ),IP孵育后用低盐/高盐清洗,随后洗脱整个抗体-磁珠复合体。第二种方法,称为方法III(图1A),用IP反应buffer清洗,m6A竞争物洗脱。这种方法在这个领域被普遍应用。为了比较这两种方法的IP效率,我们先用包含等量m6A修饰的对照RNA(Gluc)和没有修饰的RNA(CLuc)。Gluc RNA对照是在体外用20%的m6ATP和80%ATP转录而来。为了比较,我们增加了另外一种方法,称为方法I(图1A),用IP反应液清洗和洗脱整个抗体-磁珠复合物。本研究中使用NEB品牌的m6A抗体。方法二,使用低盐/高盐清洗,产生较高的信噪比(S/N)。用洗脱的RNA进行二轮IP,产生更高的信噪比(S/N)(图1C)。我们选择方法II对来自人类肺癌细胞系A549的RNA进行m6A MeRIP测序。在片段化之前,加入0.1fmol的Gluc和CLuc RNA到32ug的A549细胞系RNA中。基于已发表的A549细胞系的m6A MeRIP实验,SETD7和GAPDH分别作为阳性和阴性对照。第一轮IP之后, Gluc/Cluc和SETD7/GAPDH的S/N接近100倍。和用纯的对照GLuc和CLuc RNA结果一致,Gluc/Cluc和SETD7/GAPDH的信噪比进一步增加,尽管产量显著减少(66%)。
M6A峰的搜寻和“motif”分析准则的优化
随着全转录组范围内m6A研究的突破,2种分析准则被用于m6A峰的搜寻。第一种主要是运用最流行的“Peak calling”软件MACS,这个软件最初开发是为了CHIP-seq分析。第二种包括许多专门检测全转录组范围内的m6A位点的方法,如exomePeak , HEPeak, and MeTPeak。MeTPeak 是基于exomePeak ,和HEPeak开发的,我们用MeTPeak和MACS对A549和HepG2两个细胞系数据库进行分析比较。与MeTPeak比,MACS可以识别更多的m6A峰。MeTPeak识别的大部分peak也可以被MACS识别。MeTPeak和MACS都对测序深度比较敏感,但是MeTPeak可以在较低的测序深度时就可以达到平台期(图2B)。这两种方法种识别的m6A 峰中的 motif”RRACH”是一致的。然而,与MACS比,MeTPeak识别的峰的motif更接近于顶峰(图2C和2D)。MACS识别的峰倾向于在转录起始位点区域(TSS)富集。MeTPeak在识别相邻的外显子区域更准确。综合考虑,本研究选择MeTPeak进行后续的分析。
图2
M6A抗体影响m6A MeRIP效率
已经优化了m6A MeRIP方法和数据分析准则,接下来我们探索m6A抗体的准确性。我们选择了来自SySy、NEB和Millipore的三种m6A抗体。用32ug的来自A549细胞系的RNA,在RNA片段化之前加入对照RNA Gluc和Cluc。与NEB和Millipore比,SySy抗体产生两倍量的IP产物。三种抗体中,GLuc/CLuc和SETD7/GAPDH的信噪比都比较高,尤其是NEB和Millipore,它们可以产生的信噪比超过100(图3A)。
比较了一些商业化的RNA测序试剂盒,我们选择了SMARTer Stranded Total RNA-Seq (KitPico Input Mammalian,Takara/Clontech)。该试剂盒在转录组后,使用人特异的核糖体探针去除核糖体的cDNA。
这种方法在片段化之前没有去除rRNA或者富集poly(A)RNA,可以最大程度地减少低起始量RNA的损失。用此试剂盒,我们成功地构建了这三种抗体的IP和Input样本的文库。与RT-qPCR结果一致,使用这三种抗体构建的文库测序结果中SETD7的m6A的S/N非常近似(图3B)。每个文库中大约13,000个m6A峰可以被检测到,其中有约60%的峰是重叠的(图3C)。三种抗体的平均测序深度为20M,就可以使鉴定到的峰的数量达到平台期(图3D)。m6A峰主要在终止密码子附近富集。在5个不重叠的基因组区域内,这三种抗体鉴定到的m6A的占比也类似,且m6A都是在终止密码子附近富集(图3F)。此外,用NEB和Millipore抗体IP到的m6A峰的motif是“GGAC”(图3G)。
用来自A549细胞系的低起始量RNA进行m6A MeRIP建库测序
我们用Millipore抗体检测不同起始量(32ug、12ug、6ug、2ug、1ug和0.5ug)的RNA的m6A MeRIP效率。随着起始量的减少,SETD7/GAPDH的S/N逐渐减少。增加RNA起始量可以增加检测的m6A峰的数目,且除了0.5ug起始之外,其他起始量的样本测序深度为20M时即可达到检测峰数目的平台期,但是0.5ug起始的样本,测序深度为10M时即可达到检测峰数目的平台期(图4)。比较32ug、12ug、6ug、2ug、1ug起始的样本,RNA起始量越高,检测的唯一的m6A峰数目越多(图4B)。此外,2ug和32ug起始的样本中重叠的m6A基因的表达水平显著高于32ug起始的样本中的唯一的m6A峰的基因的表达水平(图4C),这意味着样本起始量越高,m6A MeRIP-seq可以鉴定到的m6A峰的丰度就越小。2ug起始的样本与其他起始量的样本比,m6A峰都是在终止密码子附近富集,主要的motif序列也一致(图4D)。
我们也比较了不同的抗体起始量的影响,发现抗体起始量越低,S/N越高,但是RNA的产量也越低。
图4
肺癌肿瘤细胞中m6A的表观转录组
已经用人细胞系证明了低起始量样本m6A MeRIP-seq的准确性,因此我们用这种方法来探究两个ADC病人(tumor 1和tumor 2)的m6A表观转录组学。为了增加MeRIP实验的多样性,本实验中加入外源RNA。因为细菌K-12中m6A修饰已经被检测,因此我们在片段化之前加入9ng的K-12 RNA到2ug的病人肿瘤RNA中。我们在每个样本中检测到了12,000个m6A峰,有接近60%的m6A峰在两个样本中都可以被检测到。M6A峰主要在终止密码子和TSS位点附近富集(图5A),且motif序列也一致(图5B)。tumor1样本中可以检测到599个峰(554个基因),tumor 2样本中可以鉴定到465个峰(417个基因)(图5C)。为了进一步探索m6A在蛋白水平上的影响,我们对两个肿瘤样本进行了MS分析。在选择的953个基因中,209个可以被MS检测到。对在mRNA和蛋白水平上相对高表达的基因进行筛选,我们把范围缩小到45个基因,其中18个基因两个样本之间会有表达差异(图5D)。如SLC2A1,它的mRNA表达量在两个样本间是近似的,但是蛋白水平tumor1是tumor2的1.9倍(图5E)。用人源肿瘤移植样本进行蛋白印记分析也证实了这种差异(图5F)。tumor1中SLC2A1 终止密码子附近的m6A水平是tumor2中的2倍(图5E)。因此我们推断mRNA和蛋白水平之间的差异可能是与m6A水平的动态变化有关。为了验证这种假设,我们用2个不同的siRNAs对A549细胞系中的METTL3进行了敲除,敲除效率用RT-qPCR和western blot进行了验证(图5G和5H)。敲除后,SLC2A1 mRNA的表达量变化不大,但是蛋白含量显著下降(图5H)。已报到METTL3的非催化区域可以促进EGFR蛋白的翻译,因此我们验证METTL3是否可以增强SLC2A1的翻译效率。在内源性METTL3敲除细胞系中,全长但是无催化活性的外源性METTL3可以提高SLC2A1的蛋白表达量(图5I和5J),表明m6A甲基化可以促进SLC2A1的翻译效率。
图5
ZengY, WangS, GaoS, SoaresF,Ahmed M,GuoH,etal.(2018) Refined RIP-seq protocol for epitranscriptome analysis with low input materials.PLoSBiol16(9):e2006092
Zhao BS, Roundtree IA, He C. Post-transcriptional gene regulation by mRNA modifications. Nat Rev
Mol Cell Biol. Nature Publishing Group; 2017; 18: 31–42
Roignant J-Y, Soller M. m(6)A in mRNA: An Ancient Mechanism for Fine-Tuning Gene Expression.
Trends Genet. 2017; 33: 380–390.
Xiao W, Adhikari S, Dahal U, Chen Y-S, Hao Y-J, Sun B-F, et al. Nuclear m(6)A Reader YTHDC1 Regu-
lates mRNA Splicing. Mol Cell. 2016; 61: 507–519
相关阅读
高分文章RIP-seq和m6A峰图可视化两种方法-IGV和UCSC | m6A专题
1+1大于2!RIP-seq与其他组学的搭配你值得拥有 | RIP专题
RIP-seq抗体评估怎么做?小师妹看了都直呼内行!|RIP专题
用户文章:RIP-seq和m6A-seq联合分析揭示头颈癌铁代谢机制 | RIP专题
点击下方图片进入云平台资料汇总:
所见即所得,figure有bi格
联川云平台,让科研更自由