制备mRNA 5ˊ末端文库的四种方法
使用Illumina测序平台制备mRNA 5'末端文库的四种方法
mRNA的5ˊ非翻译区在其翻译过程中起着重要作用,本文作者开发了四种基于Illumina测序平台分析mRNA 5ˊ末端的方法:第一种方法利用SMART(Switching Mechanical At 5ˊ End Of RNA Transcript)技术,第二种方法通过连接将5ˊ帽结构替换为RNA寡聚体。第三和第四种方法是SMART的改良,分别富集具有(核转录本)和不具有(线粒体转录本)5ˊ端帽结构的mRNA分子。使用SMART技术制备的文库给出了更具重复性的结果,但连接方法的优势在于它只对5ˊ端有帽结构的mRNA进行了测序。这些方法适用于在单分子分辨率下具有和不具有帽结构的mRNA 5'末端的整体作图。另外,使用不同方法获得的当前结果的比较表明,存在没有帽结构的大量信使RNA。
本文以成年黑腹果蝇PolyA+RNA为测试样本,分别用SMART cDNA文库构建试剂盒和连接法建库试剂盒制备了各六个文库,各自混合后使用Illumina HiSeq测序,还使用CapSMART和Non-CapSMART方法分别制备了三个文库(三个文库中的每个使用了不同的STOP寡核苷酸),六个文库混合后使用单个Illumina lane测序。cDNA文库构建后,将所有四种方法生成的文库进行相同的建库流程,包括超声处理,5'端生物素收集和Illumina文库制备。使用Veriti热循环仪进行所有热反应。
为了进一步确认每种方法的重现性,使用胚胎黑腹果蝇PolyA+RNA构建了一个SMART文库和四个连接文库。测序前将四个连接文库混合,Illumina MiSeq用于对合并的连接文库和SMART文库进行测序。除测序仪外,所有实验均按上述成年黑腹果蝇PolyA+RNA样品的描述进行。
一 下面先来介绍一下文中所使用的四种建库流程1.1 用SMART方法制备cDNA文库使用SMART cDNA文库构建试剂盒(Clontech)和修饰的SMART寡核苷酸构建文库(表1,图1)。样本使用的是poly A +RNA(0.025–0.5 µg)或总RNA(0.05–1.0 µg)(图1A)。使用SMART Scribe MMLV逆转录酶进行第一链cDNA合成,以及midified SMART oligo的转换(图1B)。使用生物素化的5'末端引物通过PCR扩增第二链cDNA,所得产物进行电泳检测(图1C)。使用Bioruptor断裂cDNA,并使用珠子收集生物素化的5'末端(图1D)。Table 1. List of modified oligonucleotides used for SMART, CapSMART and Non-CapSMART.
1.2 使用连接法制备cDNA文库使用ExactSTART真核mRNA 5'-和3'-RACE试剂盒(epicentre)和修饰的5'-RACE受体寡核苷酸构建文库(表2,图2)。首先使用碱性磷酸酶从5'-单磷酸,二磷酸和三磷酸RNA中去除5'-磷酸基团(图2B)。然后将产物用烟草酸焦磷酸酶(TAP)处理以去除5'帽结构并暴露单磷酸基团用于后续连接(图2C)。之后将修饰的5'-RACE受体寡核苷酸连接到RNA(图2D)。每个反应均包含六种不同的修饰5'-RACE受体寡核苷酸之一(表2:TAG02,TAG04,TAG05,TAG06,TAG07,TAG12)。连接后,通过MMLV进行第一链反转录并进行RNase消化(图2E)。使用生物素化的5'末端引物通过PCR扩增第二链cDNA(图2F)。如上一节所述,通过电泳确认了PCR扩增。Table 2. List of modified oligonucleotides used for the ligation method.
1.4 使用Non-CapSMART方法制备cDNA文库使用ExactSTART真核5'-&3'- RACE (Epicentre)和SMART cDNA文库构建试剂盒(Clontech),用修饰的SMART寡核苷酸和STOP寡核苷酸构建文库(表1,图4)。首先,使用碱性磷酸酶从5'-单磷酸,二磷酸和三磷酸RNA中去除5'-磷酸基团(图4B)。然后将产物用烟草酸焦磷酸酶(TAP)处理以去除5'帽结构并暴露单磷酸基团以进行连接(图4C)。将修饰的STOP Oligos连接至RNA,为了测试STOP寡核苷酸的连接偏倚,使用STOP1,STOP2和STOP Mix进行了三个反应。(图4D)。随后,用CDS III / 3'PCR引物和SMARTScribe MMLV逆转录酶进行第一链反转录(图4E)。反转录后,如上所述,通过LD PCR(Clontech)扩增得到的cDNA(图4F)。
二 四种方法得到的产物进行了统一的建库处理
2.1超声处理和5'末端的生物素收集对所有文库执行以下过程。使用Bioruptor(Diagenode)进行超声处理。将制备的文库通过高强度的20次ON / OFF循环声处理30秒。对超声处理的产物进行电泳以确认片段化。随后按照制造商的方案,每个反应使用50μlDynabeads MyOne链霉亲和素T1(Invitrogen)收集生物素化的5'末端产物。2.2文库制备和Illumina测序按照Meyer&Kircher制备Illumina测序文库。对收集的生物素标记的5'末端片段化产物进行末端修复,Illumina兼容的接头连接。每次反应后,使用Agencourt AMPure XP纯化产物。最终纯化后进行indexPCR,(引物表3)。SMART使用六种不同的index引物(ID01,ID02,ID03,ID04,ID05和ID06)进行indexPCR,并合并为一个样本。三个CapSMART文库和三个Non-CapSMART文库也被独立index合并为一个样本。PCR产物通过Agencourt AMPure XP纯化,并使用30 µl洗脱缓冲液(Qiagen)洗脱。使用Qubit dsDNA HS分析试剂盒对使用SMART,CapSMART和Non-CapSMART技术独立制备的文库进行定量。将等量的SMART定量文库混合后并进行测序。另外,将相当于300 µg CapSMART和50 µg Non-CapSMART的文库混合,并进行测序。Table 3. List of modified oligonucleotides used for Illumina sequencing library preparation, and custom sequencing primers for the SMART and ligation methods.
三 序列分析
使用Fastx-Toolkit,MySQL和Perl脚本执行了可重复性测试,使用Bowtie2和MySQL执行reads的Map和数据过滤。
四 结果和讨论
对于成年果蝇poly A +样品,使用Illumina HiSeq测序仪的三个泳道,SMART方法总共产生了164,160,619个reads,连接方法总共产生了130,314,839个reads,CapSMART和Non-CapSMART方法总共产生了150,847,202个reads(表4)。对于胚胎果蝇poly A +样品,使用SMART方法制备一个文库,使用连接方法,制备四个文库,Illumina MiSeq测序仪,SMART方法产生了8,461,669个reads,连接方法总共产生了9,688,990个reads。Table 4. Read numbers of sequences obtained from multiplexed samples using adult poly A+ RNA.
通过比较SMART来源和连接来源的文库中相同序列的频率来确定可重复性(图5和6)。对于通过SMART方法制备的文库,观察到了高重现性(图5)。相反,对于通过连接方法制备的文库,观察到相对差的再现性(图6)。假设使用连接法观察到的大量偏差是由连接偏差引起的。
显示六个独立重复的序列计数之间相关性的图(A:ID01 X 02; B:ID02 X 03; C:ID03 X 04; D:ID04 X 05; E:ID05 X 06; F:ID06 X 01)。结果显示出非常高的相关性(R2= 0.99633–0.99996),表明该文库制备方法具有很高的重现性。
显示六个独立重复序列计数之间相关性的图(A:TG02 X 04; B:TG04 X 05; C:TG05 X 06; D:TG06 X 07; E:TG07 X 12; F:TG12 X 02)。结果显示相关性相对较低(R2= 0.09689–0.72684),表明文库制备方法的重现性较低。4.2 5'末端的分布使用所有四种方法获得的片段均被定位到果蝇果蝇基因组序列上。映射到2L染色体负链上的序列用于以下分析。此处给出了映射序列的频率分布的三个示例(图7–9)。
仅描绘了比对在负链上的序列。基因位置(Rapgap1和CG13791)显示在图的底部。使用SMART和连接方法{成年(TG02,TG04,ID01和ID02)和胚胎RNA},以及使用CapSMART和Non-CapSMART方法(ID01,ID02,ID03,ID04,ID05和ID06)结果如图所示。
仅描绘了比对在负链上的序列。图的底部显示了基因位置(Jon25Bi,Jon25Bii,Jon25Biii和jet)。使用SMART和连接方法{成人(TG02,TG04,ID01和ID02)和胚胎RNA},以及使用CapSMART和Non-CapSMART方法(ID01,ID02,ID03,ID04,ID05和ID06)结果如图所示。
仅描绘了比对在负链上的序列。基因位置(RpL36A)描绘在图的底部。使用SMART和连接方法{成年(TG02,TG04,ID01和ID02)和胚胎RNA},以及使用CapSMART和Non-CapSMART方法(ID01,ID02,ID03,ID04,ID05和ID06)结果如图所示。第一个示例(图7)包含Rapgap1和CG13791周围的区域。在该区域,观察到通过不同方法生成的库之间频率分布的巨大差异。在通过连接方法制备的文库中未观察到峰。相反,在SMART库中观察到两个清晰的峰,分别对应于Rapgap1和CG13791。第二个例子(图8)是包括Jon25Bi,Jon25Bii和Jon25Biii基因周围的区域。使用成年多聚A + RNA作为模板构建的文库显示,该区域包含三个重复序列,并具有向右的“天鹅形”分布。尽管在通过所有四种方法获得的文库中天鹅的形状相似,但是在通过连接方法制备的文库中,天鹅的身体较小(即,频率分布减小了)。与使用成年poly A + RNA生成的文库相反,在使用胚胎poly A + RNA制备的文库中观察到非常低的转录频率。这一观察结果与先前的报道一致,即胚胎期的基因转录水平低于成年期的。第三个例子是RpL36A基因(图9),与其他示例相反,当使用成年poly A + RNA作为模板时,无论文库制备方法如何,该区域的频率分布都非常相似。相反,在以胚胎polyA + RNA为模板的不同方法制备的文库之间,观察到频率差异很大(连接文库的左侧峰频率降低,SMART方法来源文库的右侧峰频率降低)(图9)。本研究中使用的文库制备方法的不同之处在于,SMART方法不需要5'帽子结构(图1),而连接方法则需要5'帽结构(图2)。因此,仅在通过SMART方法生成的库中观察到的峰表示没有5'端帽子结构。这些结果表明大部分mRNA缺少5'帽子结构。直到最近,人们还认为脱帽是一个不可逆转的过程,会使mRNA分子降解。然而,最近的研究表明,在细胞质中可能发生mRNA的重新加帽。推测在某些条件下,不带帽结构的mRNA可以作为mRNA的潜在来源。有趣的是,基因的峰形不同,对于Jon25Bi,Jon25Bii和Jon25Biii观察到了天鹅状的分布(图8)。相反,在CG13791(图7)和周围(图8)的分布中观察到尖锐的峰。不同发育阶段的形状也有所不同。例如,在源自胚胎RNA的连接文库中,RpL36A的中心峰比源自成年RNA的连接文库的中心峰窄得多(图9)。5'非翻译区在基因翻译中起重要作用,但基本的调控机制仍然未知。这些机制的研究超出了本研究的范围。但是,此处描述的方法将提供阐明此类机制的手段。尽管使用连接方法观察到了较低的再现性(图6),但作图分析显示,无论所使用的标签如何,库之间的频率分布模式都非常相似(图8和9:TG02和TG04)。这可能是由于转录起始位点范围广泛,可以使序列特异性连接偏倚正常化。但是,有时会在具有尖峰分布的基因的转录起始位点观察到定量偏斜(例如CG13791图7和jet图8)。)。因此,作者建议使用相同或随机的标签序列以方便比较,并建议使用Illumina样式的“index”多杂。连接法的一个优点是其对帽结构的高度依赖性,这种高度的依赖性使我们能够确定成熟的带帽mRNA转录起始位点的确切位置,而使用其他三种方法则无法实现。线粒体转录本的频率表S1,S2和S3总结了使用四种文库制备方法获得的线粒体转录本(无帽结构)的数量。我们观察到很少使用连接方法对线粒体转录本进行测序,证实了该方法高度依赖于帽结构。虽然使用连接方法测序的线粒体转录本很少(表S2),但某些转录本似乎比其他转录本占优势。NADH脱氢酶亚单位(ND1、2、3、4、5、6)和16SrRNA的转录本频率很低,而细胞色素氧化酶I、II和III亚基(CO1、CO2和CO3)、细胞色素b辅酶(CYB)和ATP合成酶亚单位8(ATP8)的转录本频率较高。Table S1 Counts of mitochondrial transcripts obtained from libraries prepared by the SMART method (ID01–ID06) using adult poly A+ RNA
Table S3 Mitochondrial transcripts obtained from libraries prepared by the Cap SMART (ID01–ID03) and Non-Cap SMART (ID04–ID06) methods using adult poly A+ RNA
五 结论
目前已经开发了四种使用Illumina平台对mRNA 5'末端进行测序的方法。所有这四种方法都需要少量的起始poly A + RNA(对于SMART方法,最小为25 ng),整个文库构建过程可以在两到四天内完成。此外,所有的文库都是使用市售的试剂盒开发的,使任何实验室都可以轻松重复这些程序。SMART方法在可重复性方面优于连接方法,因此,该方法适用于mRNA丰度的定量。相反,连接方法能够选择性地对具有5'帽结构的mRNA进行测序。后一种技术有望增加我们对基因5'端分布的理解。最后,得到的5'末端绘图提供了对5'未翻译区域的新见解,表明没有帽子结构的mRNA含量丰富。