利用高通量测序对蛋白质- RNA相互作用进行全转录分析
摘要
蛋白质- RNA相互作用正在成为调控基因表达的重要功能元素。通过紫外照射和免疫沉淀将蛋白质交联到RNA上(CLIP)为这一领域的研究提供了一个重要工具。最初,该方法的瓶颈是鉴定出的RNA结合位点相对较少。只有新一代测序技术的出现,才允许对交联蛋白- RNA片段进行全面和无偏倚的描述。在此,我们总结了蛋白质- RNA相互作用研究的最新进展,以及使用不同的CLIP方法在培养细胞和生物体中获得的一些重要发现。这些努力使得鉴定广泛的RNA相互作用蛋白的功能性RNA结合位点成为可能。实验和生物信息学的进展将进一步推动这一动态研究领域的发展。高分辨率的蛋白质- RNA相互作用图谱与描述RNA稳定性、修饰和结构的转录组数据以及蛋白表达谱相结合,将为转录后和翻译调控机制提供更深入的见解。
介绍
基因表达的调控是在mRNA分子从转录到蛋白质翻译的生命周期中进行的。这一过程由RNA结合蛋白(RBPs)和非编码RNA(主要是microRNAs)介导和调控,它们识别pre-mRNA和成熟转录本上的顺式调控元件,与mRNA形成核糖核蛋白(RNPs)复合物。RNPs的结构和动态决定了mRNA转录丰度的时空分布。此外,RBPs通过调控可变剪接和3’端加工来影响转录子亚型的表达。虽然RNA以前被认为只是蛋白质合成的模板,但现在很明显,RNP介导的调控事件的结合直接影响蛋白质异构体的多样性和丰度,由于RNA物种的广泛多样性和RNA与蛋白质的相互作用,RNA是生物变异的重要来源。跨学科方法包括遗传和生化结合生信分析通常用于识别RNA-RBP和RNA-RNP相互作用。实验方法主要是通过体外选择或从细胞或组织提取物中提取RNA免疫共沉淀(RIP)来确定RNA靶点。在RIP-CHIP方法中,微阵列用于识别由RBPs共沉淀的细胞RNA群体。然而,RIP-CHIP只捕获相对稳定的蛋白RNA复合物,需要应用互补的方法来检测更短暂的相互作用。尽管RIP-CHIP在蛋白质-RNA接触点的测定方面分辨率很低,但在某些情况下RBP结合位点可以通过计算得到。在过去的十年里,通过发展新的实验方法,在蛋白质-核糖核酸相互作用方面向新的生物学见解迈出了一大步,这使得研究人员能够以接近核苷酸的分辨率确定RBP结合位点,并获得全转录组的蛋白质-核糖核酸互作的高分辨率图谱。这些方法依赖于新一代测序技术(NGS),最近这一技术使数十亿个核苷酸在短时间内以可承受的价格测序成为可能。在这篇综述中,我们将重点介绍高通量测序在蛋白质- RNA相互作用研究中的新应用。
RNA分析中的高通量测序
在过去的十年里,测序技术有了巨大的进步。NGS方法的出现允许以大规模并行的方式生成数以百万计的测序。由不同平台提供的几种NGS技术,如454 (Roche)、HiSeq (Illumina)或SOLiD (Life technologies),现在可以用于转录组测序。在一次运行中,目前的技术能够产生近10亿个含有100个核苷酸的序列。RNA的NGS,也被称为RNA-seq,允许在动态范围超过微阵列技术的高分辨率下量化和描述细胞RNA的复杂性。RNA序列并不局限于已知转录物的检测,它可以应用于任何感兴趣的生物体。除了生成完整的RNA转录图谱外,还可以评估选择性剪接、差异3'-端加工和RNA编辑。此外,可以识别新的RNA,例如非编码RNA。生化纯化策略可用于在测序前富集特定RNA群体。该方法已被应用于与RBP结合的RNA,通过交联和免疫沉淀(CLIP)的方法鉴定调控蛋白RNA相互作用。近年来对CLIP进行了一些改进(HITS-CLIP, PARP-CLIP, iCLIP),主要改进了交联效果和结合位点的解析。
Cross-linking and immunoprecipitation (CLIP)
2003年,Robert Darnell的实验室开发了CLIP(交联和免疫沉淀)技术,这是研究体内蛋白RNA功能相互作用的一个重要突破。早在20世纪80年代,紫外光就被描述成活细胞中蛋白质与RNA的交联。同样,CLIP使用254nm的短波紫外线照射在RNA和蛋白质之间产生共价键,这与基于染色质免疫沉淀(CHIP)的蛋白质DNA相互作用研究中通常使用的甲醛交联形成对比。RNA和蛋白质的共价连接使得使用针对内源性RBPs或表位标签的抗体的免疫沉淀严格纯化蛋白-RNA复合物成为可能。CLIP首先用于剪接调节因子Nova1调控的RNA网络。从脑匀浆中提取的细胞悬浮液交联后,Darnell和同事免疫纯化了Nova1 -RNA复合物,用RNase处理,将交联RNA的大小减少到大约50个核苷酸(20到100个核苷酸),用SDS-PAGE对RNA进行放射标记,并对RNA蛋白复合物进行大小分级。将预期大小的交联复合物用蛋白酶K处理以去除RNA结合蛋白。将RNA回收,并将接头连接到RNA的两端。RNA进行逆转录(RT),并用接头序列作为引物对cDNA进行PCR扩增。对片段cDNA文库进行Sanger测序,得到340个与Nova1交联的序列(标签),其中18个被鉴定为外显子侧翼标签。进一步的验证证实了Nova1基因敲除小鼠七个外显子的错误剪接,并确定了一个四核苷酸序列“YCAY”为Nova1结合基序。这些发现表明,Nova1作为剪接因子,协同调节一组特定的大脑转录本编码抑制突触的多个成分。
除Nova1外,CLIP已成功用于识别不同生物系统中几种RBPs的RNA靶标。研究发现,具有多功能RNA结合活性的剪接因子SFRS1可以根据亚细胞组分调节不同的转录本。HNRNPA1被证明是miR-18a生物发生所必需的。
CLIP也被用于研究Rrm4在丝状真菌黑孢菌(Ustilago maydis)中的RNA结合,证明了CLIP应用于其他生物系统的可能性。此外,对小鼠大脑中RBP Cugbp1的CLIP研究显示,在8型脊髓小脑共济失调中有几种RNA获得功能效应。CLIP也被用来描述小鼠Msy2与piRNAs的相互作用,而Msy-RNA复合物被发现定位于染色质、细胞质RNPs和多聚体。同样使用CLIP,我们也证明了隐性帕金森蛋白DJ-1和胞质酸受体(RARα)的RNA结合活性。
总之,CLIP的一个主要优点是紫外线照射可以应用于不同的生物材料:从培养细胞到小鼠的组织匀质。蛋白质RNA交联的确切机制尚不完全清楚,但被认为是核酸碱基吸收紫外光提高电子的能态,从而形成新的共价键。
High-throughput sequencing of RNA isolated by cross-linking and immunoprecipitation (HITS-CLIP)
传统的CLIP cDNA文库Sanger测序获得的序列数量少,限制了早期基于CLIP的方法的全部潜力。高通量测序方法的出现使交联RNA分子的无偏和详尽的测序得以获得给定RBP的转录组结合模式。在第一项使用HITS-CLIP(也称为CLIP-seq)的研究中,CLIP与NGS结合鉴定了鼠神经特异性拼接因子Nova2的RNA靶标。与上面描述的Nova1相比,Nova2的表达更为广泛,但在其他方面有相似的目标。Darnell和他的同事们遵循了最初的CLIP方法来纯化Nova2-RNA复合物,并从交联RNA片段中生成cDNA。通过454/Roche焦磷酸测序平台对cDNA文库进行测序,得到约41.2万个序列标签,是Nova1 CLIP cDNA sanger测序得到序列数量的1000多倍。大约41%的Nova2片段序列可以唯一地比对到小鼠基因组,主要是mRNA编码基因。该片段标签映射到19000个序列簇,代表潜在的结合位点,在Nova2共识序列中高度富集。构建了全基因组Nova2相互作用图谱,并证实了其在选择性剪接中的作用。进一步分析表明,在3'UTRs中发现大量Nova2标记,提示Nova2在选择性poly(A)位点选择的调控中具有新的功能。
HITS-CLIP也被应用于Argonaute (Ago)/microRNA复合物,提供了microRNA- mRNA相互作用的分子观点。在小鼠大脑的CLIP实验中,发现454个独特的microRNAs与Ago交联,而mRNA测序标签则映射出829个不同的转录本。富集了与脑特异性miR-124序列互补的Ago结合位点,证实了获得的结合位点的生理相关性。在最近的一项研究中,我们使用一种Ago2特异性抗体来定义野生型和Dicer-/-小鼠胚胎干细胞中的microRNA结合位点,从而识别出不同的microRNA依赖和不依赖的Ago2结合位点。
HITS-CLIP成功应用于其他一些RBPs的研究(表1)。Xue和同事对剪接抑制因子PTB进行了HITS-CLIP。他们的分析揭示了富含CU的六聚体结合位点和PTB用来调节外显子包含或跳跃的策略。对人类剪接因子FOX2和SFRS1的HITS-CLIP研究对理解剪接调控机制有重要贡献。FOX2被证明以位置依赖的方式调控外显子增加或跳跃,而SFRS1通过调控一个功能多样的转录子子集对基因表达有广泛的影响。
HITS-CLIP也被应用于不同的模式生物。利用HITS-CLIP确定了酿酒酵母中Kdh1的RNA靶标。交联后,作者使用亲和树脂而不是抗体来纯化TAP标记的1 RNA复合物,发现Khd1调节FLO11的不对称表达,从而决定了丝状生长过程中子细胞的命运。
CLIP实验中出现的一个普遍问题是结合位点的识别。在HITS-CLIP和CLIP实验中,不能准确地确定交联的核苷酸。最近,人们观察到,交联的位置可以从突变(缺失、替换或插入)中推断出来。事实上,与参考基因组序列相比,超过三分之二的序列读取了隐藏突变,从而能够相对准确地识别交联的核苷酸和结合位点。
Cross-linking and analysis of cDNA (CRAC)
带有抗体的RBPs的免疫沉淀需要自然条件。使用不依赖蛋白质-肽相互作用的亲和树脂可以在变性条件下进行严格的洗涤步骤。这种方法被称为CRAC (Cross-linking and analysis of cDNA),由David Tollervey的实验室开发,用于研究酵母中snoRNP组分(Nop1、Nop56、Nop58和Rrp9)的RNA-蛋白互作。在用IgG琼脂糖纯化并用TEV蛋白酶首次洗脱后,TAP标记的Nop1、Nop56、Nop58和Rrp9 RNP复合物被氯化胍变性并结合到镍树脂上,随后进行广泛的洗涤和洗脱。经过温和的RNAse处理后,对恢复的RNA片段进行连接和cDNA扩增。对与snoRNP蛋白相关的RNA的分析显示了非常高的信噪比,并确定了这些蛋白在U3 RNA上的特定结合位点,为U3 snoRNP的结构提供了深入了解。
另外两项研究使用CRAC来阐明核糖体生物发生的结构特征。Tollervey和他的同事首次表明,CLIP方法可以通过识别RNA螺旋酶Prp43在前rRNA的18S和25s rRNA区域的结合位点来研究具有酶活性的RNA相互作用蛋白。在随后的一项研究中,六种核糖体组装因子(Dim2/Pno1、Enp1、Ltv1、Nob1、Rio2和Tsr1)的免疫沉淀可以通过分析与pre-18s rRNA的相互作用位点,将这些因子定位到pre-40S颗粒。CRAC也被用于鉴定核RNA监测因子的广泛靶点,即Trf4/5-Air1/2-Mtr4聚腺苷酸化(TRAMP)复合物和Nrd1-Nab3 RNA结合异质二聚体。令人惊讶的是,大量新的mRNA靶标被识别出来,这表明mRNA前体的核转运比以前认为的要活跃得多。最近的一项CRAC研究揭示了外切酶Rat1在5 '端对rRNA的作用,阐明了Rat1结合位点在前rRNA上的精确定位,并证明了其在核糖体生物发生中的重要作用。
Photoactivatable-ribonucleoside-enhanced cross-linking and immunoprecipitation (PAR-CLIP)
大多数CLIP方法依赖于254 nm照射诱导的蛋白RNA交联,这导致相对较低的交联效果,用纯化蛋白和放射性标记RNA估计在1%到5%之间。由Thomas Tuschl和他的同事开发的PAR-CLIP,通过使用光反应核苷类似物(4-硫脲,4-SU,和6-硫鸟苷,6-SG)在新陈代谢中标记细胞,克服了这个问题。这些修饰的核苷很容易被哺乳动物细胞吸收,没有任何明显的毒性,并进入新生的RNA。蛋白质与RNA的交联是通过365nm UV照射活细胞完成的。以RBP IGF2BP1为例,研究表明,365nm的交联加上RNA的4-SU或6-SG标记,比在254 nm紫外光下交联有效得多。
与原始的CLIP方案类似,在RBP RNA复合物免疫沉淀和RNAse处理后,将回收的RNA片段连接到接头上,进行逆转录,PCR扩增并在Illumina平台上测序。当序列与参考转录组比对时,进行了有趣的观察。当交联时,4-SU或6-SG经常导致cDNA序列中的T到C或G到A转换,提供了从非交联序列中筛选交联的特征。此外,代表假定结合位点的排列序列簇可以根据T到C的转变数目进行排序。
类似于HITS-CLIP,PAR-CIP已被应用于研究几个RBPS和RNPs的RNA靶标。在最初的PAR-CHIP研究中,作者鉴定了几个被深入研究的人类蛋白质的结合位点和调控序列,即PUM2、QKI、IGF2BP1-3,AGO/EIF2C1-4和TNRC6A-C。这些发现包括确定的结合位点的序列基序,观察外显子和内显子以及编码和非编码转录区域的不同偏好,这与之前对这些蛋白质的研究基本一致。最近,三篇关于人类RBP HuR/ELAVL1转录全调控相互作用的独立报道用PAR-CLIP发表。总之,这些报告显示,HuR与20000多个结合位点结合,大多数位于3'-UTR区域,但也与内含子结合。另外的发现是,HuR稳定了其靶mRNA,调节了选择性剪接,并抑制miR-7的表达。
PAR-CLIP也成功地应用于酵母,其生长在添加4-硫氧嘧啶的培养基中。研究表明,RBPs Nrd1、Nab3和RNA解旋酶Sen1与许多意想不到的非编码RNA靶标和tRNA基因转录本结合,而作者还证明,Nrd1和Nab3的结合靶标在应激条件下会发生变化。此外,PAR-CLIP被用于补充生化研究,并定义了PAPD5的结合基序,PAPD5是非典型的poly(A)聚合酶,表明PAPD5催化不同类型的RNA底物。
为了检验HITS-CLIP和PAR-CLIP之间的相似性, Kishore和他的同事对这些方法进行了定量比较。他们研究了光反应核苷的代谢标记、不同波长的交联以及使用不同的核糖核酸酶对结合位点恢复的影响。在人HuR和人AGO2的不同CLIP方法下,仅观察到结合位点的微小差异。然而,大量的核糖核酸酶孵育可导致结合位点的识别出现明显的偏差。一个有趣的发现是,由于使用了4-SU,由PAR-CLIP识别的U-rich HUR结合位点比HITS-CLIP没有更显著地富集。最近的一个独立的HUR CLIP研究表明4-SU以及6-SG PAR-CLIP衍生出高度相似的一致序列和一组结合位点。
综上所述,PAR-CLIP的主要优点包括结合核苷酸分辨率的结合位点的确定和基于诊断核苷酸转移的数目对假定的结合位点(序列簇)进行排序的能力。
Individual-nucleotide resolution UV cross-linking and immunoprecipitation (iCLIP)
CLIP技术的最新变化称为iCLIP,是由Jernej Ule实验室开发的。与PAR-CLIP方法类似,iCLIP能够以核苷酸分辨率识别交联位点。这个方法不同于其他CLIP方法。在紫外线照射后,共价连接的RNA与RBP共免疫沉淀,并在3 '端连接到接头上。蛋白酶K消化在RNA上留下一个共价结合的多肽片段,导致RT在交联位点过早截断。RT用一个寡核苷酸引物进行,该引物包含两个接头和一个barcode序列。由于在RT期间引入了可分裂的接头,循环cDNA可以重新线性化,PCR扩增和高通量测序。在测序结果中,交联位点旁边的残基很容易被识别出来,因为它被认为是在RT过程中引入barcode序列之后的第一个核苷酸。此外,barcode能够选择唯一克隆的RNA序列,因为来自同一cDNA模板的标签共享相同的barcode和相同的截断位置。
iCLIP首次用于全转录本识别HNRNPC与尿苷区结合,并揭示了HNRNPC四聚体定位对包含外显子的影响。此外,该方法还可以提供两个剪接调节因子TIA1和TIAL1的RNA接触点的高分辨率图谱。这项研究表明,这两种蛋白通过与前一个外显子的5 '剪接位点结合来调节远端3 '剪接位点,缩短了外显子包含的时间,这突出了动力学在可变剪接调控中的重要性。总之,iCLIP与HITS-CLIP和PAR-CLIP一样,在近核苷酸分辨率上识别RBP结合位点。cDNA循环与RNA连接的高效性使RBP结合位点的测定具有相对较低的起始物质含量。
展望
新一代测序技术极大地促进了RNA蛋白相互作用的研究。近年来发展的各种CLIP技术允许研究人员选择适当的方法来研究感兴趣的生物系统中的RBP。除了分析活性稳定的RNA相互作用外,还可以研究具有酶活性的RNA相互作用蛋白,这些蛋白可能只是短暂地与RNA相互作用。鉴定聚合酶、解旋酶、核酸酶和RNA修饰酶的RNA靶标已成为可能,并将扩大未来蛋白质-RNA相互作用的范围。
尽管不同的CLIP方法有相似之处(图1),但PAR-CLIP可能提供独特的优势。虽然交联前必须添加的硫核苷酸是有限制的,但PAR-CLIP可在交联核苷酸上产生诊断性突变,从而既可以确定结合位点,也可以对确定的结合位点进行定性排序。尿嘧啶-尿苷转换酶UPRT的组织特异性表达应该能够研究不同细胞类型的蛋白质-RNA相互作用。此外,修饰的硫核苷酸的加入允许对新合成的RNA进行标记,并研究RNP结构在重要过程中的动态变化,如应激反应、分化、自我更新和凋亡。值得注意的是,HITS-CLIP和iCLIP已经从大量的生物样本中进行了测试。HITS-CLIP, iCLIP和PAR-CLIP可以精确识别结合位点。iCLIP中使用的高效cDNA循环虽然在技术上困难,但也减少了对大量起始材料的需求。
为了收集和整合海量已发表的CLIP数据,建立了多个在线开放存取数据库。CLIPZ为实验确定的RBPs结合位点提供了一个数据库和分析环境,而starBASE则允许从Ago HITS-CLIP数据集推断microRNA mRNA的相互作用。doRiNA (http://dorina.mdc-berlin.de)存储并集成了RBPs和microRNAs的转录全结合位点数据,并允许组合查询搜索。
在接下来的几年里,挑战将是将高分辨率蛋白-RNA相互作用图与其他高通量数据结合起来,以阐明系统水平上细胞蛋白-RNA相互作用的功能和动态。一些新颖和创新的高通量方法允许评估RNPs对mRNA和蛋白表达的影响。NGS可用于全转录组RNA结构的探测。综上所述,与NGS相结合的CLIP方法的技术进步为以前所未有的深度探索功能蛋白RNA相互作用提供了基础,并已经提供了新的和意想不到的生物学见解。目前该领域的动态将极大地增强我们的知识,有助于更全面地理解RNPs的细胞功能,目的是阐明生长、分化和疾病的转录后调控机制。