查看原文
其他

深度长文(下)|2016年环状RNA研究进展盘点

2017-01-01 句月山人 circRNA

      HAPPY      

2017

  NEW YEAR  

声  明

欢迎个人转发到朋友圈,公众号、自媒体、网站等媒体转载请联系授权,circRNA@163.com。


 环状RNA研究工具和技术方法进展


4.1 环状RNA数据库进展
        2016年发表了多个环状RNA相关的数据库,包括前述的武汉大学基础医学院何春江教授组织特异性环状RNA研究工作形成的数据库TSCD (Tissue-Specific CircRNA Database: http://gb.whu.edu.cn/TSCD) ,南京医科大学Li Yan团队开发的首个汇总可编码蛋白的环状RNA的数据库circRNADb(数据库网址:http://reprod.njmu.edu.cn/circrnadb),杨力课题组开发的环状RNA注释数据库CIRCpedia(网址:http://www.picb.ac.cn/rnomics/circpedia/)等。值得一提的是,这些数据库都是国内科学家构建的,这也说明我国在环状RNA研究领域的国际地位。

TSCD数据库:
        主要利用ENCODE和NCBI GEO数据库的在线资源进行了组织特异性分布的分析。作者共从ENCODE数据库收集了16种成年人组织(共计60个样本)和10个人类胎儿组织(共计28个样本)。从NCBI GEO 数据库的数据集GSE64283收集了5种人类胎儿组织(11个样本),从数据集GSE61991收集了9种小鼠组织(15个样本),数据集GSE74747中收集了9个样本。这些样本除了来源于GSE74747的之外的都是经过去除核糖体RNA处理的,GSE74747来源的数据没有去除核糖体RNA,因此作者用SortMeRNA工具将其中的rRNA数据过滤掉之后与其他样本合并进行分析。


circRNADb数据库:
        共收集了32914条人类外显子环状RNA记录,每条记录都包括基因组位置信息,RNA编辑情况,所对应的基因组序列,IRES序列元件,预测的ORF以及相关的参考文献。作者发现了有16328条环状RNA包含了编码超过100个氨基酸的ORF,其中7170种环状RNA存在IRES序列元件,基本符合翻译蛋白的特征。


CIRCpedia数据库:

        中科院上海生科院计算生物学研究所杨力研究组利用建立的高效环形RNA分析流程CIRCexplorer2,对多种(目前主要是人和小鼠)组织和细胞系样品中的环形RNA进行计算生物学预测分析,并进一步构建了CIRCpedia数据库,对环形RNA分子中的可变反向剪接(可变环化)和可变剪接进行归类,以便相关研究人员使用。


其他环状RNA研究技术进展:
        9月4日,著名生物学预印本杂志Peer J Preprints在线发表了德国心血管研究中心Christoph Dieterich教授及马普学会的合作者共同署名的文章,介绍一种改进的从全转录组分析环状RNA的新技术体系:FUCHS (Franziska Metge et al. 2016)。


4.2 环状RNA信息学分析技术回顾分析
        10月14日,Nature Reviews Genetics杂志在线发表了斯坦福大学斯坦福癌症研究中心的Julia Salzman教授为通讯作者的综述文章,汇总分析了环状RNA研究方法的现状和主要问题(Szabo and Salzman, 2016)。文中详细分析了从RNA样品制备到后期数据分析过程中可能存在的影响环状RNA分析准确性的因素,系统分析了目前常用的五种校准策略的优缺点,包括RNase R消化、去除Poly(A)-(+)RNA、Decoy Reads、反转录特异性和模拟数据。


        作者认为基于分离Poly(A)-(+)RNA进行环状RNA假阳性甄别的实验更可取,原因有两个:1. 从已知的实验结果来看,进行Poly(A)-(+)RNA的过程所得到的Poly(A)-(+)RNA中只有极少量的环状RNA,但RNase R消化却可以导致一些已经被证实的环状RNA被降解,比如CDR1as。2. 在分离后的Poly(A)-(+)RNA中分析得到的丰度较高的“环状RNA”很多被证实是由基因重复序列导致的数据分析假阳性结果。因此,综合而言,分离Poly(A)-(+)RNA和Poly(A)-(-)RNA进行环状RNA假阳性甄别是比RNase R消化更有效的方法。

4.3 环状RNA研究技术Protocols和方法学论文汇总
环状RNA分析手册:
        2016年初陈玲玲与杨力教授曾在Springer出版集团新出的一本实验方法书《Long Non-Coding RNAs Methods and Protocols》中撰文介绍环状RNA的研究方法(Zhang et al., 2016c)。该Protocols详细介绍了环状RNA样品制备和测序分析的主要流程。总体而言,要进行全转录组中环状RNA的分析,需要分三步走:1. RNA样品收集;2. RNA样品预处理;3. 测序及验证分析。


RIP实验技术:
        2016年9月23日,意大利”ABT”- CNR遗传与生物物理研究所的Maria R. Matarazzo教授为通讯作者,在Methods in Molecular Biology杂志发表了RIP实验的操作方法(Gagliardi and Matarazzo, 2016)。本文为一篇Protocols。


RNA结合蛋白研究技术进展回顾

        11月期的Wiley Interdiscip Rev RNA发表了西班牙巴塞罗那科技研究所的基因组调控研究中心的Gian G. Tartaglia教授与同事撰写的综述文章,系统汇总了RNA结合蛋白研究技术的主要进展(Marchese et al., 2016)。文中作者分别从以蛋白为核心的研究技术,以RNA为核心的研究技术,未来仍面临的技术挑战,信息分析技术和未来挑战以及RNA结合蛋白复合物(RBP)组装研究技术与挑战等方面分别讨论了RNA结合蛋白的研究技术进展。


利用RT-PCR检测衰老相关的环状RNA

        11月4日,NIH国家衰老研究所的Myriam Gorospe教授在Methods in Molecular Biology杂志发表了一篇环状RNA研究技术的文章,介绍利用RT-PCR方法检测衰老相关环状RNA的技术方法(Panda et al., 2017)。


4.4 环状RNA研究新技术
全新的基于tRNA改造的环状RNA表达载体技术:
        在3月25日的酶学方法中,A. Gregory Matera教授发表了一种基于tRNA改造的环状RNA表达载体技术(Schmidt et al., 2016)。在本文中,A. Gregory Matera教授为我们展示了一种新型的环状RNA表达载体。与经典的基于反向互补元件诱导环化拼接的环状RNA表达载体有很大区别。山人以为,两者各有优势:(1)传统的环状RNA表达载体基于反向互补的RNA序列(如Alu元件),基于内源性RNA拼接和环化相关的酶系实现环状RNA的表达,可以实现精确的序列表达,但表达效率不是非常稳定。(2)利用tricRNAs环化拼接体系过表达环状RNA载体利用了RNA聚合酶III的转录体系,表达效率优于RNA聚合酶II(mRNA的转录酶),因此理论上这种表达载体的过表达效率更高。但从全文的介绍来看,这个载体还不能自动去除BHB序列,因此最终的表达产物会额外带着BHB序列,有可能会影响环状RNA的功能。


基于密度梯度离心法分析RNA-蛋白相互作用:
        8月11日,国际知名杂志Scientific Reports 发表了环状RNA功能的重要文章,通讯作者为德国吉尔大学的Albrecht Bindereif教授。本文基于甘油密度梯度离心法分析鉴定到与蛋白相互作用的环状RNA(Schneider et al., 2016)。本文的技术方法和结论对于环状RNA的研究有重要借鉴意义。



环状RNA其他方面的进展


5.1 环状RNA来源的假基因
        5月29日Cell Research杂志以Letter形式发表了杨力教授的一项重要研究成果,介绍他们发现了在基因组中存在一些从环状RNA反转录后整合形成的假基因。他们首先想到稳定的环状RNA分子有没有可能被反转录并整合进入基因组中(独特的思考问题角度)。于是他们设计了一个分析环状RNA来源的假基因分析流程,称之为CIRCpseudo。一开始,作者分析了小鼠基因组中与circRFWD2对应的环化位点(外显子6—外显子2),在小鼠的全基因组中找到了33个“高可信度的circRFWD2来源假基因”,由于环状RNA反转产生的cDNA未必全包含环化位点,基因组整合过程也未必恰巧将环化位点整合进去,因此有些环状RNA来源的假基因可能并不包含环化位点,于是作者又分析了包含外显子2至6中间的外显子区的假基因,符合这样的条件的有9个,称为“低可信度的circRFWD2来源假基因”,同时作者也找到了6个包含circRFWD2之外的外显子区序列的假基因。LINE-1介导的RNA反转录通常需要有Poly (A)的存在,在所有42个circRFWD2相关的假基因中39个不存在Poly (A)序列,说明他们可能是以未知的方式反转录为cDNA并整合至基因组的。除了circRFWD2之外,还有别的环状RNA来源假基因的情况,比如circSATB1来源的假基因存在所有已知的小鼠品系基因组中,而circDIAP3来源的假基因却只在部分品系中存在。在灵长类中,人类基因组中找到的circPRKDC和circCAMSAP1来源的假基因在大猩猩和黑猩猩中存在,但恒河猴中不存在。有趣的是在小鼠MEL和G1E细胞系中发现了在一个circSATB1来源的假基因区存在CTCF结合位点,而对应的SATB1基因外显子区没有,在人类基因组中也没有发现类似的情况(Dong et al., 2016b)。本文从全新的角度分析了环状RNA的功能,非常有趣。这也提醒我们在进行环状RNA研究的时候要当心来自环状RNA形成的假基因对实验结果的干扰。


5.2环状RNA多样性随进化程度增加而增高
        12月16日,RNA Biology杂志在线发表了陈玲玲教授和杨力教授共同通讯作者的研究论文,介绍基于生物信息学的分析发现环状RNA的种类多样性会伴随着物种进化程度而增多,绝大部分的环状RNA的形成过程均由短散在核重复序列(SINE)驱动,该研究也暗示SINE元件的在进化中的重要性(Dong et al., 2016a)。本文借助互补指数(CSI)进行定量化分析反向互补元件的互补配对能力,分析了与环状RNA形成有关的SINE的进化特征,发现伴随着进化进程,SINE的数目明显增多,互补配对的能力也逐渐提高,与此对应的是环状RNA的种类和表达量均有提高。暗示了反向互补的SINE元件可能是驱动环状RNA形成的决定性因素,这为进一步认识环状RNA的进化机制提供了重要的参考。 


 环状RNA研究未来需要解决的重要科学问题归纳


        随着环状RNA研究的不断深入,需要面临的科学问题也在不断细化。结合已报道的环状RNA研究进展和其他类型RNA研究技术和思路,山人总结了以下几个方面的重要科学问题:

6.1 环状RNA形成机制:
        环状RNA形成过程的动力学变化过程是怎样的?环状RNA形成过程与所对应的线性RNA在转录过程中是怎样的关系? 同一基因不同的环状RNA产物之间的关系是怎样的?环状RNA形成过程如何精确调控的?

6.2 环状RNA的功能:
        数量庞大,序列高度多样性且存在组织和疾病特异性是环状RNA的重要特征,因此环状RNA的功能研究不可能仅仅用一两个模型就可以概括完成。环状RNA分子细胞生物学功能及由此决定的生理和病理功能的研究是未来环状RNA研究的焦点。特定环状RNA相互作用分子的鉴定是关键。

6.3 环状RNA研究值得思考的方向:
        种类数目庞大,序列高度多样性,丰度相对较低是环状RNA的重要特征,环状RNA功能研究更像是一个“个性化”的研究方向,不同的环状RNA分子思路可能会大相径庭。因此其他类型RNA分子的研究思路就非常值得引入。山人大概总结了以下几个值得考虑的方向:(1)环状RNA的拓扑结构问题,目前除了计算模拟,暂没有更好的RNA结构分析技术,但环状RNA的二级和高级结构有没有特殊性,成环后带来的拓扑张力如何影响环状RNA的结构?这些都是非常有意义的研究思路。(2)环状RNA是否存在修饰?类似m6A等修饰在线性RNA中研究的相对比较深入,也报道发现了很多非常重要的现象和机制,这些研究思路很值得引入环状RNA的研究。(3)环状RNA可否直接与基因组相互作用?lncRNA可以直接与基因组相互作用,环状RNA是否也可以呢?(4)环状RNA在细胞中定位的选择性机制,包括进入外泌体的选择性机制。(5)环状RNA降解的动力学机制。这些仅仅是山人根据自己的所知所想简单汇总的,各位读者如果另有高见欢迎相互交流。

参考文献:点击“阅读原文”获取



近期热文


1

circRNA | 恭贺新年快乐!

2

【第七集】视频·第二届环状RNA研究论坛精彩回顾

3

【第六集】视频·第二届环状RNA研究论坛精彩回顾

4

环状RNA种类多样性伴随进化增高

5

【第五集】视频·第二届环状RNA研究论坛精彩回顾

6

【第四集】视频·第二届环状RNA研究论坛精彩回顾


circRNA

最新研究进展  分享科研干货


环状RNA交流群

分享研究技巧  经验交流平台

点击“阅读原文”


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存