查看原文
其他

CircCode: 识别 Ribo-seq 中可翻译的环状 RNA

jinwen circRNA 2021-02-21

欢迎个人转发到朋友圈,公众号、自媒体、网站等媒体转载请联系授权,circRNA@163.com。


circRNA 也有翻译潜能的事件被报道后,circRNA 的翻译很快就成了大家研究的热点。然而蛋白质翻译这个领域的研究一直比较硬核,更别说 circRNA 这一类分子背景还不够硬。

然而,金秋十月是收获的季节,circRNA 翻译研究又多了一把利刃 CircCode —— 还是基于机器学习的,由陕西师范大学的 Peisen SunGuanglin Li 共同开发。虽然之前也有 circRNA 翻译相关工具,比如 CircPro 或 circtools,但都是 mRNA 的“老黄历”。

实际上,这款工具的研究思路很简明,作者也为我们提供了一个非常漂亮的流程图:


1.核糖体测序 reads 质控后过滤,保留没有比对上的 reads

2.将想要研究的 circRNA 序列以 junction 为中心提取 100nt 作为虚拟的参考基因组,然后将第一步保留的 reads 比对到参考基因组上。最后将跨 junction 位点的 reads 保留作为 RMRJs(Reads Mapped Region on a Junction),实际上是作为翻译的候选 circRNA。

3.通过机器学习工具 BASiNET 确定 RMRJ 是否可翻译,确定可翻译的 circRNA。

4.最后用 FragGeneScan 预测 circRNA 的 ORF 及多肽。

除了 PPT 做得好,CircCode 也需经受实际数据的考验。

1.作者从 RPFdb 数据库下载了人类与拟南芥的核糖体数据集,并用 CIRCPedia 与 PlantcircBase 所有 circRNA 作为 CircCode 的输入,最后识别到了大量可翻译的 circRNAs(人类 3610 个,拟南芥 1569个)。

2.父基因功能富集分析表面它们参与了蛋白质加工等生物学过程。

3.为了检验精确性,软件 GenRGenS 训练了已发表的可翻译的 circRNA 序列来测试 CircCode,最后 FDR = 0.0027。

4.已发表可翻译的人类 circRNA 中,有 60% 被 CircCode 所识别。

5.与 CircPro 相比, SRR3495999 数据中 CircPro 识别了 44 个可翻译的 circRNAs,而 CircCode 却识别到了 76 个。

最后,工具是基于 Linux 系统的,源代码及使用方法发布在 github 上。


作者虽然对软件的准确性与敏感性作了分析与比较,然而由于目前可翻译 circRNA 的数据太少,只能留给时间来检验。


总的来说,circRNA 研究又有了新工具。


是否希望能在短时间内系统了解circRNA的研究状况?

是否希望能快速掌握circRNA研究的思路和技术方法?

吉赛生物专注于circRNA全程研究5年时间,

积累了丰富的经验,为帮助科研工作者更系统更深入地了解上述问题,应众多科研工作者的提议,特举办本次circRNA研究思路与技术培训班。

两天的学历将胜过半年的文献自学,机会难得,欢迎大家报名参与,共同探讨交流。



1

circRNA研究汇总 | 20191021-1027

2

往年国自然circRNA项目回顾分析

3

circRNA研究汇总 | 20191014-1020

4

circRNA的m6A修饰再发一篇Nature Communications文章

5

BioRixv | SRSF3调控circRNAs生成

6

氧感知信号通路相关circRNA研究回顾





“circRNA”微信公众平台由

『广州吉赛生物科技股份有限公司』运营,

旨在为circRNA研究同行

提供最新科研资讯和研究方法,

服务广大生命科学工作者和医学工作者。


如果您有好的文章或Idea,

千万别让它埋没,

欢迎大家分享或投稿。

小编在编辑微文时特别鸣谢,

另有惊喜送出!

投稿邮箱:circRNA@163.com


点击下方图片,长按扫描并关注,一起涨知识吧!

点击“阅读原文”

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存