查看原文
其他

无偿公开 | 提速831倍!miRNA靶基因预测利器qTar

王佳 华大科技BGITech 2019-06-02

MicroRNA

自从MicroRNA(miRNA)被发现以来,一直备受关注,热度不减。研究miRNA的功能机制,构建ceRNA网络,自然离不开预测其调控的靶基因。但大家在选择软件工具时都会有些困扰:


预测软件多,选择困难;

预测环节耗时,影响数据挖掘效率;

预测后结果多,筛选繁琐,且不确保精准。


那么是否有一款较好的工具可以同时解决这些问题呢?


答案是肯定的,华大科技自主开发了一款名为qTar的软件,集运行快、结果准、适用广等特点于一身,可帮助广大喜爱研究small RNA的科研伙伴们解决各种难题。下面,科技君就带大家来详细了解一下qTar。


软件大揭秘


qTar通过对靶基因序列集构建特定长度的种子库,实现快速定位miRNA可能的靶基因;再基于Smith-Waterman比对,计算miRNA与靶基因之间的比对得分和相应的结合能量值,筛选出潜在的靶基因。


qTar基于种子库的检索模式,极大地提升了靶基因预测的运行速度。

常用动物靶基因预测软件:qTar比RNAhybrid[1]提升831倍,比miRanda[2]提升78倍;

常用植物靶基因预测软件:qTar比TargetFinder[3]提升10倍,比psRobot[4]提升7倍。


图1  miRNA靶基因预测软件速度比较


广

qTar通过调整不同的种子长度、比对得分、结合能阈值,可以适用多物种,满足动物、植物以及细菌、真菌等微生物的靶基因预测。为一些不明确采用何种靶基因预测软件的物种,提供了新的可行性预测方法。


qTar的内存消耗只依赖于target序列的大小,target序列集越大,对应的存储消耗越多。但对于绝大部分物种,其内存峰值在2G以内。


动物(人)

基于CLASH数据[5],分别用qTar、miRanda[2]、TargetScan[6]、RNAhybrid[1]进行人的miRNA靶基因预测。


评价标准1:以CLASH中提供的miRNA靶基因关系对为标准(已发表文章验证)[5],统计每个软件的准确性。RNAhybrid的准确靶基因对检出率最高为62%,但其真阳性率仅为0.1%。而qTar的准确靶基因对检出率为51%,真阳性率高达0.75%。


表1 不同软件预测人miRNA靶基因准确性比较(评价标准1)


评价标准2:更严格些,以miRNA预测的靶基因位置与CLASH中提供的靶基因上的靶位置有重叠关系才认定为准确,则miRanda和TargetScan的准确靶基因对检出率约为1%,而qTar和RNAhybrid在20%左右。qTar的真阳性率依然最高。


表2 不同软件预测人miRNA靶基因准确性比较(评价标准2)


综上,qTar的准确靶基因对检出率较高,产生假阳性数据较少,是较为均衡的一款靶基因预测软件。


植物(拟南芥)

用miRBase 21中拟南芥的全部成熟体序列[7],TAIR数据库中的mRNA序列,分别用qTar、psRobot[4]、TargetFinder[3]进行靶基因预测。以psRNATarget[8]的预测结果为准,比较不同软件,结果psRobot的准确靶基因对检出率最高,qTar为86%。


表3 不同软件预测拟南芥miRNA靶基因准确性比较


整体来看,qTar在动物预测软件中表现突出,在植物预测软件中与其他结果相当。


干货分享

这样一款快、准、适用广的软件,我们已免费公开发布到GitHub(https://github.com/zhuqianhua/qTar.git),复制网址至浏览器(或点击文末阅读原文)打开直接下载安装即可。并且,还贴心地给出靶基因预测的建议参数,动物:-n 16 -a 7 -f -13 -N 4 -P 3;植物:-a 28 -f -14 -l 5 -N 5 -n 16。

 

除qTar外,华大研发团队还发布了各种好用的生物信息软件,包括基础数据分析工具、群体遗传学分析工具等,可支持动植物、微生物及人类疾病等领域的个体及群体多组学研究。有需要的小伙伴快快用起来吧。


序号软件名称软件描述服务入口
1RePS(repeat-maskedPhrapwithscaffolding)从鸟枪数据明确列出具体kmer重复序列,并在组装前删除它们的WGS序列组装方法。所建立的软件Phrap用于为每个base计算有意义的错误概率。克隆端配对信息用于构建scaffolds的秩序和重叠。更新版的RePS结合了一些用Phusion介绍聚类的想法。

ftp://ftp.genomics.org.cn/

pub/ricedb/Tools/

RePS/RePS-IBM-AIX.tar.gz
2WEGO(WebGeneOntology Annotation Plot)用于图形显示GOTree注释的Web工具,尤其是在比较基因组分析中。http://wego.genomics.org.cn/cgi-bin/wego/index.pl
3HIBAIS基于HapMap信息的血统推断分析软件。http://soap.genomics.org.cn/
4Solar处理比对结果的软件,尤其适用于含有intron的比对。http://cloud.genomics.cn/
5‍Kaks_Calculator用于计算非同义替换率和统一替换率的软件程序包,它采用模型选择和模型平均策略,同时也集成了现有的其他几个用于计算Ka和Ks的算法。‍‍http://evolution.genomics.org.cn/software.htm‍
6FGF(FishingGene Family)用于在特定基因组里查询蛋白质家族并构建该家族分子进化树的软件系统,可以用来分析基因结构、拷贝数和进化关系等。http://fgf.genomics.org.cn/


参考文献:

[1] Rehmsmeier,Marc and Krueger, Jan RNAhybrid: microRNA target prediction easy, fast and flexible,Nucleic Acids Res.

[2] John B,Enright AJ, Aravin A, Tuschl T, Sander C, Marks DS., PLoS Biol. 2005 Jul;3(7)

[3] Fahlgren N,Carrington JC (2010) miRNA Target Prediction in Plants. Methods in molecularbiology (Clifton, NJ) 592

[4] Wu HJ, Ma YK,Chen T, Wang M, Wang XJ. (2012) PsRobot: a web-based plant small RNAmeta-analysis toolbox. Nucleic Acids Res. DOI:10.1093/nar/gks554

[5] Helwak A,Kudla G, Dudnakova T, Tollervey D. Mapping the Human miRNA Interactome by CLASHReveals Frequent Noncanonical Binding. Cell. 2013;153:654–65. pmid:23622248

[6] Agarwal V,Bell GW, Nam J, Bartel DP. Predicting effective microRNA target sites inmammalian mRNAs. eLife, 4:e05005

[7] miRBase:annotating high confidence microRNAs using deep sequencing data.

Kozomara A,Griffiths-Jones S. NAR 2014 42:D68-D73

[8] Xinbin Dai, Zhaohong Zhuang and Patrick X.Zhao (2018). psRNATarget: a plant small RNA target analysis server (2017release). Nucleic Acids Research. doi: 10.1093/nar/gky316.


撰稿:王   佳

编辑:市场部


【近期热文】

施季森教授团队联合华大基因全球首次破译鹅掌楸基因组 | 《Nature》子刊

经典案例 | 我的研究适合“混合测序”吗?

混合样本测序,这些“坑”记得跳过!

突破!跨物种心脏移植,离人类仅一步之遥? | CNS一周论文推荐(2018.12.13)




请继续关注“华大科技BGITech”公众号,

科技君将一如既往地为您提供精彩内容!

如有相关问题,欢迎后台留言~~

关注华大科技,尽享精彩科研!

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存