我们得到的差异基因的FDR都是错的?
很多RNA-seq上的好软件都被发表在NATURE METHODS上,今天小编为大家带来的是今年六月份发表在该刊上的一个R包软件sleuth,github地址是http://pachterlab.github.io/sleuth,文章名:Differential analysis of RNA-seq incorporating quantifcation uncertainty; Nature Methods, VOL.14 NO.7, JULY 2017。
sleuth是一个专注于基因和转录本差异计算的软件,和其配套的定量软件是kallisto,两者搭配比其他软件如voom和DESeq2等有着更加精确地结果。
首先作者解释了下误差的两个来源,一个是和reads组装、差异计算有关Inferential Variance,另一个是样本间自身的差异Biological Variance(下图a图)。作者挑选了两个siRNA用不同的软件去计算其样本间的差异性,结果发现DESeq2和voom的结果显示这些基因是差异显著的,但是用sleuth得到的结果显示其并没有显著差异(下图b图)。相比于Biological Variance的影响,Inferential Variance部分对结果的影响要大得多(下图c图)。
图d和图e分别是基因水平和转录本水平的FDR和sensitivity关系图,在d图基因水平上,sleuth黑线相比其他工具更好一点的结果,即假设FDR为0.05时sleuth能找到的差异基因更多。在e图中sleuth的表现远胜于其他软件组合,说明在转录本分析上sleuth有着巨大的优势。
sleuth不但能提高差异计算的敏感性,作者还发现很多软件都低估了自己计算的到的FDR,甚至有些软件计算出的FDR为0.01的基因其实际FDR可能达到了0.1。
图f和g分别是转录本和基因水平的报道FDR和真是FDR的差距,我们可以看到f图中,sleuth和voom比较接近真是的FDR,而cuffdiff2、DESeq2、DESeq 、EBseq和edgeR的真是FDR远高于标称的FDR。
在图g基因水平上sleuth和voom依旧有着最好的表现,其他五个个软件的表现要比转录本上好一些,但是也远高出了其各自标称的FDR。
作者也针对kallisto等不同软件作为差异计算的输入数据做了研究,综合起来作者最终的结论是:
1.sleuth无论在基因水平还是转录水平上的差异计算都是最好的;
2.sleuth的到的FDR值是准确并且可靠的;
3.基于kallisto作为输入数据的sleuth是一个快速、准确和通用的RNA-seq分析工具。