我们得到的差异基因的FDR都是错的？

2017-11-28 老牛生信草堂 Freescience联盟

很多RNA-seq上的好软件都被发表在NATURE METHODS上，今天小编为大家带来的是今年六月份发表在该刊上的一个R包软件sleuth，github地址是http://pachterlab.github.io/sleuth，文章名：Differential analysis of RNA-seq incorporating quantifcation uncertainty; Nature Methods, VOL.14 NO.7, JULY 2017。

sleuth是一个专注于基因和转录本差异计算的软件，和其配套的定量软件是kallisto，两者搭配比其他软件如voom和DESeq2等有着更加精确地结果。

首先作者解释了下误差的两个来源，一个是和reads组装、差异计算有关Inferential Variance，另一个是样本间自身的差异Biological Variance（下图a图）。作者挑选了两个siRNA用不同的软件去计算其样本间的差异性，结果发现DESeq2和voom的结果显示这些基因是差异显著的，但是用sleuth得到的结果显示其并没有显著差异（下图b图）。相比于Biological Variance的影响，Inferential Variance部分对结果的影响要大得多（下图c图）。

图d和图e分别是基因水平和转录本水平的FDR和sensitivity关系图，在d图基因水平上，sleuth黑线相比其他工具更好一点的结果，即假设FDR为0.05时sleuth能找到的差异基因更多。在e图中sleuth的表现远胜于其他软件组合，说明在转录本分析上sleuth有着巨大的优势。

sleuth不但能提高差异计算的敏感性，作者还发现很多软件都低估了自己计算的到的FDR，甚至有些软件计算出的FDR为0.01的基因其实际FDR可能达到了0.1。

图f和g分别是转录本和基因水平的报道FDR和真是FDR的差距，我们可以看到f图中，sleuth和voom比较接近真是的FDR，而cuffdiff2、DESeq2、DESeq 、EBseq和edgeR的真是FDR远高于标称的FDR。

在图g基因水平上sleuth和voom依旧有着最好的表现，其他五个个软件的表现要比转录本上好一些，但是也远高出了其各自标称的FDR。

作者也针对kallisto等不同软件作为差异计算的输入数据做了研究，综合起来作者最终的结论是：

1.sleuth无论在基因水平还是转录水平上的差异计算都是最好的；

2.sleuth的到的FDR值是准确并且可靠的；

3.基于kallisto作为输入数据的sleuth是一个快速、准确和通用的RNA-seq分析工具。

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

比佟丽娅还恋爱脑，怀孕7次流产4次，目睹丈夫背叛却选择原谅

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…