查看原文
其他

凌波微课|生物学重复,值得你拥有!

线条姐 凌波微课 2023-06-15

生物学重复第一讲

 

 

不看视频看文字版  

 

今天的分享要从线条姐的一段往事说起,来给大家讲一讲高通量的组学研究中,你为什么需要生物学重复!

     

故事是这样的:

2015年,我第一次认识了我的客户G老师,当我建议他开展生物学重复的实验设置时,他的反馈是:我们推荐他做生物学重复,无非就是为了从他的“口袋里”多掏些钱出来……作为技术支持的我,简直扎心。。。通过详尽的介绍,G老师在半信半疑中还是接受了我的建议,在实验设置中加入了生物学重复的设计,后来,文章顺利发表,我的客户G老师终于明白了当时项目设计建议的良苦用心,也因此,G老师从我们的一位普通用户最终变成了我们的好友。


那么,什么是生物学重复呢? 

     

看这里:

一般的实验设计中,都会包括实验组和对照组,组内的个体都会经过相同的处理方式。如这里,对照组有三只小鼠,实验组也有三只小鼠。对照组的三只小鼠即为一组生物学重复,实验组的三只小鼠,经过相同的实验处理,也是一组生物学重复。在这样的一组简单实验设计中,就有两组生物学重复存在。



那么我们为什么要设置生物学重复呢 
这里就要提及高通量研究中常会关注的一些问题:诸如,无论是研究微生态的群落和功能,还是进行转录表达调控的研究中,如何让样本量和数据量的设计能够承载较高水平的检测灵敏度和精确度,就涉及两方面的问题:1.是低丰度的物种或基因能否被检出;2是定量的结果是否准确。此外,样本量的设置也关系到科研的成本和结果产出的质量,如何用更少的小钱钱做出高水平的研究来,这里也涉及两方面问题:1.是样本量的设置对结果的影响;2.是如何实现样本重复量与数据量的最优组合,以实现高性价比的要求。这些都需要借助生物学重复来实现和提升。


这里就谈一下生物学重复存在的意义

通过相同背景和处理的生物学重复,可以实现消除组内的误差,提高检验的灵敏度,还可以通过比较生物学重复来测量样本间的差异程度,以此来挖掘在组内具有普遍规律性的结论。我们常说生物学重复越多,越具有统计学意义,这是因为检测的样本越多,越能够降低背景差异,提升结果的可靠性,同时也越容易总结出普适的规律性结论。

在我们的研究中,由于处理的实验个体间可能存在的遗传背景差异或操作处理偏差等都可能造成有一些异常样本的存在,这些样本产出的异常数据会给实验结果带来偏离。那么通过生物学重复的设置,我们可以通过后续的生物信息分析,发现和排除异常样本,得到具有普适性规律的结论。

 

下面就通过两个案例,来分享一下生物学重复设置的优势和必要性

首先是转录组研究的案例:通过生物学重复的设置,比较了转录组测序中的假阳性率FPR和真阳性率TPR.从表一(下图)中不难看出,在单样本测序量不变的前提下,伴随着生物学重复数的增加,研究的真阳性率得到了显著的提升。

实验对差异表达基因的检测变得更加灵敏,那些表达量较低的基因,或者差异倍数较小的差异表达基因也更容易被检出。

当然了,数据量的变化也会对结果造成一定的影响,因此,研究也分析了在不同的单样本测序量条件下,下面两张表格展现了不同生物学重复数的设置对检测真假阳性率的影响:这里以n=4为例,此处不难看出即便数据量由25%提升到100%,真假阳性率的变化也都非常有限。但在同一测序数据量下,将生物学重复由2个提升到12个,这里以,TPR得到的显著的提升——这说明生物学重复可以显著提高检测结果的准确性。

即便保持整个项目测序的总数据量不变,既全项目的总数据量为1,那么n个生物学重复的话,单样本测序数据量为1/n。从研究的曲线图可以看出,增加生物学重复可能对FPR的影响不那么显著,但在TPR中,伴随着生物学重复数的提高,TPR率也在不断提高:即便2个样本时,单样本数据量达50%,TPR比率也仅有3%左右,但当有8个生物学重复时,单样本的数据量虽然降到了12.5%,但TPR比例显著提升到20%以上。

再看一个全基因组甲基化研究的案例,同样的也是利用差异甲基化区域DMR检测的假阳性率FPR和真阳性率TPR评估生物学重复对检测结果的影响。不难看出伴随测序深度的提高,差异甲基化区域的检出效果也在提升,我们留意到在同一个测序深度下,增加生物学重复的个数TPR显著提高(a图),FPR也有相应的下降(b图)。在测序深度达到30%以上时,生物学重复的增加也能显著提高DMR检测的灵敏度(c图)。


看到这里,你是不是也感受到了生物学设置的好处多多呢?

     生物学重复,绝对值得你拥有~~~~

玩儿转科研,就来凌波微课,我们下期见!


参考文献

1. Efficient experimental design and analysis strategies for the detection of differential expressioon using RNA-sequencing. BMC Genomics, 2012.

2. Coverage recommendations for methylation analysis by whole genome bisulfits sequencing. Nature Methods, 2015.


PS:公众号后台回复“生物学重复”,即可获得视频讲义哦~ 


凌波微课,创意于2020年不平凡的春天,由高通量测序及组学研究领域从业近十年的技术团队精心打造。

凌波微课的讲师们,实战经验丰富,旨在通过在线微课程及线下交流,帮助科研学生及科研工作者们由简入繁,掌握科研思路及生信分析的实际操作。凌波微课,用心服务科研用户,打造专业培训品牌,助力科研提升。


关注我

发现更多精彩

关注凌波微课公众号,回复“入群”,即可加入凌波微课课下交流群,更多干货等你呦!


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存