查看原文
其他

微生物公开课问题集锦 | 微生物专题

市场部-PW 联川生物 2022-05-21

3月3、4日,我们进行了微生物线上培训课程,错过的老师扫描下图中的二维码即可回看

医学16S测序文章必备内容和图表

中药与肠道菌群的研究思路


需要PPT的老师后台回复“微生物公开课”即可


1. 不同批次测序的数据可以合并吗?有没有什么关卡?

回复:这个需要具体情况具体分析:如果不同批次测序数据的测序区域、扩增引物、扩增参数、测序仪器和测序模式都是一致的,那么可以合并起来做分析;否则,由于前述实验参数的不一致,会给不同批次测序数据的合并分析带来干扰和系统误差。如果确实需要进行合并,我们推荐使用QIIME 2流程进行数据合并分析,采用DADA2过滤去噪,可以修正扩增子的测序错误,确定更多的真实变异,数据分析效果会优于传统的OTU聚类方法。


2. 预测菌群功能的那个软件叫什么?

回复:我们使用的是最新版本的PICRUSt 2软件进行预测的。PICRUSt将菌群与功能建立了“映射”,从推出至今已近6年,引用2500余次,是菌群功能预测的不二之选。相比V1版本,具有以下两大优势:1.任何OTU/ASV直接预测功能;2.数据库扩大10倍,包括来自以下数据集的基因家族: COG, EC, KO, PFAM, TIGRFAM等数据库功能注释结果,可以用官方推荐的STAMP差异分析或者LEfSe进行后续分析。STAMP以及LEfSe均是差异分析的利器,是微生物多样性结果中重要展示的分析方法。


3. ROC曲线怎么做?

回复:受试者特征(Receiver-Operating Characteristic,ROC)曲线分析是一种常用的统计学分析方法,在医学研究中主要用于评价诊断试验的效能。它是一种biomaker鉴定的经典展示形式,通过计算各个试验的ROC曲线下的面积(Area Under The Curve,AUC),对不同试验条件的诊断价值进行比较,AUC值>0.5才有诊断意义,越趋近于1,则诊断价值越佳。


4. 纵向不同时间处理组的能不能做LEFse分析?

回复:可以的。在 LEfSe分析中,我们会与老师确认比较组信息,不同的比较组设置,会获得的结果(生物标记物)也是不一样的,因此老师可以在此分析中找到不同时间处理组中显著变化的微生物。


5. LDA图,怎么做?

回复:LDA是线性判别的一个标准,它所对应的分析是LEfSe差异分析,它使用的秩和检验,做该分析的目的是找到不同组间在丰度上有显著性差异的物种,即候选的biomarker。具体步骤如下:

Step1:利用Kruskal-Wallis 秩和检验检测所有的特征物种,通过检测不同组间的物种丰度差异,获得显著性差异物种。

Step2:利用Wilcoxon秩和检验检测上步获得的显著性差异物种的所有亚种是否都趋同于同一分类级别。

Step3:使用线性判别分析(LDA),得到最终的差异物种(即biomarker)。

目前有两种做法,一是通过整理数据上传至公共网站http://huttenhower.sph.harvard.edu/galaxy/进行分析,二是使用linux操作系统进行。前者我们有相应的教程,如有需求,请发邮件至support@lc-bio.com。后者您可以参考相关教程进行。在联川进行的微生物组项目,均可免费获得LEfSe的分析结果。


6. LDA值怎么设定?

回复:我们默认的参数设置为 LDA score>3.0,p value <0.05,主流杂志都接受的参数设定。您也可以根据自己的结果进行调整,LDA值的阈值一般选择2到4。相对而言,LDA值越大说明条件越严苛,结果越可信。


7. 两种分组Alpha多样性组间没有显著性的统计学差异(p<0.05),代表的意义是什么?

回复:Alpha多样性反映的是样本内的微生物群落的丰富度和均匀度,如果两组Alpha多样性评价指标中有部分指标是有显著性差异的,也可以说明两组间的物种数目和均一性上存在差异,可以在文章中进行描述。如果两组Alpha多样性各个评价指标都没有显著性差异,代表两组样本的丰富度和均匀度没有显著差异。这时可以再结合Beta多样性的分析结果,进一步来确认两组样本在菌群组成上是否存在差异。


8. 16S和代谢组怎么关联到一起啊?

回复:目前我们的相关性分析是基于两组学中差异显著的微生物(属水平)和正负离子下差异显著的二级代谢物进行相关性分析,默认模型使用Pearson,展现形式如热图和网路图。

菌群与代谢物相关性热图分析

菌群与代谢物相关性网络分析


9. 老师,能讲一下物种堆叠图,左边的进化怎么看吗?

回复:见下图,左边的进化分析是基于Bray-Curtis距离算法,根据每个样本的菌群组成的相似性进行的进化分析,层层聚类。

10. 两间公司得到的测序序列长度不一样,能合并分析吗?

回复:请见问题1的回复,具体可以联系我们进行数据评估,support@lc-bio.com。


11. 环境因子怎么分析?

回复:关于环境指标,有以下两种分析(1)RDA分析:RDA分析是约束化的主成分分析(PCA),它的优点就是考虑了环境因子(如土壤研究中的pH值,酸碱度,疾病研究中临床理化因子等)对样本的影响,可同时反映样本,环境因子和物种三者或两两之间的关系。(2)相关性分析:你需要提供要与微生物数据做相关性分析的指标,我们会和你确认需要进行相关性分析的微生物数据,一般建议使用属水平的高丰度微生物或差异比较属水平的微生物进行分析,默认采用Pearson模型(可以根据要求,更换相关性分析模型及参数),展现形式如热图、网络图。


12. 关联性分析时样本数必须保持一致吗?

回复:是的。一一对应有两层意义:一是只有一一对应,两者才有关联分析的生物学意义,尤其是当生物学重复并不是特别好的情况下。二是在相关性分析中,算法要求,两组学样本一一对应。


13. 微生物数据怎么和临床指标一起分析?

回复:首先,你需要提供要与微生物数据做相关性分析的临床指标,比如BMI,空腹血糖等等,我们会和你确认需要进行相关性分析的微生物数据,一般我们建议使用属水平的高丰度微生物或差异比较属水平的微生物进行分析,默认采用Pearson模型(可以根据要求,更换相关性分析模型及参数),展现形式如热图、网络图。


14. 现在在你们公司做着的样品,已经基于feature了吗?

回复:是的。我们使用的分析流程使用了QIIME 2,相对于QIIME,最大的改变是通过DADA2(Divisive Amplicon Denoising Algorithm)的“去重复”(Dereplication,相当于以100%相似度聚类)等步骤,获得单碱基精度的代表序列,大大提升了数据精确度与物种分辨率。DADA2的核心是去噪,然后使用ASVs (Amplicon Sequence Variants)的概念建表,获得最终的feature特征表以及特征序列,再进一步进行多样性分析、物种分类注释和差异分析等。


15. 以前用OTU分析了,还可以利用原来的数据进行Feature分析吗?

回复:由于QIIME2流程中降噪过程会过滤掉很多序列,因此只要原来的数据量足够(最低数据量要求:有效数据 >3万Tags),是可以使用原始数据进行重分析的。

16. 16S可以和靶向还是非靶向代谢组学的数据进行关联?还是都可以?

回复:16S数据既可以和靶向代谢组数据,也可以和非靶向代谢组数据进行关联分析。


17. 在你们这边,数据还需要自己拿回来处理吗,还是数据都已经是图表形式?

回复:如果是正常的扩增子测序分析项目,我们提供的数据结果包括了完整的数据分析及生成的图表。这些图表你可以用于撰写文章。查看报告内容医学16S测序报告:为忙碌的医生而准备


18. 强烈希望老师讲一下, 宏基因组还有联合代谢组。

回复:请关注我们在千聊和Blibli上的讲座信息,后续会安排这个内容的分享。谢谢!

相关阅读
联川群体遗传高手公开课问答锦集 | 群体遗传
关于m6A-IP-qPCR和RIP-qPCR公开课问题集锦
m6A-IP-qPCR和RIP-qPCR公开课PPT放送
联川m6A公开课超长版问答合集2 | m6A专题
千人同时在线,联川m6A公开课超长版问答合集1| m6A专题
联川线上单细胞培训课程答疑合集 | 单细胞专题

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存