代谢组入门一问一答(二)
●非靶向代谢组研究需要采用高分辨率质谱,这样才可以检测到尽可能多的代谢物,因此一般采用飞行时间质谱仪(TOF)和静电场轨道阱质谱(Orbitrap),或者是这两者与其它质量分析器的联用模式:例如四级杆飞行时间串联质谱仪(QTOF)。
●靶向代谢组是针对关注的目标代谢物进行靶向定量检测,目前选择多反应离子检测(MRM)扫描模式的三重四级杆质谱(QqQ)是进行靶向代谢组准确定量研究的首选。●QC样本是为了保证检测体系的稳定性和重复性而设置的,一般是在所有待检测样本提取后,取等体积的所有样本然后混合而成,然后和待检测样本一起进行检测,检测时每间隔一定数量的样本设置一个QC样本。
●可以通过以下方法考察检测体系的稳定性:
a)因为QC样本都是相同的,如果将所有QC样本的总离子流色谱图(TIC)进行重叠,如果所有QC样本的TIC能完全重叠,说明检测体系的稳定性良好,生成的数据结果可信。
b)因为QC样本都是相同的,体现在PCA分析图中,如果所有QC样本能紧密聚集在一起,说明检测体系的稳定性良好,生成的数据结果可信。
c)在数据预处理后,如果QC样本中有超过70%的潜在特征峰(化合物)的相对标准偏差(Relative standard deviation,RSD)不超过30%,就说明检测体系的稳定性良好,生成的数据结果可信。
●PCA(Principal Components Analysis),即主成分分析,也称主成分回归分析法,是一种非监督(即计算的时候没有分组信息)的数据降维(减少数据集的维数,例如三维变为二维)分析方法,非监督方法是用来探索完全未知数据的方法,对原始数据依据样本特性进行分类,把相似性的数据进行归类,因而相对于监督性的模型分析方法如PLS-DA分析来说,PCA可以更真实地反映组间的差异。
●PLS-DA ( Partial Least Square-Discriminant Analysis ), 即偏最小二乘判别分析法,是一种监督(即计算的时候有分组信息)的多元统计分析方法,它在降维的同时结合了代谢物变化和实验分组之间的回归模型,并利用一定的判别阈值对回归结果进行判别分析。相对于PCA,PLS-DA分析可以进一步显示组间的差异。
●OPLS-DA(Orthogonal Partial Least Squares Discrimination Analysis),即正交偏最小二乘判别分析,是PLS-DA的延伸, OPLS-DA会把与实验条件无关的变化过滤,因此OPLS-DA比PLS-DA更能体现与实验条件有关的样品差异,因此OPLS-DA比PCA和PLS-DA能使组间样本分离效果更佳,一般PLS-DA可以用于两组及以上组别的比较,而OPLS-DA通常用于两组的比较。此外,在筛选差异代谢物方面,OPLS-DA 比PLS-DA更准确,一般使用OPLS-DA生成的VIP值去筛选差异代谢物。
●虽然相对于PCA,PLS-DA分析可以更大限度显示组间的差异,但是有监督的分类模型缺点是可能会出现过拟合(是指为了得到一致假设而使假设变得过度严格),因此需要验证PLS-DA模型的可靠性,一般使用置换检验(Permutation test)检验PLS-DA模型是否存在过拟合,如果过拟合则说明该PLS-DA模型不准确,那么基于PLS-DA模型得到VIP值不适合用于后期的差异代谢物筛选,而判断PLS-DA模型是否过拟合的标准是:如果Q2的回归线在纵坐标上的截距小于0则说明不存在过拟合,PLS-DA模型比较可靠。
PLS-DA模型的置换检验图
END
更多的代谢组入门知识整理请见下期!
相关链接:
Microbiome:肠道菌群ClpB基因功能与减肥和特征性微生物群有关;
Nature Microbiology:N-酰基乙醇胺可以使健康肠道菌群转化成类似IBD患者肠道菌群;
mSystems:自闭症儿童肠道谷氨酸代谢的变化与肠道微生物组成变化相关;
创新基因科技,成就科学梦想