查看原文
其他

文献分享丨LC-MS检测到的上万个特征峰包含了多少有用的信息?

2017-12-20 2046 代谢组学分享平台

  • 当我们用液相色谱-质谱联用进行非目标代谢组学分析时,通常在一个生物样本中可以发现上万个峰。由于对这些数据的认识不是很深入,使得解释这些数据变得很复杂,并且一个代谢物往往对应多个质谱峰多个质谱峰对应一个代谢物,也使我们很难去判断在一次试验中究竟检测到了多少个代谢物

  • 本文中,作者以大肠杆菌为例,探究了在一次检测所得到的上万个特征峰中,究竟来源于多少个代谢物。也就是,通过对这些特征峰之间关系的分析,来看一下所检测到的唯一代谢物的数量

  • 作者首先对检测到的特征峰进行分组,将属于同一个代谢物的不同特征峰(如[M+H]+, [M+Na]+, [M+K]+等)作者称之为“degenerate features”进行归类,发现在实验中检测到的大约25000个化合物只对应大约2961个代谢物。

  • 接着,作者又利用一种正交手段(13C-based credentialing technology)进一步去除非生物学的特征峰,将检测到的代谢物数量减少至小于1000。最终,作者将原始特征峰的数量减少了90%,这个减少数量的百分比是之前研究的5倍左右。


  • 这篇文章告诉我们,在追求更多的检测特征峰的同时,我们也应该考虑得到的数据是否真的对我们的应用研究有帮助,得到的数据中有多少是有用的信息

  • 同时作者对这些冗杂的离子进行分类并定义,为我们之后的研究提供了一些参考。


  • 文中,作者将干扰离子分为三类,contaminants(污染),artifacts(失真),degeneracies(简并),并对这三种离子作了定义。


01

Contaminant refers to a detected signal that does not originate from the biological sample being measured (e.g., solvent impurities and plastic leechables).  不属于生物样本的信号。

02

Artifacts refer to features detected due to informatic error. As an example, artifacts can be caused by baseline fluctuations and poorly resolved components. 由于检测过程中的不稳定或者其他外来因素,如基线的波动等,产生的离子。

03

Degeneracy refers to multiple signals arising from a single analyte. There are many causes of degeneracy including: fragmentation, analyte adduction with various charge carriers (e.g., a proton, sodium, potassium, etc.), and the detection of naturally occurring isotopes (e.g., 13C, 15N, etc.). 属于同一代谢物的不同离子,来源很多包括碎片离子,加合离子等。


  • 以上这些离子,在我们进行代谢组学分析时,常用的软件(沃特世公司的MassLynx,安捷伦公司的MassHunter,热电的Sieve等)可以对其中的一些离子做出筛选,比如加合离子简单的碎片离子等,要想做到全面的筛选,可能还需要人工进行仔细查看。

  • 期待功能更加强大的仪器和软件的出现,在可以使我们检测到更多特征峰的同时,也可以帮助我们排除干扰峰。


扫一扫关注我们,
更多咨询早知道!




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存