Responsive image

代谢组学是系统生物学的一个重要分支,它研究的是生物体在外界因素或环境扰动的刺激下内源性代谢产物的种类、数量及其变化规律。代谢组学技术目前已广泛应用于疾病诊断、药物研发、营养食品科学、毒理学、环境学,植物学等与人类健康密切相关的研究领域。代谢组学主要针对生物样品中分子质量低于1000 Da的代谢物进行研究,利用高通量高分辨率的化学分析平台如核磁共振波谱(Nuclear Magnetic Resonance, NMR)、液相色谱/气相色谱与质谱联用(Liquid Chromatography/Gas Chromatography - Mass Spectrometry, LC/GC-MS)等对样品中的代谢物分子进行定性定量地检测与分析,从而获得生物体代谢表型在不同生理病理条件下的变化规律及其相关的代谢过程,以此解释蕴藏在代谢现象背后的生物学机制。

因此,如何从化学分析平台中采集得到的原始代谢表型数据中识别特征代谢物,并将其富集到代谢通路中,获取不同状态下受扰动的代谢通路,是解读机体代谢机制的关键步骤。与其他组学数据相比,代谢表型数据分析面临以下挑战:

1. 数据维度高,且样本量通常小于特征数量。

2. 表型数据是多种生理因素如性别、年龄、饮食和生物学因素如病理、药物干预以及系统噪声共同作用而成,信息解缠绕难度大。

3. 代谢组学分析流程中的预处理(去噪、谱峰对齐、峰识别、归一化)、特征代谢物识别(单变量和多变量分析)、代谢通路富集等步骤通常需要联合使用多个分析软件,并且要求研究人员根据数据特性及结果手动调整每一步骤的参数设置,对结果的稳定性和可读性带来不利的影响。

    Metabolic Phenotype View(简称MetaPheView)是一款灵活的可视化的代谢通路富集分析软件,目前第一版本(version 1.0)主要针对NMRLC/GC-MS平台采集的生物样品代谢表型数据。考虑到代谢组学分析的多学科交叉特性,MetaPheView将代谢通路富集分析中使用的方法进行模块化封装,将不同步骤所涉及的分析方法进行整合,形成一个规范化的处理流程,便于研究者根据实际需要选择适当的处理方法,同时也为初学者提供良好的学习平台。MetaPheView软件操作方便快捷、简单易学。该软件界面友好(如图1.1所示),功能齐全,能满足常规的代谢组学研究的需要。

1.1 MetaPheView软件的文件上传界面




    软件主要由代谢数据的读取与存储、差异代谢物分析、数据可视化等几个功能模块组成。其中差异代谢物分析模块,包括无监督的主成分分析(Principal component analysis, PCA)、有监督的偏最小二乘判别分析(partial least squares-discriminant analysis, PLS-DA)、单变量分析(univariate analysis)、功效分析(power analysis)等,各模块的具体功能如下图1.2所示。


1.2 MetaPheView 软件的主要功能模块


    此外,我们在软件中引入了斯坦纳树的通路富集策略。与常规的基于超几何检验的通路富集方法不同,斯坦纳树的通路富集方法是在给定差异代谢物集合中寻找最小生成网络,使得所有输入代谢物在网络中连通。

    进入寻找代谢物通路模块下的Steiner Tree -based pathway enrichment分析方法,结果如图1.3所示:



1.3 KEGG M01100代谢通路图





关闭