iHMP 第四弹 | 精准健康的纵向大数据方法
36
文献速递
精准健康依赖于个体水平的疾病风险评估,发现早期临床前症状及启动预防策略。组学和可穿戴监测等最新技术使深入分析分子和生理过程成为可能,并为精准健康提供重要工具。
为了探索纵向组学数据评估健康及发现相关分子机制的能力,该研究入组了 109 名研究对象,其中大多数为 2 型糖尿病高风险人群。每季度收集样本,使用临床手段和新兴技术(包括基因组、免疫组、转录组、蛋白质组、代谢组、微生物组和可穿戴监测)进行综合个性化组学分析,时间最长为 8 年。
结果发现超过 67 个临床检测结果与健康相关,包括代谢、心血管、肿瘤、血液学和传染病等病理生理学相关的多种分子途径,并基于组学结果开发了胰岛素抵抗的预测模型,该模型具有取代繁重测试的潜力。
Keywords: Precision health, longitudinal
Title: A longitudinal big data approach for precision health
DOI: 10.1038/s41591-019-0414-6
Journal: Nature Medicine [IF 32.621]
First Authors: Sophia Miryam Schüssler-Fiorenza Rose,Kévin Contrepois
Correspondence: Francois Haddad,Michael P Snyder
Affiliation: Department of Genetics, Stanford University School of Medicine, Stanford, CA, USA.
Published: 2019-05-08
研究背景
背景
新技术发展开启了精准医疗时代;
长期的纵轴多组学研究也为新的临床疾病分型提供了分子基础;
对于慢性疾病研究,虽有横断面研究但缺少纵轴研究,测量个人组学数据也有限。
目的
传统医学、新组学、新技术结合是否能更早地发现疾病;
多组学和临床病理学关联,为疾病机理提供新见解;
如何干预健康习惯。
研究对象入组情况
追踪检测项目
组学:基因组、免疫组、转录组、蛋白质组、代谢组、微生物组和可穿戴监测。
FPG:空腹血糖,反映稳态葡萄糖代谢;
HbA1C:糖化血红蛋白,反映3个月平均血糖;
OGTT:口服葡萄糖耐量试验,反映对葡萄糖负荷响应,用胰岛素分泌评估(β细胞功能);
SSPG:改良胰岛素抑制试验测量稳态血浆葡萄糖,测量外周胰岛素抵抗。
研究思路
如此庞大的组学数据必然能挖掘出很多新的科学见解,鉴于文章篇幅,本文将简要描述文章结果,如需深入探究科学结论,可以点击‘阅读原文’查看。
研究结果
作者先从三个数据特征告诉我们,DM 疾病的发生发展并非单一模式,至少文中给出了 6 种模式。紧接着,作者从多组学数据的角度提出了新见解。
DM 难以用单一指标指示
参与者通过阅读研究结果的体检报告能更加准确地自判疾病状态,但是有些参与者还是需要实验室人员解读才能正确判定疾病状态(图1a)。指示 DM 状态的常用的 3 个临床指标是 FPG、HbA1C、OGTT,但是很少个体出现三个指标数据都达到患病水平(图1b),但是 FPG-HbA1C 和 FPG-OGTT 组合判别分别能达到 65.2% 和 52.6% 的一致性(图2 a,b)。这表明了 DM 状态会因为评估方法而变化。
图1 a, Transitions in DM status (n = 109). First column, self-reported DM status. Second column, DM status determined by self-report; medical records and study entry diabetes-related laboratory measures: FPG, HbA1C and OGTT. b, Overlap of diabetic-range laboratory results by participants over the course of the study.
图2 a, Overlap of FPG and hemoglobin A1C (HbA1C) categories when simultaneously measured. b, Overlap of FPG and 2-hour OGTT when simultaneously measured.
个体的胰岛素情况没有统一模式
作者在 OGTT 测量的基础上,参与者被分为三组:正常血糖,空腹血糖受损(IFG)和糖耐量减低(IGT),OGTT 和 SSPG 结果显示,胰岛素水平,胰岛素抵抗和组间处置指数之间存在较大的个体差异。IGT 参与者在 OGTT 测试后 120 分钟具有更高的胰岛素水平,更高的 SSPG (更多的胰岛素抗性)和更低的处置指数(图3 c)。在 OGTT 实验期间的胰岛素分泌速率(ISR)的纵向模式的聚类分析证明了胰岛素分泌大体可以分为四组:早期,中期,晚期和非常晚期(图2d)。每个簇在 OGTT 状态,处置指数,胰岛素抵抗状态和最大胰岛素水平方面是异质的,说明了没有一致的分子富集模式,表明葡萄糖失调的高度异质性(图3 d)。
图3 c, Violin plots showing insulin levels during OGTT at 0, 30 and 120 min, SSPG (n = 43 participants) and glucose disposition index (n = 89 samples from 61 participants) by glycemic status determined by OGTT including normoglycemic, impaired fasting glucose only (IFG only: FPG ≥ 1.0 mg ml−1), and impaired glucose tolerance (IGT: OGTT ≥ 1.4 mg ml−1).
d, Heat map showing ISRs that were row standardized and clustered using k-means clustering (n = 89 samples from 61 participants).
脂质和免疫在 DM 中的重要性
多组学数据与处置指数关联分析,发现了 109个分子与处置指数相关。正如前人研究报道一样, HbA1C 和FPG 与处置指数呈负相关,FPG 和 HbA1C 与 β 细胞功能障碍有关。
作者发现瘦素和 GM-CSF与处置指数也呈负相关,瘦素和 GM-CSF 是能量稳态和炎症信号传导的已知调节因子。同时,GM-CSF 和瘦素 BMI 和 hsCRP 呈正相关,说明了瘦素 和GM-CSF 联系着炎症和肥胖。
与处置指数相关的分子的网络分析发现,瘦素和 GM-CSF 与各种脂类相关,包括与雄激素类固醇的负相关,与鞘脂和鞘氨醇,游离脂肪酸和甘油磷脂呈正相关,体现了它们在脂质代谢中的重要性(图4e)。
图4 e, Correlation network of multi-omics measures associated with the glucose disposition index (n = 89 samples from 61 participants; Benjamini–Hochberg false discover rate (FDR) < 0.1).
作者已经解释了 DM 的复杂性,接下来,作者将用多组学为 DM 的机制解释提出新见解。
纵向研究和机制见解
从个体纵向 HbA1C 轨迹图谱基础上,参与者大体被分为六类(图5c)。
图5 c, Longitudinal patterns of changes in Hemoglobin A1C (HbA1C) over time.
对新发糖尿病患者(n = 9)的个体轨迹图谱的仔细评估揭示了更多的见解。个体轨迹分析显示参与者可以通过多种途径病发糖尿病。一些参与者(n = 2)初诊异常是 OGTT(图6 a);一些参与者(n = 3)初诊异常是 FPG(图6 b);还有一些参与者(n = 4)多个指标异常的(图6 c)。
图6 a–c, Longitudinal diabetic measures demonstrating different patterns of DM onset and progression with initial abnormality response to glucose load (OGTT) (a), initial abnormality in fasting glucose metabolism (FPG) (b) and initial improvement followed by progression (c). Diabetic-range metrics are indicated in red.
DM 与肠道微生物组多样性
DM 的进展与体重增加和肠道微生物组多样性(Shannon)减少相关,体现在拟杆菌门的比例增加,多样性减少,有益细菌如 faecalibacterium 减少。此外,多样性与 SSPG 成反比,SSPG 解释了 28%的 Shannon 差异。
葡萄糖代谢和炎症的多维度
使用线性混合模型检查了葡萄糖(FPG,HbA1C)和炎症(hsCRP)水平与健康时间点(健康基线模型)的多组学测量之间的基本关系以及所有时间点(动态模型)的相对变化。
如所预期的,健康基线分析证明 HbA1C 和 FPG 彼此强相关并且和“葡萄糖稳态”途径也强相关(图7d,e)。虽然这两项指标有许多共同关联,特别是代谢产物,包括脂类(游离脂肪酸和总甘油三酯水平(TGL))和氨基酸,如前已有的文献报道,许多分析物仅与 FPG 或 HbA1C 相关,突出了强调两种指标能捕获差异的基础生物学。HbA1C 与不饱和脂肪酸和甘油磷脂代谢相关,而 FPG与氨基酸和胆汁酸代谢相关。
图7 d, Clinical markers and immune proteins associated with HbA1C, FPG and hsCRP using healthy-baseline and dynamic models. e, Integrative pathway analysis using IMPaLa67 of proteins and metabolites associated with HbA1C (n = 94, samples = 836), FPG (n = 94, samples = 843) and hsCRP (n = 92, samples 777) as determined by the dynamic models (Benjamini–Hochberg FDR < 0.2 at molecule level).
多组学预测 SSPG 和 OGTT
由于传统临床诊断成本高,耗时;作者尝试用多组学数据预测 SSPG 和 OGTT。结果显示与临床实验室结果相比,多组学测量的预测性能高。
同时,SSPG 和 OGTT 预测因子之间几乎没有重叠,支持这些临床指标反映不同的基础生物学的观点。
图8 f, Molecules selected in SSPG and OGTT prediction models and associated coefficients.
到此,作者已经用临床数据和多组学说明了 DM 的复杂性,提出新的 DM 疾病发生发展模式,解释了多组学对 DM 疾病机制新解释。同时,在项目进行过程中,有 5 名参与者发生了心血管疾病不良事件,加上动脉粥样硬化性心血管疾病(ASCVD)是与胰岛素抵抗和 DM 相关的死亡率和发病率的主要原因。所以,接下来,作者阐述了该队列人群中心血管健康概况。
在该队列中,发现 24 名患者(22.6%) ASCVD 风险评分 ≥ 7.5(图9 a);参与者自评总胆固醇和血压测量结果,发现参与者会低估自我的血脂异常,而且在研究期间,18 名参与者发现患有 II 期高血压(图9 b)。
图9 a, Distribution of ASCVD risk scores and adjusted ASCVD risk scores (n = 108). b, Self-reported cholesterol status versus measured total cholesterol profiles at study entry and over the course of the study (n = 108).
高级临床检查有助于临床发现
可穿戴心率监测确定两名患者伴有夜间室上性心动过速,发现一名患者发生阻塞性睡眠呼吸暂停,另一名患者继发睡眠呼吸暂停的心房颤动。同时,心血管影像学数据研究发现了两个主要的健康发现:一个心脏发现与 RPM20 基因的致病突变相关,一个非心脏发现,预测氧气消耗百分比提示三名参与者的与运动能力降低(图10.a)。此外,六名参与者中出现了动脉粥样硬化前期症状,以至于建议增加他汀类药物剂量(图10.b)。
图10 Multidimensional cardiac risk assessment. a, Distribution of ASCVD risk scores (n = 35 participants, 36 measurements) and cardiovascular imaging and physiology measures that have been established as cardiovascular risk markers. b, Ultrasound of carotid plaque (6 participants out of 35 had an ultrasound finding of carotid plaque) and relative distribution of ASCVD risk score, HbA1C and LV GLS in function of presence or absence of carotid plaque (Student’s t-test (two-sided) was used to evaluate differences between groups; n = 35, 36 measurements).
心血管事件、药物基因组学和转录组学发现
研究期间,5 名参与者发生了心血管事件。所有患者在事件发生前都有较高的 hsCRP 水平。这 5 名患者中有 2 名患者与中风和卒中相关基因的 14 个RNA 数值异常。同时,发现 2 名患者有药物位点突变,先前报道过,药物位点突变会增加不良事件发生的风险。
ASCVD风险的多组学分析
与校正的 ASCVD 风险评分相关的多组学数据的 Spearman 网络互作分析结果显示:与 ASCVD 风险评分密切相关有:免疫蛋白(MIG、IP10、白细胞介素(IL)-2,血管内皮生长因子α和HGF);和相关文献常见报道的:补体、游离脂肪酸、γ-谷氨酰-ε-赖氨酸、次黄嘌呤,甲基黄嘌呤、和胆汁酸。
图11 c, Multi-omics correlation network of molecules associated with adjusted ASCVD risk score (n = 77 participants) using Spearman correlation and multiple testing correction of q value < 0.2
通过研究期间多组学数据的追踪,警示了 8 名参与者肿瘤风险增加;最后 3 名参与者分别确诊为甲状腺癌、B 细胞淋巴瘤和冒烟型骨髓瘤。深入分析他们的组学数据发现:
① 患病时 MIG 显着增加,治疗后数值恢复正常水平;表明 MIG 可用作疾病的纵向标志物;MIG 在组织其他细胞因子(即ENA78,IL17A和VCAM1)中的核心作用;
② 肠道微生物多样性在确诊时降到最低,治疗后多样性恢复。
血液检查发现 30 名参与者的血红蛋白或血细胞比容在贫血范围内,其中 28 名未知是贫血患者,一名参与者转诊后发现有 α 地中海贫血特征。
可穿戴监测 hsCRP 监测到一名参与者温度和心率异常,最后确诊为莱姆病。
可见通过各种不同的方法揭示了与血液学,免疫和感染系统相关的重要健康信息。
图12 Oncologic discoveries.
4iPOP 研究对参与者的影响iPOP研究的意义
(1)鼓励适当的基于风险的筛查,包括遗传咨询,
(2)促进临床有意义的诊断,
(3)潜在地告知治疗选择(机制或药物基因组信息)
(4)提高认识,导致饮食和身体活动的改变
结果发现超过 67 个临床检测结果与健康相关,包括代谢、心血管、肿瘤、血液学和传染病等病理生理学相关的多种分子途径。
参与者的参后调查问卷报告显示,近半数认为研究结果会促使他们改变自己的生活习惯,以改善生活质量;大多数参与者与家人(71%)和医生(68%)讨论了研究结果,并促使进一步医学监测,以及早发现疾病(29%)
图13 Summary of major clinically actionable health discoveries and participant health behavior change.
结论与讨论
将非靶向多组学和生理纵向剖析与针对代谢和心血管风险的有针对性的分析相结合,可以在我们之前的工作中建立可行的健康发现和有意义的生理学见解;
该研究发现基于目前分类的治疗方法并不适合机制亚型,并提出了 5 种成人发病 DM 亚型;多组学数据有助于提供疾病的分子分类的价值;
将来,可以根据个体疾病风险和纵向标记轨迹设计个性化测试计划,并评估这些方法对个人和医疗保健系统的成本价值。
本研究的参与者都是经历高等教育的,虽然会影响他们对研究报告的解读的偏向,但是不影响科研数据的准确性。
M菌 · 笔记
为精准健康项目提供新思考
多组学和纵向研究设计和数据处理提供参考
参考文献
Rose S M S F, Contrepois K, Moneghetti K J, et al. A longitudinal big data approach for precision health[J]. Nature medicine, 2019, 25(5): 792.
推荐阅读
撰稿 | 三明治 责编 | NSC
本文系菌探Momics(ID:Momics)原创,欢迎个人转发分享。其他任何媒体、网站如需转载,须在正文前注明来源菌探Momics。
END
菌探Momics
微信号:Momics
探索 · 分享 · 合作
点击“阅读原文”,阅读英文原文