查看原文
其他

Heredity︱周基元/冯荣锦团队合作提出X染色体数量性状位点上稳健的关联分析方法

袁愈新 等 岚翰生命科学 2023-03-10

撰文︱袁愈新,冯荣锦,周基元

责编︱王思珍,方以一

编辑︱方以一

全基因组关联研究(genome-wide association study)是评估人类复杂疾病或性状遗传贡献的最有效工具之一。然而,之前只有少数关联分析方法关注X染色体[1]。人类X染色体由1669个已知基因组成(占人类基因总数的约5%),并影响约7%的人类复杂疾病或性状。与常染色体不同,X染色体具有独特的生物学特征。例如,X染色体的数量在两性之间不同,女性有两条X染色体,而男性只有一条X染色体。此外,女性的基因表达受X染色体失活(X chromosome inactivation,XCI)机制的影响。在XCI下,女性两条X染色体中的一条在胚胎发育早期就被沉默(不表达),以确保X染色体的转录剂量在女性和男性之间达到平衡[2]。一般来说,XCI有三种模式[3],即X染色体随机失活(XCI-R)、X染色体偏倚失活(XCI-S)[4] 和X染色体逃逸失活(XCI-E)[5]。XCI-R是指女性个体中约50%的体细胞会随机失活来自父亲的X染色体等位基因,而另外约50%的体细胞会失活来自母亲的X染色体等位基因。XCI-E是指来自父亲的X染色体等位基因和来自母亲的X染色体等位基因都不发生失活的现象,即同时表达两个等位基因。在人类中,女性X染色体上15−30%的位点会发生逃逸失活。若女性个体中有超过75%的体细胞失活同一条X染色体上的同一等位基因,则称在该位点上发生了XCI-S。XCI是一个非常复杂的过程,至今仍未被完全解释清楚[6]。此外,现有的X染色体数量性状(即计量资料)位点上的关联分析方法要么未能纳入男性数据进行分析,要么仅检验数量性状的均数差异或仅检验数量性状的方差差异。因此,有必要提出X染色体数量性状位点上稳健且检验效能高的关联分析方法来充分利用这些特征,并能同时检验数量性状的均数差异与方差差异。


2022年9月10日,南方医科大学公共卫生学院生物统计学系周基元教授课题组与香港大学统计及精算学系冯荣锦教授课题组合作在Heredity上发表了题为“Robust association tests for quantitative traits on the X chromosome”的研究。该研究提出四种X染色体数量性状位点上稳健且检验效能高的关联分析方法,这四种方法均有效地合并了X染色体失活的信息。



作者提出四种X染色体数量性状位点上稳健且检验效能高的关联分析方法,分别记为QXcat、QZmax、QMVXcat和QMVZmax(图1)在这些方法中,QXcat和QZmax 检验的是数量性状的均数差异,而QMVXcat和QMVZmax(同时检验数量性状的均数差异和方差差异。此外,作者选择两种不同的方式来合并XCI信息。对于QMVXcat和QXcat,作者引入了两个针对女性的示性函数,以检验所有XCI模式下的关联性,然后直接合并基于女性数据检验统计量的p值和基于男性数据检验统计量的p值。对于QMVZmax和QZmax,作者通过不同权重来合并基于女性数据的检验统计量和基于男性数据的检验统计量,以考虑不同的剂量补偿(dosage compensation,DC)机制,然后通过最大化这些合并的检验统计量来获得最终的检验统计量。


图1 四种新提出的X染色体数量性状位点上稳健的关联分析方法比较

(图源:Yang ZY, et al.Heredity, 2022)


作者进行了广泛的计算机模拟研究来评估新提出方法和现有方法(Tchenw、Tplinkw、wM3VNA、wM3V和Fisher)的第I类错误率和检验效能。模拟结果表明,作者新提出的方法可以很好地控制第I类错误率。在数量性状值的均数受所研究的单核苷酸多态性位点(single nucleotide polymorphism, SNP)影响的模拟场景下(图2-4),当失活模式为XCI-E或XCI的某些情况下,新提出的两种基于均数的检验统计量QXcat和QZmax比现有的基于均数的检验统计量(Tchenw和Tplinkw)的检验效能更高(图2)。在数量性状值的均数和方差均受到该SNP影响的模拟场景下(图3和图4),新提出的两种基于均数与方差的检验统计量QMVXcatQMVZmax如预期一样优于其他方法


图2 SNP仅影响数量性状值均数且失活模式为XCI-E的情况下,两种基于均数和方差的检验统计量(QMVXcat和QMVZmax)和四种基于均数的检验统计量(QXcat、QZmax、Tchenw、Tplinkw)的检验效能比较。

(图源:Yang ZY, et al.Heredity, 2022)


图3 SNP对数量性状值均数和方差都有影响且失活模式为XCI的情况下,两种基于均数和方差的检验统计量(QMVXcat和QMVZmax)、四种基于均数的检验统计量(QXca、QZmax、Tchenw、Tplinkw)以及三种基于方差的检验统计量(wM3VNA、wM3V和Fisher)的检验效能比较。

(图源:Yang ZY, et al.Heredity, 2022)


图4 SNP对数量性状值均数和方差都有影响且失活模式为XCI-E的情况下,两种基于均数和方差的检验统计量(QMVXcat和QMVZmax)、四种基于均数的检验统计量(QXcat、QZmax、Tchenw、Tplinkw)以及三种基于方差的检验统计量(wM3VNA、wM3V和Fisher)的检验效能比较。

(图源:Yang ZY, et al.Heredity, 2022)


作者还将新提出的方法应用于美国明尼苏达双胞胎和家庭研究中心 (Minnesota Center for Twin and Family Research, https://www.ncbi.nlm.nih.gov/projects/gap/cgi-bin/study.cgi?study_id=phs000620.v1.p1)‍ 的数据,并在显著性水平1x10-3 下找到10个至少与两个数量性状相关联的SNP位点(检验水平的选取依据见[7])。其中,rs808144位点同时跟行为抑制解除综合评分、酒精依赖综合评分、违禁药物综合评分和尼古丁综合评分相关联。然而,该位点仅影响4个数量性状值的均数,并不影响它们的方差。另外,目前尚未有文献对该位点的功能进行注释。


文章结论与讨论,启发与展望

综上所述,该研究提出了四种X染色体数量性状位点上稳健的关联分析方法。在这些方法中,QXcat和QZmax检验的是数量性状的均数差异,而QMVXcat和QMVZmax同时检验数量性状的均数差异和方差差异。总而言之,作者新提出的方法不仅有效地利用了X染色体失活的信息,而且在XCI-E和XCI的某些情况下比现有方法检验效能更高。未来的研究工作将会关注将上述方法推广至适用于家系结构数据,从而校正亲缘关系和群体分层的影响。

原文链接:https://www.nature.com/articles/s41437-022-00560-y

R言软件包链接:https://github.com/yuxinyuanqt/QMVtest


南方医科大学公共卫生学院生物统计学系硕士研究生杨梓滢、博士研究生刘薇与硕士研究生袁愈新为该工作的共同第一作者,南方医科大学公共卫生学院生物统计学系周基元教授与香港大学统计及精算学系冯荣锦教授为该工作的共同通讯作者。该工作获得了国家自然科学基金(82173619和81773544)、广东省科技计划项目(2020B1212030008)、香港研究资助局优配研究金(Hong Kong RGC GRF,17302919)、国家大学生创新创业训练计划项目(201912121019)的资助。


共同第一作者:杨梓滢(第一排左一)、袁愈新(第二排右二),共同通讯作者:周基元(第一排中间)

(照片提供自:周基元团队)


共同通讯作者:周基元(左)、冯荣锦(右)

(照片提供自:周基元/冯荣锦团队)


通讯作者简介(上下滑动阅读)

周基元教授,南方医科大学生物统计学系教授、博士生导师、博士后合作导师。主要从事统计遗传学、大数据分析、生物统计学/卫生统计学方面的研究。在国内外学术期刊上发表研究论文50余篇。主持国家自然科学基金项目4项,主持广东省科技计划项目1项,主持南方医科大学高层次人才引进启动基金1项。担任中华预防医学会生物统计分会委员、中国卫生信息学会统计理论与方法专业委员会委员、广东省生物统计学会常务理事、International Biometric Society会员、“器官衰竭防治”国家重点实验室PI。担任SCI源期刊《BMC Genomics》(2021年影响因子4.547)的编委。

冯荣锦教授,香港大学统计及精算学系的讲座教授、博士生导师、中国杰出青年自然科学基金获得者、国际统计计算协会主席、国际著名期刊CSDA主编、美国科学促进会院士、美国统计学会院士、国际数理统计学会院士、国际统计学会院士。冯教授以其在统计DNA鉴定方面的研究而闻名,在法医统计、亲子鉴定和计算机软件开发方面做出了重大贡献。他还在纵向数据分析和统计遗传学方面拥有广泛的研究兴趣和贡献。发表SCI 学术论文200 余篇;主持香港研究资助局优配研究金9项;多次参加国际、国内学术会议,多次受邀做大会主旨报告。


往期文章精选

【1】Nat Methods︱陈曦/靳文菲团队开发单细胞多模态组学技术ISSAAC-seq

【2】Sci Adv︱刘延盛团队发现哺乳动物中蛋白质组的跨物种共进化与多样性

【3】Curr Biol︱汪雪峰团队揭秘细胞丝状伪足贴附力为非连续节点状

【4】Cell Biosci︱邓新团队揭示多种病原菌三型分泌系统蛋白翻译延伸速率的统一规律

【5】PNAS︱王明伟/Vogt/杨德华/水雯箐团队深度解析重要药物靶标磷脂酰肌醇3激酶α的结构与功能

【6】Cell Rep Med︱石虎兵团队发现三阴性乳腺癌MEK靶向治疗的耐药机制

【7】Cell Reports︱叶升/严汉池/张小康/陈立功合作团队“单羧酸协同转运机制”研究取得突破性进展

【8】GUT︱纪泛扑/杨毅辉/Mindie H. Nguyen团队合作报道COVID-19大流行对肝硬化相关潜在寿命损失年的影响

【9】Small Methods︱来自鲨鱼的纳米抗体可有效中和多个新冠变异株

【10】NAR|王海龙团队发现组蛋白H2AK119位点赖氨酸巴豆酰化到泛素化的动态转换减弱复制压力诱导的转录-复制冲突

优质科研培训课程推荐【1】R语言临床预测生物医学统计专题培训(10月15-16日,北京·中科院遗传与发育生物学研究所)
欢迎加入“岚翰生命科学”

 ”岚翰生命科学“ 诚聘副主编/编辑/运营岗位 (在线办公)

参考文献(上下滑动阅读) 

[1] Wang P, Xu SQ, Wang BQ, Fung WK, Zhou JY (2019) A robust and powerful test for case-control genetic association study on X chromosome. Stat Methods Med Res 28: 3260–3272.

[2] Lyon MF (1961) Gene action in the X-chromosome of the mouse (Mus musculus L.) Nature 190: 372–373.

[3] Amos-Landgraf JM, Cottle A, Plenge RM, Friez M, Schwartz CE, Longshore J et al. (2006) X chromosome-inactivation patterns of 1,005 phenotypically unaffected females. Am J Hum Genet 79: 493–499.

[4] Wong CCY, Caspi A, Williams B, Houts R, Craig IW, Mill J (2011) A longitudinal twin study of skewed X chromosome-inactivation. PLOS One 6: e17873.

[5] Carrel L, Willard HF (2005) X-inactivation profile reveals extensive variability in X-linked gene expression in females. Nature 434: 400–404.

[6] Wu H, Luo J, Yu H, Rattner A, Mo A, Wang Y et al. (2014) Cellular resolution maps of X-chromosome inactivation: implications for neural development, function, and disease. Neuron 81: 103–119.

[7] Schifano ED, Li L, Christiani DC, Lin X (2013) Genome-wide association analysis for multiple continuous secondary phenotypes. Am J Hum Genet 92: 744–759.


本文完

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存