Nature | 超6万人全基因组序列分析结果揭示:线粒体DNA插入人类基因组从未停止
基因从细胞器转移到细胞核是线粒体起源的内共生理论的基础,大多数核-线粒体片段 (nuclear-mitochondrial segments, NUMT)被认为是古老的,早于人类物种形成。高等生物的线粒体基因组逐渐变小,反映了线粒体基因在进化过程中进入核基因组的易位,这促进了细胞质翻译机制对细胞器蛋白的协同合成,这一过程也在整个非编码空间中留下了非表达的线粒体DNA(mtDNA)片段。
大规模的全基因组测序(WGS)项目提供了一个比其他物种更深入地表征人类NUMT的机会。近期,WGS研究在人类中发现了超罕见的NUMT,这表明mtDNA-核转移是一个持续的过程,但种系NUMT形成的速率仍然未知。新的mtDNA -核转移可能会破坏蛋白质编码基因,进而导致疾病的发生,因此具有重要的研究意义。此外,将NUMT序列解释为mtDNA变体可能会混淆对线粒体疾病的诊断。
近日,英国剑桥大学、伦敦玛丽女王大学等机构的研究团队在Nature发表了题为“Nuclear-embedded mitochondrial DNA sequences in 66,083 human genomes”的文章。该研究绘制了包含66,000多个个体的NUMT图谱,其中包括英国十万人基因组计划中8,201个母-父-子三人组样本和12,509个肿瘤-正常组织对,并揭示了mtDNA序列插入核基因组(即NUMT)是一个不局限于过去且一直持续到今天的过程,新的插入一直都在发生。同时,该研究也为解释不同人群的mtDNA变异和理解核基因组进化提供了宝贵资源。
主要研究内容
研究团队分析了66,083名英国罕见病项目参与者的全基因组序列,其中包括12,500多名癌症患者,经过严格的质控(QC)和筛选标准,最终确定了1,637个不同的NUMT。结果显示,超99%的个体,至少具有一种NUMT;每8个个体中有一个人会携带超罕见的NUMT。结合稀有和超稀有NUMT与常见NUMT数据,研究团队共识别出1,564个此前未被报道过的NUMT。大多数NUMT是短插入(63.2%的NUMT小于200 bp,77.8%小于500 bp),且NUMT大小与总体频率呈反比关系(P=0.021)。
图1. NUMT的检测及鉴定。来源:Nature
研究团队从10,713个肿瘤-正常数据对的251个肿瘤组织中发现了379个上述新生的NUMT,有82个肿瘤携带了一个以上的新生NUMT。分析显示,肿瘤特异性NUMT的平均数量为0.035,中位长度为396 bp,高于种系NUMT的数量,这与癌症驱动NUMT形成的理论一致。此外,具有新生NUMT的肿瘤的比例取决于肿瘤类型,例如,膀胱癌的NUMT比肾脏和结直肠肿瘤多7.5倍左右,膀胱癌的NUMT也比其他肿瘤类型更多。
图2. 人类癌症中的NUMT分析。来源:Nature
NUMT的形成是一个持续的过程,约每104个出生中就会发生一次种系新生事件,每103个癌症中就会发生一次体细胞插入,这导致了人类群体中NUMT的高度多样性。mtDNA片段大量转移到细胞核基因组中,不可避免地会增加人类基因组的大小。但NUMT大小与其在人群中出现的频率呈负相关,这指向了一种平衡NUMT插入的选择性过程,即保持基因组大小并去除影响基因表达的NUMT。
PR结构域锌指蛋白9(PRDM9)与DNA双链断裂(DSB)修复有关,并在减数分裂过程中决定了交叉热点位点。研究团队发现,将NUMT与PRPRDM9结合位点共定位有助于在种系中去除影响基因表达的NUMT。通过共定位的方式,NUMT还可以充当类似膏药的“临时修复物”修复DSB,直至其在减数分裂期间被移除。此外,NUMT的形成涉及几种不同的分子机制,其都与核基因组的不稳定性有关,因此携带DNA修复致癌基因错义突变的肿瘤样本比其余肿瘤更可能存在肿瘤特异性NUMT。
图3. NUMT形成的分子机制。来源:Nature
为了了解mtDNA序列插入核基因组后的分子进化,研究团队确定了931个不同的NUMT的完整核苷酸序列,包含144,805 bp。随后,研究团队估算了429个NUMT插入的年龄。结果显示,大多数(超过90%)NUMT插入的年龄小于10万年,41个(9.5%)年龄超过10万年,其范围可达375万年。与预期一致,较老的NUMT在人群中更常见,较年轻的NUMT更容易携带NUMT特异性突变。上述研究结果表明,在整个人类进化过程中,NUMT的插入和进化一直在进行。
结语
·END ·
热文推荐
GRAIL公布Galleri多癌症早期检测筛查研究最终结果,检测到的71%癌症类型没有常规筛查
NIH拨款5亿美元启动BICAN计划,绘制有史以来最详细的人类、灵长类动物脑细胞图谱
朱正纲/陈红专/于颖彦/韦朝春团队合作发表中国人群胃癌泛基因组分析成果
沈洪兵/胡志斌团队发表迄今最大规模中国人群NSCLC全基因组测序成果,揭示肺癌罕见易感变异
喜欢就点个“在看”吧