查看原文
其他

WES助力帕金森病找到新候选基因 | 文章解读

LYM 华大科技BGITech 2019-06-02


复杂性疾病大多存在遗传性缺失的现象。单个基因无法决定疾病的遗传可能性,因为个人对疾病的易感性可能更多地依赖于“背景中所有基因的组合效应而不是前景中的疾病基因”,又或者说基因的作用可能被严重高估。使用正确的研究方法可以找到缺失的遗传性,这正是研究的价值所在。下面和科技君一起来看看,华大基因如何通过WES测序技术,使用家系样品帮助研究者找到帕金森病( Parkinson’s disease,PD)的新候选基因。


文献ID


文献名称:Coding mutations in NUS1 contribute to Parkinson’s disease

期刊名称:PNAS

发表时间:2018年10月22日

影响因子:9.5

参与单位:中南大学、斯坦福大学、华大基因

应用技术:WES测序

原文链接

https://doi.org/10.1073/pnas.1809969115


研究背景

PD是世界上第二常见的神经退行性疾病,主要影响运动神经系统。它的症状通常随时间缓慢出现,早期最明显的症状为颤抖、肢体僵硬、运动功能减退和步态异常,也可能有认知和行为问题;失智症在病情严重的患者中相当常见,超过三分之一的病例也会发生重性抑郁障碍和焦虑症。PD的成因目前还不清楚,但普遍认为和遗传与环境因子相关。


de novo突变是指父母体细胞中不携带,来自于生殖细胞突变或发生于受精卵分裂早期的体细胞突变。由于de novo突变未经过进化选择,突变的有害性要显著高于其他类型的突变,在关键基因上发生关键de novo突变往往给个体带来严重影响,如发生不同类型的精神类疾病,包括自闭症、精神分裂症、癫痫等。


外显子测序(WES)已被广泛应用于家族性或散发的PD遗传风险研究,一些常见和罕见的遗传风险变异已被确定与PD发病机制有关,这些研究主要针对于白种人。对于中国汉族PD患者来说,遗传性缺失仍是相当严重的问题。研究者提出基于三人组的研究模式(trio-based study),旨在探讨汉族人群胚系突变基因与早期出现的PD之间的关系。


研究成果

研究者采取了三期研究的策略,来挖掘中国汉族PD患者人群新的遗传风险基因。


(一)研究者对19个三人组【父母和患有早发性帕金森病(EOPD)的孩子】和20个四人组(父母和他们的两个孩子:一个患有EOPD,另一个是健康的)进行外显子测序,发现12个发生了胚系突变(de novo功能性突变)基因(MAD1L1, NUP98, PPP2CB, PKMYT1, TRIM24, CEP131,CTTNBP2, NUS1, SMPD3, MGRN1, IFI35, RUSC2)。


(二)对以上12个候选基因,在两个独立大人群队列进行筛选和验证(1,852名散发性PD患者和1,565名对照进行了筛选,在另外3,237名PD患者和2,858名对照中得到验证)的进一步分析显示,NUS1在PD患者中具有比对照更罕见的非同义突变(P = 1.01E-5,优势比= 11.3)。


(三)在果蝇的功能研究表明,NUS1的丧失可以降低攀爬能力、多巴胺水平、多巴胺能神经元的数量,同时诱导果蝇大脑的细胞凋亡事件。这些结果表明,de novo突变对早发性PD发病机理的影响,并且确定NUS1是PD的一个新的候选致病基因。

图1A  整体项目流程图;图1B 12个新的候选基因与PD已知基因的蛋白互作网络


研究方法

本研究重点关注EOPD患者中发生的de novo突变,探讨了de novo突变对PD的影响,并分别从独立大人群队列和果蝇实验对候选基因NUS1进行了验证。研究一共使用了39个EOPD患者(发病年龄早于40岁)及其父母的样本,其中有20个患者也收集了其未患病的更年长的兄弟姐妹,总共137个样本,均进行了全外显子高深度(>100X)测序。


(一)EOPD的de novo突变检测

39个EOPD 先证者(proband)中发现了39个de novo SNV和1个de novo InDel。20个兄弟姐妹(sibling)中发现了19个de novo SNV和1个de novo InDel。每个家庭中,先证者和兄弟姐妹所携带的de novo SNV的数量没有明细的差异(先证者: 1.03; 兄弟姐妹:0.95,Fisher’s exact test, P=0.50),并且服从泊松分布 (先证者: P=0.98, 兄弟姐妹: P=0.71,图2)。


图2 proband和sibling每个个体携带的编码区de novo突变的数量


(二)de novo 突变的富集分析与候选基因挑选

(1)在发现的de novo突变中,先证者(NS:S=4.57)的非同义突变和同义突变之比要远高于兄弟姐妹(NS:S=2.8)和随机突变(NS:S=2.85)。先证者和兄弟姐妹中的de novo突变之间的差异可能是小样本量的假象。在39个家系中,发现了22866个罕见的遗传性变异,作为自然发生的罕见突变参考集。


(2)先证者的NS:S比值显著高于罕见遗传性变异的比值(P=5.35E-3, Fisher检验),并携带更高水平的功能丧失(LoF)突变(P=2.94E-4, Fisher检验)。


(3)基于多个软件的保守性和氨基酸突变有害性预测结果,与罕见遗传性变异相比,先证者携带的de novo突变有更高的有害性(GERP++,P=0.14;phyloP,P=0.04;SIFT,P=2.18E-05;PolyPhen-2,P=0.03,Wilcoxon秩和检验,图3A),兄弟姐妹携带的de novo突变的有害性则无显著性差异(GERP++,P=0.93;phyloP,P=1.00;SIFT,P=0.07;PolyPhen-2,P=0.99,Wilcoxon秩和检验,图3B)。


图3 根据保守性和有害的氨基酸变化,评估在proband和sibling中发现的de novo突变的潜在致病性

 

(4)为了确定这些胚系突变对PD的潜在贡献,选取12个在STR/SNc这两个脑域中有高表达的基因,作为候选致病基因并分别进行了GO/Pathway、蛋白互作、micRNA调控富集等分析(图4A)。结果发现,其中有7个基因(CTTNBP2, MAD1L1, NUP98, NUS1, PKMYT1, PPP2CB, and TRIM24)与已知的20个PD基因处于同一蛋白互作网络(图1B)。并且这12个基因显著富集于基因的共表达网络((P corrected =0.001)和GO(chromosome (P corrected =6.78E-03) and chromosomal part (P corrected =1.15E-02)) Pathway (progesterone-mediated oocyte maturation (P corrected =0.03); cell cycle (P corrected =0.03), oocyte meiosis (P corrected =0.03))中。此外,针对micRNA靶向基因集的分析发现,12个候选基因与PD已知基因显著地富集于hsa-miR-125a-3p((P corrected =6.50E-3)的调控靶向基因集(图4B),并且靶向序列在不同的物种之中保守(图4C http://people.csail.mit.edu/akiezun/microRNAviewer/)。

A.

B.

C.

图4A  12个候选基因的富集分析网络;图4B 受hsa-miR-125a-3p调控的PD已知基因与候选基因;图4C hsa-miR-125a-3p的保守靶向序列

 

(三)NUS1功能验证

针对12个候选基因,研究者在1852个散发的PD患者和1565个健康人队列中进行了目标区域测序(Molecule molecular inversion probes,MIPs)的验证,但未发现有基因在PD患者人群中有罕见非同义突变的富集现象。但在NUS1基因中,患者人群携带有6个罕见非同义突变,健康人则未携带(P=0.03)。在另外一个独立的3237名PD患者和2858名健康人的队列的外显子测序数据中,对NUS1基因进行了进一步的统计,并发现了一致的倾向(case:control=20:2, P=3.2E-4),三组数据合并分析提示了NUS1中的罕见非同义突变的富集(Pcombine =1.01E-5, odds ratio=11.3)。同时,在26个携带有这些突变的PD患者中,未发现这些患者携带有PD其他已知基因上的有害突变。对NUS1基因的3号外显子和4号外显子扩增,然后用sanger测序,发现携带有c.691+3dupA突变的患者序列上,NUS1 3号外显子有91bp的序列被剪切掉,定量RT-PCR的结果也发现,携带有突变的个体的NUS1表达量要显著低于正常人的NUS1表达量(p=0.0035)。

图5A-B  NUS1上PD患者的突变及数量;图5C-D  对发生了splicing突变的患者cDNA进行sanger测序发现,有3号外显子中有91bp的序列被剪切掉了,产生了新的剪切位点;图5E  携带有NUS1突变患者和未携带突变健康人的NUS1基因RT-qPCR


(四)NUS1在多巴胺神经元中起重要作用

为进一步验证NUS1对PD发病机理的作用,研究者使用果蝇的NUS1动物模型来进行验证。果蝇的NUS1与人类在氨基酸水平上的相似度为44%,也被称为Tango14。研究者使用RNAi介导的Tango14敲除果蝇来评估NUS1在机体中的作用。由泛神经Elav-GAL4驱动的3日龄和30日龄Tango14 RNAi果蝇显示出攀爬能力的缺陷。由多巴胺能神经元特异性TH-Gal4驱动诱导的30日龄Tango14 RNAi果蝇表现出侧脑室后部(PPL1)簇和背内侧前脑室后部(PPM1 / 2)簇的多巴胺能神经元减少。研究者对果蝇脑提取物进行了HPLC,发现表达Tango14 RNAi的30日龄果蝇的脑多巴胺水平显着降低,这进一步证实Tango14的敲低导致多巴胺能功能障碍。30日龄果蝇的TUNEL测定也证明Tango14 RNAi处理导致脑中异常的凋亡信号。


这些数据共同表明NUS1在多巴胺神经元中起重要作用,并且NUS1的丧失可能导致与PD相关的神经元功能障碍。

图6 RNAi介导的Tango14敲除果蝇的攀爬能力、神经元数量、多巴胺浓度等统计


研究亮点

本研究是最早进行的de novo突变对EOPD影响的研究之一,并根据不同类型公共数据库的深入挖掘、后续独立人群和动物实验对筛选出的候选基因进行了验证,证实了de novo突变对EOPD的影响,为后续PD的遗传学研究和de novo突变对机体发育的机制研究提供了重要的参考。在数据挖掘方面,发现de novo突变,只是文章中数据挖掘的基础部分,针对de novo本身的富集分析、疾病相关的功能性解读,为后续疾病研究的候选基因筛选提供了新的思路,值得大家借鉴。


产品扩展

外显子测序仅对外显子区域进行测序,是一种快速经济的研究方法。在同样的测序通量下,外显子组测序针对目标区段的测序深度和覆盖度都远高于全基因组重测序,因此使用它来检测低频突变十分合适。


由多个基因及环境因素相互作用所致的疾病的复杂疾病,发病率一般都超过0.001,在临床或流行病学方面具有一定程度的家族倾向,但又不表现典型的孟德尔遗传方式。利用和全外显子组测序,我们可在全外显子组范围内获取大量的准确性高的变异位点。根据研究对象不同的遗传背景来源,可分为基于家系和基于散发人群两种研究策略。


BGISEQ平台外显子,测序质量好

BGISEQ测序仪采用独特的DNA纳米球(DNB)技术,基于滚环复制(RCR)进行文库扩增,这种线性扩增可以避免常规PCR带来的错误累积,使得测序环节的Duplicate rate和错误率更低,一般Duplicate rate在10%左右。标准品的测试结果:Q20>97%,Q30>90%,有效深度76X时,20X覆盖度高达96%。

图7 BGISEQ WES下机数据表现


BGISEQ平台外显子,变异检测准确性高

SNP的F值(精确度和敏感度综合表现)在99.2%,InDels的F值高达91%,和竞品IL在同一水平。准确、全面的变异检测能力,为科研工作者的疾病研究助力。

图8 BGISEQ WES 变异检测评估


参考文献:

Guo J, Zhang L, Li K, et al. Coding mutations in NUS1 contribute to Parkinson’s disease[J]. Proceedings of the National Academy of Sciences of the United States of America,2018


撰稿:大项目部、产品部

编辑:市场部


第三届GCTA大会报名直通车👇




【猜你喜欢】

2018 ASHG 邀请函 | 华大基因与您相约San Diego!

来自基因组学临床应用研究最前沿的声音 | 华大基因ASHG 2018 Workshop精彩回放

基因组也在玩“P图”? 敢不敢做真实的自己!

Duplicates | NGS帝国的Agent Smith

UK Biobank公布华大自主平台WGS数据


【近期热文】

生命大数据走向何方?20+重磅嘉宾解读新纪元|第三届GCTA日程发布

重磅!华大发布最大规模中国人基因组学大数据研究成果

百元外显子,一网打尽才威武!

Small RNA这样建库,定量更精准!



请继续关注“华大科技BGITech”公众号,

科技君将一如既往地为您提供精彩内容!

如有相关问题,欢迎后台留言~~

关注华大科技,尽享精彩科研!

 

↓↓↓ 点击查看英文文献

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存