新年重磅 | 西北大学严健教授团队Nature发文!
但GWAS在找到基因序列差异与疾病风险关联的时候,并不能同时反映出这种关联背后的原理,这就阻碍了我们从关联中寻找预防和治疗这些疾病的分子靶标,成为一直困扰遗传学和医学研究者的一大难题。
近年来,越来越多的研究表明,这些疾病风险位点大部分位于基因组非编码区域,它们并不会改变蛋白质的序列与结构,而可能在基因表达调控上发挥作用。例如这些突变位点能够改变一些序列特异性结合蛋白与DNA结合的亲和力,从而影响下游目标基因的调控作用。但是,搞清楚一个位点突变的分子机理往往需要大量的时间和人力投入,单个突变一般需要有经验的研究组2-3年的时间完成,而且实验室之间、实验系统之间的差异还会干扰数据之间的可比性。考虑到目前已积累超过10万个疾病关联位点,而且GWAS还远远没有到达平台期出现饱和,随着研究手段的进一步改进,这样的位点还会越来越多。因此亟需开发一种可以高通量、系统性的办法来研究这些突变位点的分子功能。
近年GWAS数据增长与功能研究增长对比
红色表示GWAS发现的位点随着时间推移的增加,蓝色表示对GWAS发现位点的功能研究的积累。
从HT-SELEX到SNP-SELEX技术
8年的沉淀与改进
2013年,严健在JussiTaipale教授指导下发明了HT-SELEX技术,通过在体外表达纯化DNA结合蛋白,与人工合成的长度为40bp随机序列DNA片段结合,再经过多轮缓冲液的清洗去除非特异性结合,最后洗脱结合力强的DNA,经过高通量测序计数,定量分析转录因子的DNA序列结合特异性。
SELEX原理示意图
红色波浪线表示长度为40bp的双链DNA片段,每一轮循环表示一次富集过程,可以通过增加循环来提高富集度。
为了摆脱对预测模型的依赖,在实验水平直接分析SNP对转录因子的影响,严健、任兵、Jussi Taipale教授于2015年再次联合提出改进HT-SELEX方法:在合成长度为40bp配体DNA时,不再使用随机序列的DNA,而以包含待研究的SNP及其附近的基因组序列取而代之,再利用HT-SELEX实验进行分析。研究团队利用该方法,定量分析了270个转录因子,在与95,886个非编码SNP结合时,不同等位基因序列(allele)与其结合强弱的差异,并记录了量化这些差异的大量数据。这些数据为解释疾病机理提供了重要的理论依据。
类似的研究手段可以进一步扩展到
其他遗传疾病的研究中
以2型糖尿病风险位点SNP rs7118999为例,研究团队发现该位点可以影响转录因子HLF结合,并通过染色质长距离相互作用参与APOC3基因的表达调控,调节血脂水平。
左图展示了在基因组浏览器中观察到的SNP rs7118999可以影响HLF转录因子的亲和力,从而通过三维基因组折叠的方式,引起下游APOC3基因表达的差异。右图展示了在肝脏细胞中敲低HLF会导致APOC3基因表达的下降,进一步验证了该团队的科学假设。
严健介绍到:“以此为基础,我们相信类似的研究手段可以进一步扩展到其他遗传疾病的研究中,包括肠癌、前列腺癌等,将对解释这类疾病的遗传特性,找到临床诊断的分子标记物等工作都具有建议和指导作用。”
该成果是西北大学生命科学与医学部自成立以来的首篇Nature杂志论文,也是以西北大学为第一作者单位在Nature和Science正刊发表的第16篇论文,是学校科学研究多点突破的标志性成果。
近年来,西北大学在持续推进“一院一策”改革的基础上,逐步打破学科边界,围绕学科交叉融合,促进学术协同创新,加快论证推进相关学科大部的建立。生命科学与医学部作为学校首家学部制试点单位,立足“大健康”学科集群,凝练和突出生物与医学学科优势特色,构建跨学科创新团队,建设大平台、承担大项目、产出大成果,逐步形成了面向国家需求、服务区域发展、彰显西大特色的“大健康”学科内涵式发展新路径。更多精彩,不容错过~
素材来源/ 生命科学与医学部 科技处
文字整理&编辑/ 魏梦鸽