GWAS+lncRNA是否能成为后基因组研究的宠儿?
由高校、医院FS公众号和科研技能公众号等百家单位联合创建的科研交流分享平台;联盟的宗旨:“公正至上,自由分享,平等共赢”。欢迎您的关注,让我们共同学习进步。戳这里Freescience联盟公众号原文,请多关注哦~
GWAS
GWAS(Genome-wide association study),即全基因组关联分析,是指在人类全基因组范围内找出存在的序列变异,即单核苷酸多态性(SNP),从中筛选出与疾病相关的SNPs。目前,已经发表了超过1300多项GWAS研究,寻找到了6500个与疾病或性状相关的易感位点。但只有7%的位点落在蛋白编码区,而93%落在非编码区。对于SNPs在肿瘤中的贡献来说,如果一些生殖细胞突变发生在蛋白质编码区往往是非常有害和致死性的,这样可能直接导致携带者不能存活,所以这种形式可能不是主要的贡献方式。而发生在一些调控区的生殖细胞突变,可以在不同组织或阶段特异的引起基因表达渐微的变化,这可能是肿瘤易感位点SNPs在癌症整个进展中的主要贡献方式。大量研究表明非编码RNA在众多生命活动调控中扮演了越来越重要的角色。
lncRNA
在近十余年的生命科学研究中非编码调控RNA可谓是研究最火的领域之一,从06年诺奖的siRNA,到前几年异常火爆的microRNA,到如今风靡的lncRNA,可谓如火如荼。为什么近年来lncRNA才被人关注呢?因为在以前,lncRNA被认为是基因组转录的“噪音”,是RNA聚合酶II转录的副产物,不具有生物学功能。但随着研究的进展,lncRNA重要的调控机制被发现,例如参与了X染色体沉默,基因组印记以及染色质修饰,转录激活,转录干扰,核内运输等。lncRNA 研究将是基因组研究中非常吸引人的一个方向,使人们逐渐认识到基因组中知之甚少的“暗物质”。
lncRNA文章统计
中国第一篇10分以上的lncRNA文章是二军大孙树汉教授在肝癌领域上的研究——[Long non-coding RNA high expressed in hepatocellular carcinoma (lncRNA-HEIH) facilitates tumor growth through enhancer of zeste homolog 2. Hepatology, 2011]。从此开始,lncRNA高质量的文献不断被报道,逐渐被人关注起来,到了2015年已经达到了18篇,增速显著。
这篇文章的故事大概是,首先通过先前的GWAS研究发现了33个显著(P ≤ 1 × 10−6)的胰腺癌易感SNPs。而通过整合分析又新发现坐落在LINC00673上的rs11655237是胰腺癌的一个易感位点。而这个SNP的突变位点产生,恰好形成了miR-1231的作用靶点,能使miR-1231竞争性地结合LINC00673。而LINC00673在胰腺癌中起到一个抑癌作用,这个SNP突变体起到减弱LINC00673的抑癌作用,从而阐明了这个易感SNP为什么会增加胰腺癌风险。
文章的另一半工作则是阐明LINC00673是如何起到抑癌作用的,即做LINC00673的下游机制研究。通过机制实验证明了LINC00673与一些 “明星”分子或者肿瘤相关通路有作用,从而解释其机制。从思路上来讲整篇文章可以分为两个小故事,如果仅仅只阐明LINC00673作为一个新发现的抑癌lncRNA是如何起到抑癌作用的,那么就这个工作量最多只能发在Hepatology这类级别的杂志,而这篇文章之所以能发Nature Genetics,主要还是在于前半部分的创新性的机制探索——SNP的突变位点产生,形成了miR-1231的作用靶点(我们一般会考虑点突变会导致3’UTR上的miRNA结合位点失靶,极少反过来去想)。通过这样新颖的机制巧妙地阐明了这个易感SNP是如何通过LINC00673来发挥作用的。
这篇文章用到的分析方法和实验方法都是GWAS和LncRNA功能机制研究的常规方法,大多实验室都能达到的水平,而北京协和团队最大的优势在于先前的GWAS研究基础,扎实的实验基础及创新性的科研理念是值得我们钦佩和学习的。
目前GWAS研究已遇到瓶颈,英格兰杂志曾发表了数篇文章辩论GWAS研究的是否有意义。总结了历年的GWAS病例/对照研究数据,发现花费了数亿美元的GWAS研究,最后获得的大部分 biomarker,对疾病预测的贡献值都是非常小的,低于7%。所以后GWAS研究时代必将进入功能验证的时代(也就是仅仅烧钱是不够的,必须要做功能验证),而这篇文章具有标杆作用。
赵忻艺,将大数据应用于医学科研,主要包括临床医学数据的挖掘、收集、整理和利用(标准化和科学化的数据库),医学分子大数据的整理、利用及研究(基因、蛋白及代谢)。特别针对肿瘤个体化的基因测序和数据快速处理,寻找个体化的分子标志物、药物靶标和治疗方案。目前,已建立浙大大数据挖掘团队,旨在降低研究者学习大数据的门槛,推动大数据共享与研究协作,发表更高质量的研究成果,为科研决策提供精准的预测和实验证据。
生信草堂
将会与更多的优秀微信公众号合作,把最优秀的微信推文呈现给大家,希望可以帮助读者更多的了解生信技术,培养和提高读者的生信分析能力!
号外,号外,号外
你想和生信分析大神做好朋友么?
你想认识更多爱好生信分析的小伙伴么?
你想让自己的生信分析走上快车道么?
那就赶快加入我们的微信群吧:生信草堂交流群
或者加我们的微信,我们会把您拉入我们的社区:myl-1800; Edison686868
学术手拉手
长按关注Freescience联盟