最新20分文章原来靠生信分析,老板问我为何跪着看
以往我们公众号讲解过很多厉害的文章,涉猎广泛,紧扣热点,提炼出文章的套路供大家参考,有些咱们能模仿,因为套路简单,分数也偏低了一些(只要毕业好使就行),但是有些高分文章是否也能总结出套路呢?有倒是有,但是难度可能稍微有点大,今天咱们来继续解读一篇让人不得不服的开始于TCGA数据库数据挖掘的20分文章,发表于Cancer Cell上。
标题:lncRNA Epigenetic Landscape Analysis Identifies EPIC1 as an Oncogenic lncRNA that Interacts with MYC and Promotes Cell-Cycle Progression in Cancer
期刊:Cancer Cell(23分)
时间:2018.4
单位:匹茨堡大学
作者呢是一个中国人,就是下图这个Da Yang博士,毕业于哈尔滨医科大学。
用一句话来描述这篇文章的中心思想就是:通过对TCGA、COSMIC中6,475个肿瘤样本(20多个癌症)以及455癌细胞株的lncRNA的基因组表观遗传分析,纯数据挖掘后得到一个lncRNA EPIC1,其高表达和肿瘤预后相关,而且过表达后引起体内外肿瘤细胞的增殖,分子机制上EPIC1和c-MYC蛋白结合调控CDKN1A, CCNA2, CDC20以及CDC45等基因的表达,促进细胞周期相关过程。
师兄来给大家庖丁解牛一下作者的神思路。
(1)肿瘤lncRNA、mRNA的基因启动子区的表观遗传分析
咱们平常理解的生信分析无非就是差异基因、PPI网络、GO分析KEGG富集、ceRNA网络等,作者一上来就放大招,作者综合了20多种癌中类型,共计6,475个肿瘤样本以及455癌细胞株的现有基因组表观遗传数据,进行了数据挖掘,分别对mRNA和lncRNA的基因启动子区进行了组蛋白甲基化、乙酰化、CpG岛甲基化水平分析,发现在各种肿瘤类型中,lncRNA和mRNA的启动子区DNA甲基化水平和类型存在显著差异。
(2)lncRNA基因的启动子甲基化水平在TCGA的RNA-seq中验证
这里面首先遇到的问题是,作者虽然能够获得肿瘤中哪些lncRNA启动子区甲基化高低,但是也只能推测表达关系,例如根据经验推测低甲基化(hypomethylation)促进lncRNA的高表达,而超甲基化(hypermethylation)导致lncRNA的表达下调。
同样地,还是利用数据挖掘,作者通过对TCGA的RNA-seq中lncRNA转录本的信息进行整合,共在 5,602 TCGA肿瘤数据中得到12,382 lncRNA 表达水平信息,然后通过与DNA甲基化水平联合分析,一共得到 2,123个差异表达的 lncRNA,其中包括1,006 个高表达 以及1,117个低表达。
每一列代表一种肿瘤类型;
红色代表推测高表达lncRNA,绿色是低表达;
圆面积代表P值;
(3)TOP20的高表达lncRNA至少和一种肿瘤的差预后相关,EPIC1的表达和乳腺癌的预后相关
首先发现TOP20高表达lncRNA至少和一种肿瘤的差预后相关,而TOP10低表达lncRNA和至少一种肿瘤的好的预后相关,在这里面EPIC1表达水平和DNA甲基化的程度成反比,且高表达和乳腺癌的差预后相关,低表达和乳腺癌好的预后相关。
作者用化疗药物地西他滨处理了乳腺癌细胞MCF-7和MB231,最终地西他滨引起了乳腺癌细胞中EPIC1启动子区的DNA甲基化水平下降,介导了EPIC1的高表达,也就是说EPIC1介导了乳腺癌的耐药机制。为了进一步确定启动子去甲基化和基因的表达相关,作者克隆了EPIC1的启动子区,做了甲基化荧光素酶实验,发现低表达的启动子区序列会介导荧光素酶的高表达,而且有统计学意义。
(4)EPIC1促进管腔型乳腺癌发展,和癌基因c-MYC蛋白相关
接下来就是做细胞和动物的功能实验,EPIC1的敲减表达使得乳腺癌细胞停留在了G0/G1,同时乳腺癌细胞的增殖、迁移和克隆形成能力下降,皮下成瘤实验中发现敲减EPIC1后,乳腺癌细胞的体内成瘤能立下降明显。
而后对EPIC1敲减后的乳腺癌细胞株的测序,做GSEA分析,发现其和MYC基因下游蛋白的表达高度相关联,而WB也验证了这样的结论。
(5)分子机制:EPIC1直接结合c-MYC蛋白,调控下游CDKN1A, CCNA2, CDC20以及CDC45等基因的表达,促进乳腺癌的细胞周期相关过程。
①RIP实验、Northern Blot验证EPIC1直接结合c-MYC蛋白,且c-MYC是EPIC1的主要作用分子
②EPIC1调控了c-MYC蛋白的靶基因CDKN1A, CCNA2, CDC20以及CDC45等
所以说,这是一篇数据挖掘撑起了半边天的文章,供感兴趣且有钱有闲的童鞋拿给自己的老板作为参考,一激动说不定给你拨点钱,拿着和我们小张聊科研团队合作呢。
今天先说到这里,下期见。
上海·复旦讲座
内容:如何确定要研究的分子并发SCI、申基金
地址:复旦大学上海医学院(东安路130号)西区第二教学楼2106教室
时间:4月23日(周一) 14:00~17:00
容纳人数:150人
预报名:小伙伴点击左下角阅读原文
长按二维码识别关注“小张聊科研”
关注后获取《科研修炼手册》1、2、3、4、5、6、7