科研工作者的力量来自持续不断的读文献!
长话短说,节前我们组建了文献阅读群
果子组建的第一个文献阅读交流群今日开放!
为了让群能够运行的更好,我们还写了关于文献阅读交流群的几点说明
比如,全天禁言,只有晚上8点到11点开放讨论,目前大家准守的都很好。
明天开始文献阅读正式启动。
我思考再三,群里读文献最好是主题阅读。比如,下面两周我们阅读的主题就是m6a甲基化(不感兴趣的也要看完这篇帖子,有惊喜)。
这样,我们先自己根据这个主题找文献,读文献,推荐文献,最后从群友推荐的文献中再选取文献深入阅读,读起来也不费劲,真正把群体的力量用起来了。
关于文献阅读的形式,我先给大家做个示范,简单而言就是,
一篇文章,一段推荐,一个技能。
单纯推荐文章
比如,我想了解m6A甲基化的内容,我就先去看综述。
第一篇看的是芝加哥大学陈建军老师写的
RNA N6-methyladenosine modification in cancers: current status and perspectives
发表在Cell research 上面
这篇文章我会推荐给大家,因为里面出现了一张了解m6A甲基化的神图
这张图里,m6A甲基化就像是RNA的标签,由WTAP,METTL3和METTL14组成的复合物写入,之后会由阅读器过来阅读从而发挥作用,不同的阅读器发挥的功能不一样,我们比较熟悉的是YTHDF2,他阅读m6A甲基化后促进RNA降解。写入的m6A甲基化如果不擦除会失调,所以还有一些蛋白作为擦除器,专门擦除m6A甲基化,已知的两个是FTO和ALKBH5。
这就是这一篇文章我的推荐,此刻你是否对m6A甲基化有了一定了解,因为所有重要的m6A甲基化分子都在这张图上了,现在我们再去看那些国自然中标基金的m6A部分就很容易理解。而如果这段介绍勾起你看文献的欲望,我的目的就达到了。
以上是单纯的推荐。
推荐文章同时推荐技能
以下再示范一下,推荐文章的同时,推荐里面的技能。
因为我已经知道陈建军老师在m6A这个领域很厉害,那我就会去看他的文章。
比如这一篇他发表在Nature上的letter
Histone H3 trimethylation at lysine 36 guides m6A RNA modification co-transcriptionally
推荐语如下:
m6A甲基化是RNA的一种修饰,m6A甲基化测序发现他常发生于CDS和3UTR区域,H3K36me3组蛋白修饰的ChIP-seq结果中,他的Peaks也出现在CDS区和3UTR,作者就猜想他们可能有联系。通过一系列实验,作者证明,H3K36me3可以招募MTC(m6A甲基转移酶复合物),这样在转录时,MTC就会直接给新转录的RNA打上标签。本文首次揭示了组蛋白修饰对于m6A甲基化的影响,展示了基因表达调控的新模式。
推荐语不需要很复杂,我还配上了文中出现的图。
但是这篇文章让我念念不忘的是文中的一张附图 。
因为SETD2是H3K36me2到H3K36me3特异的甲基转移酶,而MTC复合物(包含METTL3, METTL14和WTAP)又是m6A甲基化的转移酶。所以,如果H3K36me3和m6A有关系,那么SETD2和MTC成员也有可能表达上相关。在没有做实验之前,作者是通过使用3个大型公共数据库的数据来说明的。
这三个数据库分别是GTEx,TCGA,CCLE。
其中GTEx数据库中是正常人体各个组织的转录组数据
TCGA是美国的癌症计划,里面包含了33种癌症组织的多组学数据
CCLE中有1000多个癌症细胞系,都做了转录组测序。
作者使用这三个数据库来说明SETD2和MTC的三个成员表达正相关,其中CCLE中的图,就是图e,是我们能理解的相关性分析,横坐标一个基因,纵坐标一个基因,打点然后画出拟合线。但是GTEx和TCGA中的相关性图我没见过。
以图d蓝色圈线中的图为例,横坐标是p值取log后的负值,这样越往右边越大,竖线应该是0.05的位置,横坐标是相关性系数,横线是0。我立马就知道,这是多个癌症的相关性结果的汇总图。因为TCGA有33个肿瘤,每个肿瘤都很很多样本,两个基因在单个肿瘤中计算相关性会得到P值和相关性系数,把33个癌症中的结果汇总就得到了图d,这个本质上就是个火山图。
这个图可以帮我们很好地展示普适性结果,比如,图d可以看出SETD2和METTL3在大部分癌症中都是正相关的,在个别肿瘤中不相关。同理GTEx因为记录了人体多个组织的信息,也可以画出类似的图。
当我看到这个图的时候,很高兴,因为这是张科研人员人人都用得到的图。医学科学研究中,大部分情况都是关注两个分子的相关作用,尤其是转录调控,如果转录因子A调控了靶基因B, 那么A和B就应该是个正相关的关系,当我们有多个转录因子可以选择的时候,用这里的方法可以缩小范围。
因为这个生信技能太实用,我花了2天时间(其中一天是下载数据)像素级别还原了这里的9张图。而且,方法具有普适性,给出任意两个基因,都可以很方便的出图,人人可用!明天发布教程。
好了,到了这里我给出了第二个示范,一篇文章,一段推荐,一个技能。这个技能你不会不要紧,只要你在推荐文章的时候注明即可,只要他足够优秀,我们会出教程实现它,我自己搞不定,我的朋友也能搞定。而且,该技能的推荐人可以免费获取教程。
如何收集文章?
我初步使用的是腾讯文档的在线收集功能。群里的朋友会收到链接,在两周内填写即可。
手机端和电脑端打开链接即可操作,只要填5个内容,杂志名称,影响因子,标题,推荐语,文章的DOI号。这个系统会自动收集内容汇总成为一个excel表格,这样我们就可以知道哪位群友推荐了什么文章,而且因为有了DOI号码,我们还可以批量下载文献。
如果把这个excel导入R语言就可以快速地导出为标题加上推荐语的文本文档,方便查阅。
第一次的主题是m6A甲基化,感兴趣的就阅读相关的文献,这样别人推荐相关内容的时候,吸收的也会很快。
对于不感兴趣的朋友,可以忽视这个主题,根据自己的需求推荐文献。
如果你有感兴趣的主题也可以推荐给我,我们消化了这批文献后,下一个主题暂定为单细胞测序。
因为目前群友有200多人,如果大家都准守诺言会产生200篇文章和推荐语,我需要招募2-4名志愿者(只限群友)人工查阅推荐语,再筛选一次,作为下一次的候选文献。大家自由报名。参与者会有象征性报酬。
燥起来吧,朋友们!