写在前面:
我们的「每周文献推荐」栏目已经来到了第 21 期。为了方便你阅读原文,我们为每篇推荐文献都增加了原文链接二维码。上期精彩文献回顾
上期最受欢迎的文章是「RNA sequencing: the teenage years」,一篇超详细的RNA-seq综述,官网下载困难的可以在微云下载仔细阅读 https://share.weiyun.com/5AEbLkl。
欢迎你在文章最后选出最感兴趣的文章并转发推荐给你的朋友一起投票参与。
分析微生物组你不得不知的软件 —— QIIME 2题目:Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2https://doi.org/10.1038/s41587-019-0209-9
figure
在过去二十年中,测序技术和生物信息学分析技术的快速发展,大大加速了人们对微生物领域的认知。比如,现在我们已经知道微生物可以影响疾病、医疗、环境生态、农业以及其他方方面面,而这绝大部分研究工作是由标记基因分析技术来实现的(例如使用 16s rRNA 来分析细菌/古菌;使用 18s rRNA 来分析真核生物)。2010 年发表在 Nature Methods 上的 QIIME 1 微生物组分析平台已是人们用于分析标记基因最广泛的工具,引用高达 1.5 万多次,但随着时代的发展,这款九年前的工具已无法满足我们现在的需求。
QIIME 2 是一个使用 Python 3 重新设计的系统,实现了微生物组数据的可重复和模块化分析。QIIME 2 支持丰富多样的插件,不但对 QIIME 1 已有的功能做了质的改进,还加入了一些新功能,比如进行微生物组配对样本和时间序列分析,或者训练机器学习模型以识别重要的微生物群特征。近期更新的一些插件甚至可以为代谢组学和鸟枪宏基因组学数据的分析提供初步支持。因此,QIIME 2 不仅可以作为标记基因分析工具,而且还可以作为一个多维且强大的数据科学平台,快速分析微生物组。除此之外,QIIME 2 提供了许多交互式可视化工具,可以方便地进行探索性分析和结果展示。
我当初入门微生物组领域就是一边读着 QIIME 2 的说明文档一边摸索,其官方教程写的极其详细还配有课后习题,强烈建议想要涉足微生物组领域同学可以好好拜读下~
题目:Hidden Markov models lead to higher resolution maps of mutation signature activity in cancerhttps://genomemedicine.biomedcentral.com/articles/10.1186/s13073-019-0659-1
文章介绍:
众所周知,肿瘤突变的位点非常多,所以COSMIC数据库 系统性整理了30个突变模式,我在我的直播基因组系列介绍过:
也有非常多的综述来系统性阐述它们的生物学意义:
Review Mechanisms underlying mutational signatures in human cancers.[Nat Rev Genet. 2014]
Review Mutational spectra and mutational signatures: Insights into cancer aetiology and mechanisms of DNA damage and repair.[DNA Repair (Amst). 2018
非常多的文章使用这个概念,比如文章 PLoS Genet. 2018 Nov 就提到Here we analyse somatic mutations from 7,815 cancer exomes from The Cancer Genome Atlas (TCGA) across 26 cancer types. We curate a list of 50 known cancer driver mutations by analysing recurrence in our cohort and annotations of known cancer-associated genes from the Cancer Gene Census, IntOGen database and Cancer Genome Interpreter.而这一点Mutational signature,之前是 https://cancer.sanger.ac.uk/cosmic/signatures_v2 本来就30个signature而已,搞清楚它们的生物学功能即可。现在 COSMIC数据库更新之后 https://cancer.sanger.ac.uk/cosmic/signatures 看起来更复杂了一点。R包也是由SigProfiler到 deconstructSigs 的转变 。本文使用隐马尔可夫模型,全新阐述了Mutational signature,值得大家自行阅读。
供稿人:Lakeseafly
题目:Magic-BLAST, an accurate RNA-seq aligner for long and short readshttps://doi.org/10.1186/s12859-019-2996-x
随着技术的发展,新一代的测序技术能从转录本或者基因组中产生成千上万的reads,但是很少有程序可以在基因组上可以比对到RNA上同时准确地发现内含子,特别是对于long read测序来说。这里研究写了一个新的比对工具Magic-BLAST来帮助我们解决上面的问题。Magic-BLAST采用创新技术,包括在种子选择过程中优化拼接比对评分和选择性掩蔽。根据研究者的评估,Magic-BLAST能够准确地在短序列或长序列(PacBio,Roche和Illumina等的reads中)发现内含子。并且研究者将该工具与其它流行的比对工具例如Hisat2,STAR和TopHat2等工具进行比较和校正,发现新型的Magic-BLAST具有更好的表现。研究者证明了Magic-BLAST在各种条件下是内含子发现的最佳选择,并且在任何平台上最好的比对reads超过250个碱基。它具有多种功能,可以抵抗高水平的错配或极端碱基组导致比对产生误差,而且其速度相当快。它可以将读取与BLAST数据库或FASTA文件直接进行比对。它可以接受FASTQ文件作为输入,或者自动从NCBI的SRA存储库中检索下载比对。看了该介绍感觉该工具确实溜溜溜,有没有想替换掉目前使用的工具的打算。当然实际上是不是那么好用呢?答案当然是下载该工具:https://ncbi.github.io/magicblast/,然后使用有关数据测测看看。