菜鸟团一周文献推荐(No.16)
写在前面:
不知不觉,我们的「每周文献推荐」栏目已经来到了第 16 期。从这期开始,为了方便你阅读原文,我们为每篇推荐文献都增加了原文链接二维码。
在上一期分享分享中,深度学习在生物医学中面临的机会和挑战(超长综述)获得了最多的投票关注,如果你错过了可以点击下面的链接进行查看。菜鸟团一周文献推荐(No.15)
同时,欢迎你在文章最后选出最感兴趣的文章并转发推荐给你的朋友一起投票参与,笔芯
供稿人:lakeseafly
一句话评价
胡杨属泛基因提供了该属的进化历史的更多细节
文章信息
题目:The poplar pangenome provides insights into the evolutionary history of the genus
杂志:Communications Biology
时间:18 June 2019
链接:
https://www.nature.com/articles/s42003-019-0474-7
Figure
胡杨属的SNPs,indels,和SVs变异的Circos图
文章介绍:
摘要
胡杨属包括古代和现代物种的复杂结合,已成为进化和分类学研究的主要模型。在这里,研究者对来自胡杨属的五个部分的10个物种的基因组进行了测序鉴定了7100万个基因组变异,并观察到单核苷酸多态性 - 结构变异(SNP-SV)密度和indel-SV密度之间的新相关性,以补充哺乳动物中报道的SNP-indel密度相关性。具有杂合性功能丧失(LOF)的抗病基因(R基因)在10个物种中显着富集,这增加了杨树R基因在进化过程中的多样性。自交不亲和基因中的杂合LOF突变与杨树的自花受精密切相关,表明了雌雄异株植株自花受精是由基因控制的。系统发育的全基因组SNP树也显示在Tacamahaca,Aigeiros和Leucoides部分的物种之间可能的古老杂交。泛基因组研究为杨树遗传和育种提供了有用的信息信息。
文章亮点的主要亮点是数据中含有胡杨属中从古老到现代的物种,结合SNP,indels,还有SVs(比较新颖的地方)讲述了一系列遗传进化的故事,但是文章打着泛基因组的标题,实际上并没构建任何的泛基因组,也没有做其他相关的分析,感觉还有很多其他有趣的故事可以挖掘。
供稿人:Christine
一句话评价
沉默突变并不“沉默”,认识一个癌症同义突变数据库
文章信息
题目:A pan-cancer analysis of synonymous mutations
杂志:NATURE COMMUNICATIONS
时间:12 June 2019
链接:
https://www.nature.com/articles/s41467-019-10489-2
figure
文章介绍:
由于密码子的简并性,同义突变不改变氨基酸序列,因而被视为沉默突变,极少受到人们的重视。然而,近年来的研究逐渐表明同义突变很可能会影响可变剪接、RNA稳定性、RNA折叠、相应共转录蛋白折叠等生物学过程。本文中,作者分析了COSMIC数据库中659149个人类癌症的同义突变,开发了一个专门用于注释同义突变的数据库SynMICdb (http://SynMICdb.dkfz.de) 。该数据库包含了同义突变的基因注释、发生频率、突变负荷、癌症相关性、保守性、可变剪接及对RNA结构的影响,并据此定义了一个用于评估非同义突变的SynMICdb score。此外,文中还以癌基因KRAS的一个同义突变为例,结合实验证明了同义突变确实会影响RNA结构及基因表达水平。
推荐理由:随着生物学研究的深入,曾被认为是“冗余”的非编码RNA一跃成为如今的研究热点,类似的,一直未被关注的同义突变也不再“沉默”,SynMICdb这个数据库值得知道一下!
供稿人:六六
一句话评价
cisTopic——从scATAC-seq数据中同时识别细胞状态和顺式调控主题的R包
文章信息
题目:cisTopic: cis-regulatory topic modeling on single-cell ATAC-seq data
杂志:Nature Method
时间:Apir 8,2019
链接:
https://www.nature.com/articles/s41592-019-0367-1
figure
文章介绍:
cisTopic是一个用于从单细胞表观基因组学数据同时识别顺式调控主题和细胞状态的R Bioconductor package。它依赖于Latent Dirichlet Allocation (LDA)算法,这种算法是一种有效的用于文本挖掘的贝叶斯方法,将相似主题和相关单词的文档分组到主题中。
cisTopic包括四个主要步骤:(1)生成一个二进制可及性矩阵作为LDA的输入;(2) LDA和模型选择;(3)利用LDA中的主题细胞分布进行细胞状态识别,(4)探索区域主题分布。
推荐理由:联合优化了细胞聚类和增强子的分类,可以识别细胞亚型和可及性的增强子
使用教程:https://github.com/aertslab/cistopic
Basic tutorial on simulated single cell epigenomes from melanoma cell lines.
10X tutorial on the 5k PBMC data set from 10X.
供稿人:kaopubaar
一句话评价
长序列测序和植物基因组从头组装的工具与策略
文章信息
题目:Tools and Strategies for Long-Read Sequencing and De Novo Assembly of Plant Genomes
杂志:Trends in Plant Science
时间:June 14, 2019
链接:
https://doi.org/10.1016/j.tplants.2019.05.003
figure
简化工作流决策树
文章介绍:
随着测序成本的降低,更多生物信息分析流程的出现以及越来越强大的计算能力,很多课题组加入到了非模式植物的基因组从头组装工作中。但是因为不同的植物其基因组大小,复杂性和实验设计存在很大差别,高质量的基因组组装仍然存在很大挑战。随着三代测序技术的成熟,也随之产生了很多新工具。在这篇综述中,作者分析了针对基因组组装的大量新兴测序平台和技术,介绍了每一个步骤相关的背景知识,也讨论了每个选项的应用范围。同时作者也提供了流程分析决策树,帮助我们在不同需求和资源的情况下有一个合理的基因组组装工作流程。
综述文章结构:
植物基因组挑战和进展
基因组拼接的新旧技术
DNA提取方法与质量检测
流程设计
计算需求
仅使用二代测序的组装方法
仅使用三代测序的组装方法
二代三代混合组装方法
共有序列的错误矫正
gap 填充和scaffold组装
亚染色体scaffold组装
组装质量评估