查看原文
其他

菜鸟团一周文献推荐(No.17)

生信菜鸟团 生信菜鸟团 2022-06-07

写在前面:

不知不觉,我们的「每周文献推荐」栏目已经来到了第 16 期。从这期开始,为了方便你阅读原文,我们为每篇推荐文献都增加了原文链接二维码。

在上一期分享分享中,深度学习在生物医学中面临的机会和挑战(超长综述)获得了最多的投票关注,如果你错过了可以点击下面的链接进行查看。

菜鸟团一周文献推荐(No.15)

菜鸟团一周文献推荐(No.16)

同时,欢迎你在文章最后选出最感兴趣的文章并转发推荐给你的朋友一起投票参与,笔芯



供稿人:Christine

一句话评价

你认为的潜在驱动突变可能只是因为它恰好处于易突变的位置


文章信息

题目:Passenger hotspot mutations in cancer driven by APOBEC3A and mesoscale genomic features.

杂志:Science

时间:2019 Jun 28

链接:https://science.sciencemag.org/content/364/6447/eaaw2872.long



figure


文章介绍:

通常我们假设癌症基因组中某位点上重复发生的突变不是随机事件,并以此为筛选驱动突变的一个标准。但是,“热点突变”的发生真的是因为它们对癌细胞适应性有贡献吗?目前对癌症基因组突变的分析主要分为2种尺度:1~3个核苷酸的“小尺度”(SNP),以兆为单位的“大尺度”(CNV)。有研究报道,约30个核苷酸的中等尺度DNA可以形成特殊的结构,并影响突变。本文作者在“中等尺度”下系统地分析了癌症中重复发生的突变,发现一些重复出现的乘客突变位于特殊的DNA结构中。APOBEC3A是胞嘧啶脱氨酶家族的成员,将C脱氨基形成U,是引发突变的一个重要因素。结合生化及生信分析,作者得到了APOBEC3A最适的底物,并发现位于茎环结构上的胞嘧啶突变率比茎环外的高200倍,但是这些突变与癌症并不相关;相反,茎环外的许多突变却与癌症相关。作者得出结论,癌症中“热点“突变的形成方式很多,可能是它确实有利于癌细胞的生存,也可能只因为是它恰好处于一个易突变的DNA结构中。



供稿人:鲍志炜

一句话评价


用于追溯微生物组来源的新工具


文章信息


题目:FEAST: fast expectation-maximization for microbial source tracking

杂志:Nature Methods

时间:10 June 2019

链接:https://doi.org/10.1038/s41592-019-0431-x



figure



文章介绍


微生物组数据库的空前扩展,使我们对微生物的各种功能和分布及其对人类健康的影响有了进一步的了解。这些丰富的数据集也使我们得以研究不同生境中分类群丰度之间的关系。尽管如此,分析微生物群落一个关键挑战在于它们中的每一个群落通常由若干不同的微生物环境组成,包括不同的污染物以及与采样的地点相互作用的其他微生物群落。目前,虽然已有一些软件用于微生物来源追踪,但他们仍存在一些不可忽视的缺点,比如,一些早期的方法通常将背景局限于固定的污染源,重点在于仅检测特定的污染物种。即使是广泛使用的 SourceTracker 软件,由于其基于马尔可夫链蒙特卡罗方法(MCMC),所以仅适用于具有少量来源的中小型数据集。


为了解决这些局限性,作者开发了快速期望最大化微生物源追踪(FEAST)的方法。FEAST通过一种自然,可扩展的统计模型量化目标微生物群落中每个源环境的比例,同时速度比目前最先进的方法快30-300倍,在某些情况下,它可以将运行时间从几天或几周缩短到几小时。FEAST的计算效率使其能够及时同时估算数千个潜在的来源环境,从而帮助研究者解密复杂微生物群落的起源。此外,特别是当目标微生物群落包含来自未知的分类群时,FEAST 比以前的方法更加准确。( FEAST 将集成于 QIIME2 的 7 月更新中)


GitHub 地址:https://github.com/cozygene/FEAST



供稿人:lakeseafly

一句话评价

了解植物R基因的聚集模式帮助我们了解其抵御原理


文章信息

题目:Stronger When Together: Clustering of Plant NLR Disease resistance Genes

杂志:Trends in Plant Science

时间:June 29,2019

链接: https://doi.org/10.1016/j.tplants.2019.05.005



figure

病原体效应子间接识别和NLR激活的三种模型:


文章介绍:


摘要


基因聚集在真核生物中并不常见。然而,nucleotide-binding leucine-rich repeat (NLR)-encoding的抗病基因(又称为R基因)通常在植物基因组中存在聚集的现象。这样的基因排序是很可能可带来与核心控制相关的好处,越来越多地证据正在表明,大量的NLRs聚集能够促发免疫反应。这种基因聚集的排列形式,可以形成头对头的R基因对。其中有的R基因包含引诱区域可以表现出具有和其它R基因不同的行为。这些奇特的模式导致了植物基因广泛性的抗病能力,尽管R基因的数目是有限的。通过了解R基因排列和功能之间的关系,可以提高我们对植物免疫发生的理解,并且更好地培育出更多具有抗病的作物。


个人体会


关于R基因的综述有很多,但是这篇新的综述从R基因聚集的角度来探讨了R基因的作用原理,并讨论了基因不同聚集的模式对其功能的影响,最后简单介绍了一下转录因子在R基因聚集的角色。这篇综述非常适合对植物抗病原理研究的小伙伴一读。



供稿人:lakeseafly

一句话评价

新型高效地SV探测工具


文章信息

题目:svtools: population-scale analysis of structural variation

杂志:Bioinformatics

时间:July 2019

链接: https://doi.org/10.1093/bioinformatics/btz492



figure

svtools 工作流程


文章介绍:


摘要

大规模的人类遗传学研究现在基本都基于全基因组测序,对所有形式的基因组变异进行综合地分析。然而,目前结构变异(SV)分析的方法远远落后于较小的规变异(SNPs等)的方法,迫切需要开发适用于更大群体的工具。在这里,研究者提供了一个快速,高度可扩展的软件工(svtools)和基于云的流程,用于从大群体规模人群中组装高质量的SV,包括deletions, duplications, mobile element insertions, inversions, and other rearrangements等变异。该流程与已建立的基于每个样本相似的变体检测方法(例如,LUMPY)具有相似地性能,同时提供≥100,000基因组的快速且高效的分析流程。这些工具将有助于促进下一代人类遗传学研究的发展。


svtools是一个实用程序,旨在帮助生物信息学家构建和探索群体中结构变异。它旨在有效地将来自speedseq sv的适用合并到数千到数万个基因组中并对其进行基因分型。关于该工具更详尽的

介绍可以去其Github:https://github.com/hall-lab/svtools中具体查看,里面也含有相应的测试数据以供大家去学习该工具。




大侠,别忘了先投票再转发

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存