宏基因组定量、功能注释和高级分析代码
The following article is from 热心肠研究院 Author 热心肠小伙伴们
今天是第1283期日报。
Nature子刊:Salmon不比对快速定量宏基因组基因
Nature Methods[IF:28.467]
① Salmon是一种准确快速定量转录本丰度的方法;② 它是第一个可校正转录组片段GC含量范围内偏差的定量工具,大大提高了丰度估计的准确性以及后续差异表达分析的可靠性;③ 新的双相并行推理算法和功能丰富的偏差模型与超快速读长映射过程结合在一起;④ 其计算速度快,硬盘空间占用少等优点,也在宏基因组基因定量中广泛应用;⑤ 软件支持多种常用安装方式,且支持多样本汇总为表格。
Salmon provides fast and bias-aware quantification of transcript expression
2017-03-06, doi: 10.1038/nmeth.4197
【主编评语】传统的定量工具采用比对的方法,对于人类几万个基因都需要消耗几小时,而面对微生物组动辄千万的基因更是费时费力。Salmon的非比策略具有速度上的极大优势,同时不会生成传播的巨型SAM格式比对文件。Salmon又是体现了出版平台对文章引用存在巨大影响的例子,该软件2015年发布在BioRxiv上面,两年只有10次引用,截止目前4年也仅有37次引用。而文章被Nature Methods接收发表后,短短两年引用高达1000多次,相同时间内引用量相差高达百倍,可见这28分的杂志确实获得了同行的广泛关注。(@刘永鑫-中科院-宏基因组)
高速宏基因组功能注释工具eggNOG-Mapper
Molecular Biology and Evolution[IF:14.797]
① 同源分配非常适合功能推断,但缺少好用的工具;② eggNOG-mapper是一种基于快速同源功能分配、可用于对宏基因组大型序列集进行功能注释的工具;③ 比BLAST方法结果的假阳性率降低了11%,比InterProScan结果的回收率提高了35%;④ 在计算时间方面,运行速度比BLAST快15倍,比InterProScan快至少2.5倍;⑤ 该工具可以单独使用,也可以作为在线服务从http://eggnog-mapper.embl.de获得。
Fast Genome-Wide Functional Annotation through Orthology Assignment by eggNOG-Mapper
2017-04-29, doi: 10.1093/molbev/msx148
【主编评语】eggNOG-mapper是一款又快又准的功能基因注释工具,比传统的BLAST或InterProScan方法的注释速度提高2到15倍,同时进一步提高了回收率和降低假阳性率,是目前宏基因组基因注释中的主流方法之一,强烈推荐。(@刘永鑫-中科院-宏基因组)
eggNOG 5—蛋白功能层级注释数据库重大更新
Nucleic Acids Research[IF:11.147]
① eggNOG是一个直系同源蛋白组功能注释数据库,在基因组、宏基因组的基因功能注释方面有较多应用;② 本次升级为eggNOG 5.0,已扩展到基于25 038个基因组中挑选了4445个代表性细菌和168个古菌,以及477个真核生物和2502个病毒蛋白质组,较之前的4.5版本数据量增加了一倍;③ 改进了eggNOG在线服务,用于定制基因组或宏基因组数据集的快速功能注释和直系同源预测;④ 可在线使用,或下载数据至本地部署,请访问 http://eggnog5.embl.de。
eggNOG 5.0: a hierarchical, functionally and phylogenetically annotated orthology resource based on 5090 organisms and 2502 viruses
2018-11-12, doi: 10.1093/nar/gky1085
【主编评语】eggNOG是一个公共数据库,包含了直接同源关系、基因进化史和功能注释。本次仅从4.5更新到5.0版,数据量就增加了一倍,共计算了分布在379个分类水平上的4.4百万个直系同源群(OGs),以及它们的相关序列比对、系统发育、HMM模型和功能描述,同时改进了在线使用的易用性。(@刘永鑫-中科院-宏基因组)
Genome Biology:人体各部位微生物组时间序列分析
Genome Biology[IF:14.028]
① 了解微生物的正常时间变化是治疗疾病的关键,但一直缺乏分析方法;② 本文对人体4个部分进行连续采样,共获得396个时间点的样本,开展时间序列分析和并提供分析方法;③ 发现身体各部位和个体间均存在稳定的差异,但微生物组在时间上也存在明显差异;④ 仅有极少的类群在所有时间点中都存在,不存在时间上高丰度的核心微生物;⑤ 本文为开展类似分析提供参考方法,同时为微生物组在疾病干预中的应用提供指导。
Moving pictures of the human microbiome
2011-05-30, doi: 10.1186/gb-2011-12-5-r50
【主编评语】此文是微生物组时间序列分析的代表作品,截止19年8月引用700多次。同时本文中的所有作者,目前基本都成为了世界各地的知名教授也是一大亮点。此文的数据,在QIIME和QIIME 2时代,同时入选为教程中的示例数据,所以刚入行的小伙伴,有必要读一下此文了解时间序列分析的基本实验设计和分析思路。(@刘永鑫-中科院-宏基因组)
除了鸟枪法宏基因组测序,我们还能做什么
mSystems[IF:6.519]
① 鸟枪法宏基因组学存在短读长组装计算繁重、群落内的菌株异质性和低丰度微生物所需的覆盖深度等问题,以下方向可有效改善这些不足;② DNA稳定同位素示踪(DNA-SIP)能够基于同位素标记底物的吸收和掺入来有针对性地富集活性微生物;③ 荧光激活细胞分选 (FACS)是一种复杂但更灵活和精确的方法,能够随机、或非随机地得到微型宏基因组;④ 长读长技术为探索可移动元件与宿主微生物细胞的关系提供了独特的机会。
Advancing Genome-Resolved Metagenomics beyond the Shotgun
05-14, doi: 10.1128/9781555819880
【主编评语】扩增子测序是使用最广泛但功能有限的入门技术、鸟枪法宏基因组正在逐渐成为本领域的主流方法,但受限技术本身多方面的限制。除了他们还有什么更好的选择吗?本文从三方面对大家将来工作的改进提出展望和指导方向,包括稳定同位素示踪技术(南土所贾仲君组有很多相关文章和提供技术培训),单细胞分选(中科院北京生科院赵方庆团队在Nature子刊发表过相关方法(https://www.mr-gut.cn/papers/read/1087459080)和综述(https://www.mr-gut.cn/papers/read/1034764561)),和三代测序及宏表观组,纽约西奈山医学院有Nature Biotechnology上有2篇相关技术应用成果的报导(https://www.mr-gut.cn/papers/read/1052032728)及Nature综述文章供学习。(@刘永鑫-中科院-宏基因组)
中科院遗传发育所揭示拟南芥二半萜对根系微生物组的调控机制
Science China-life Sciences[IF:3.583]
① 本研究中功能鉴定了十字花科保守的二半萜生物合成基因簇(GFPPS-TPS-P450);② 发现拟南芥中新进化获得的两类二半萜化合物(TPS25、TPS30)的生物合成能力,且这两种化合物特异性地在根部积累;③ 比较自然土中生长的野生型和不同突变体的根系微生物组,发现形成了显著不同的根系微生物组;④ tps25和tps30单突变体根系微生物组的变化具有比较大程度的交叉,暗示植物利用次生代谢物调控根系微生物组成可能存在构效关系。
Recently duplicated sesterterpene (C25) gene clusters in Arabidopsis thaliana modulate root microbiota
05-10, doi: 10.1007/s11427-019-9521-2
【主编评语】植物产生超过20万种代谢物(主要是指分子量小于1,000的化合物),这些代谢物在植物的生活史中发挥着重要的生理功能。由于植物是固着生长,而根系周围有大量的微生物(微生物组),长期以来人们认为植物代谢物在植物与根系微生物互作方面发挥着重要的作用。但迄今为止,关于植物如何利用自身特异的代谢物来调控根系微生物的组成还鲜有报道。中国科学院遗传与发育生物学研究所王国栋课题组功能鉴定了十字花科保守的二半萜生物合成基因簇,与白洋课题组合作发现二半萜类化合物对根系微生物组的调控能力,本研究也为深入研究植物如何利用自身特异的代谢物来调控根系微生物的组成奠定了基础,该研究发表于中国科学生命科学杂志,作者同时分享了文中菌群分析部分代码供同行参考https://github.com/microbiota/Chen2019SCLS,此文目前发表仅半年已被引用5次。同一天白洋课题组参与的关于三萜类化合物调控根系微生物组的文章发表于Science(https://www.mr-gut.cn/papers/read/1084309231)。(@刘永鑫-中科院-宏基因组)
中科院遗传发育所揭示水稻微生物组全生育期动态变化规律
Science China-life Sciences[IF:3.583]
① 在两个地点进行了全生育期田间每周连续采样,检测了446个水稻根系样品的微生物组;② 根系微生物组随水稻的生长时间和发育期逐渐变化,进入水稻的生殖生长期之后开始稳定;③ 通过机器学习领域的随机森林算法,鉴定了23类与水稻田间生长发育呈明显变化规律的根系代表性细菌,这些细菌种类在根中的丰度与水稻在田间的生长时间呈现明显的变化规律;④ 该成果说明农作物的生长时期是益生菌在农业上的施用过程中需要考虑的重要因素。
Root microbiota shift in rice correlates with resident time in the field and developmental stage
2018-03-23, doi: 10.1007/s11427-018-9284-4
【主编评语】人类体内和植物根系都存在着数量庞大种类繁多的微生物群落(微生物组)。肠道微生物组随人类年龄的演化规律关系到人们的健康。与之类似,植物根系微生物组随植物生长的变化规律对植物健康也非常重要,与农作物营养高效利用、连作、轮作等重要问题密切相关。中国科学院遗传与发育生物学研究所,植物基因组学国家重点实验室,中国科学院-英国约翰英纳斯中心植物和微生物科学联合研究中心(CEPAMS)的白洋课题组与合作者详细描述了水稻田间全生育期根系微生物组的变化规律。该成果说明农作物的生长时期是益生菌在农业上的施用过程中需要考虑的重要因素。把农作物生殖生长期需要的益生菌在幼苗期施用,效果自然不好。该成果将为水稻根系益生菌的施用提供理论支撑。该文章作为当期封面文章发表,仅一年已经引用高达16次,并提供代码 https://github.com/microbiota/Zhang2018SCLS 以及每个图片分析的详细教程,详见延伸阅读。(@刘永鑫-中科院-宏基因组)
中科院遗传发育所开发定量检测宿主微生物组的HA-QAP技术
Plant Communications[IF:N/A]
① 本文介绍一种定量植物宿主微生物组的方法HA-QAP;② 能够检测微生物相对于宿主植物的总量,利用内参将微生物和植物宿主关联起来,获得微生物相对于植物的定植量;③ 可以真实地反映微生物组相对于宿主的变化以及微生物间的互作,减少和校正了基于相对丰度产生的偏差;④ HA-QAP分析发现,在水稻和小麦中细菌和植物基因组拷贝数之比约为1.07~6.61,真菌与植物基因组拷贝数之比约为0.40~2.26,数值与细菌和人体细胞的比值(1:1)接近。
Host-associated quantitative abundance profiling reveals the microbial load variation of root microbiome
09-17, doi: 10.1016/j.xplc.2019.100003
【主编评语】健康的植物根系定植着复杂多样的微生物组,对于植物的营养吸收、胁迫适应以及疾病抵抗具有重要的作用。当前,植物根系微生物组的检测主要是基于扩增子高通量测序产生的相对丰度,却无法评估微生物相对于宿主的总量(the total microbial load)。而在微生物总量未知的前提下,经典的相对丰度分析有时会产生“欺骗性”的结果,这也是目前微生物组研究的局限。2019年9月17日,Plant Communications 在线发表了中科院遗传与发育生物学研究所白洋组和傅向东组合作完成的论文,报道了一种定量检测宿主微生物组的新技术。此外,之前Nature也报导过一种结合流式细胞术的微生物组绝对定量方法(https://www.mr-gut.cn/papers/read/1062816672)。(@刘永鑫-中科院-宏基因组)
感谢本期日报的创作者:刘永鑫-中科院-宏基因组
猜你喜欢
10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑
文献阅读 热心肠 SemanticScholar Geenmedical
16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘
写在后面
为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。
学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”