人类基因组中最广泛的 DNA 甲基化为5-methylcytosine (5mC),而细菌中有三种常见的 DNA 甲基化: N6-methyladenie (6mA), N4-methylcytosine (4mC) 和 5mC。2012 年, 纽约西奈山医学院房刚和团队第一次利用三代单分子实时测序技术(Pacific Biosciences, PacBio)绘制细菌 6mA 表观基因组,并发现 6mA 可以直接或间接调解调节大肠杆菌 1000 多个基因的转录水平 【1】。在过去的九年里,>4000株细菌的表观遗传组被破译:95%的细菌有DNA甲基化;平均每个细菌有三个不同的活跃的DNA甲基化酶和对应的甲基化识别序列(methylation motifs),最多的有20多个,比如幽门杆菌【2】。
2018年,西奈山伊坎医学院房刚课题组在Nature Reviews Genetics上发表了一篇综述【3】详细的总结各种测序技术,尤其是第三代测序技术在细菌表观遗传组研究中的应用,以及表观遗传学在细菌基因表达和致病菌中的多种重要功能。
2021年4月5日,房刚课题组在Nature Methods发表文章Discovering multiple types of DNA methylation from bacteria and microbiome using nanopore sequencing,开发了新方法NanoDisco,利用纳米孔测序同时检测多种细菌DNA甲基化基序(motifs),并利用细菌DNA甲基化多样性增强菌群分析分辨率。
1. 对纳米孔测序检测DNA甲基化的深入理解: 迄今为止 >4000株被破译的细菌的表观遗传组几乎完全是基于PacBio三代测序平台的。此平台对细菌中的6mA和4mC基序有非常高的可靠度和灵敏度,而对5mC的检测效率不佳。另一种三代测序技术,(Nanopore 纳米孔测序)已在人类基因组5mC检测中逐渐广泛使用,但是现有的技术大多专门针对于CpG 中的5mC检测。房刚课题组通过对大量细菌5mC基序的分析发现不同序列基序中的5mC在纳米孔测序中的信号有很高的异质性 (图1);同样,6mA和4mC信号也存在很高的异质性。也就是说,现有的针对CpG 5mC(或少量具体序列)的纳米孔测序检测方法并不能有效适用于更广泛的DNA甲基化检测,即无法有效的检测细菌中常见的三种DNA甲基化。图1:不同序列motif中的6mA, 4mC 和 5mC在纳米孔测序中的信号有很高的异质性。2. 从头(De novo)发现细菌三种DNA甲基化的新方法。细菌DNA甲基化分析的第一步是从头找出全部甲基化基序(methylation motifs)。大家比较熟悉的是大肠杆菌中广泛存在的G6mATC, C5mCWGG。平均来说,每个细菌菌株有三个不同的甲基化基序, 但多的有20多个,比如幽门杆菌。对一个未知的基序, 需要识别出具体甲基化类型(6mA, 4mC, 或5mC)并找到被甲基化的碱基 (图2)。考虑到细菌DNA甲基化的一些特性,新方法NanoDisco的设计使用了一个多标签分类的机器学习架构。经过大量的验证,NanoDisco可以可靠的从头找到细菌和菌群中的6mA, 4mC, 5mC基序和其中的甲基化位点。作者认为这一功能会大大帮助更广泛的、更完整的研究细菌DNA甲基化。的确,从实际细菌和菌群样本中,文章还发现很多细菌其实存在多个5mC 基序,远超出之前研究的估计,从而创造很多新的研究机遇。图2:新的方法NanoDisco同时解决了利用纳米孔测序de novo发现DNA甲基化motifs遇到的两个根本问题:1)识别出甲基化类型(methylation typing);2)找到motif中具体被甲基化的碱基(fine mapping)
图3:同时利用三种细菌DNA甲基化多样性作为天然条形码(natural epigenetic barcode)进行高分辨率的宏基因组分析
文章还对两个常见的三代测序技术进行比较:PacBio的三代测序技术不擅长在多样序列基序中检出5mC,但对于细菌6mA和4mC基序的检测,PacBio测序还是优于纳米孔测序的,即两个平台仍是互补关系;研究者应当根据具体问题选择测序平台。文章还强调NanoDisco侧重于motif层面的细菌甲基化分析而非单个甲基化位点的分析,因为对于后者来说纳米孔测序的精准度在不同motifs之间的高低差别很大。https://github.com/fanglab/nanodiscohttps://nanodisco.readthedocs.io/en/latest/overview.htmlhttps://nanodisco.readthedocs.io/en/latest/faq.html (当中值得一提的是:作者强调该方法专注于细菌和菌群的分析,并不建议其在真核生物中使用)
课题组网页:http://fanglab.bio/https://doi.org/10.1038/s41592-021-01109-3
[1] Fang G, Munera D, Friedman DI, Mandlik A, Chao MC, Banerjee O, Feng Z, Losic B, Mahajan MC, Jabado OJ. 2012. Genome-wide mapping of methylated adenine residues in pathogenic Escherichia coli using single- molecule real-time sequencing. Nat Biotechnol 30: 1232–1239.[2] Sánchez-Romero, María A., and Josep Casadesús. "The bacterial epigenome." Nature Reviews Microbiology 18.1 (2020): 7-20.[3] Beaulaurier J, Schadt EE, Fang G, Nature Reviews Genetics, 20, pages157–172(2019)[4] Beaulaurier J, Zhu S, Deikus G, Mogno I, Zhang XS, Davis-Richardson A, Canepa R, Triplett EW, Faith JJ, Sebra R, Schadt EE & Fang G, Metagenomic binning and association of plasmids with bacterial host genomes using DNA methylation, Nature Biotechnology, 10.1038/nbt.4037, 2018[5] Oliveira PH, Kim A, Sekulovic O, Garrett EM, Trzilova D, Mead EA, Pak T, Zhu S, Deikus S, ..., Patel G, Wallach F, Hamula C, Huprikar S, Roberts RJ, Schadt EE, Sebra R, van Bakel H, Kasarskis A, Tamayo R, Shen A#, Fang G#, Epigenomic characterization of Clostridioides difficile finds a conserved DNA methyltransferase that mediates sporulation and pathogenesis, Nature Microbiology, 5, pages 166–180, 2020猜你喜欢
10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑
系列教程:微生物组入门 Biostar 微生物组 宏基因组
专业技能:学术图表 高分文章 生信宝典 不可或缺的人
一文读懂:宏基因组 寄生虫益处 进化树
必备技能:提问 搜索 Endnote
文献阅读 热心肠 SemanticScholar Geenmedical
扩增子分析:图表解读 分析流程 统计绘图
16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
在线工具:16S预测培养基 生信绘图
科研经验:云笔记 云协作 公众号
编程模板: Shell R Perl
生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘
写在后面
为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。
学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”
点击阅读原文,跳转最新文章目录阅读