查看原文
其他

NAR︱薛宇团队开发热图绘制及富集分析在线服务平台

The following article is from 岚翰生命科学 Author 魏宇翔


来源︱“逻辑神经科学”姊妹号:“岚翰生命科学”

撰文︱魏宇翔

责编︱王思珍

编辑︱杨彬伟


随着高通量组学技术产生的大生物数据的快速增长,对多维和数字数据的可视化需求迫切增加。如何快速、直观地检索大数据中包含的信息变得越来越重要[1]热图heatmap可以用颜色代表数字,一幅简洁、精巧、精确的热图比单纯的文字描述有很大的优势[2]然而,对大多生物学家来讲,很难通过代码生成高质量的热图。


富集分析(enrichment analyses)可以找出差异表达的基因所显着富集的功能类别,生物学家经常在数据聚类和热图说明后对选定的基因进行富集分析[3,4]。因此,能够快速简单地生成热图并能对数据进一步分析具有重要的科研意义。


2022年6月7日,华中科技大学生命学院薛宇教授团队在国际著名期刊Nucleic Acids Research发表题为“HemI 2.0: an online service for heatmap illustration”的论文,提供了一款可以快速生成高质量热图和聚类,并对差异基因进行富集分析的在线服务



如今,高通量组学技术产生了大量的生物学数据。组学数据的可视化对于回答广泛的生物学问题至关重要。热图中二维数据矩阵的可视化是一种简单但有效的数据分析和解释方法(图1A, B)。矩阵中的值可以表示任何可测量的属性,例如生物分子表达值。


通过HemI 2.0生成的热图

(图源:Wanshan Ning, et al.Nucleic Acids Res, 2022


2014年,一个基于JAVA的独立软件包HemI 1.0为不熟悉编程的生物学家提供了便捷的热图生成方法[2]。在HemI 1.0中,实现了3种聚类方法和7种距离度量,热图可以以自定义方式可视化、重新着色、重新缩放、旋转或导出[2]。在过去的几年中,HemI 1.0已经成为生物学家常用的一个工具,许多用户与作者进行了交流,并指出了该工具的优缺点。根据用户的需求和建议,作者对HemI进行了重大改进,开发了基于HTML5的在线服务,其中包括7种聚类方法和22种距离度量。为了进一步的数据分析,薛宇团队编辑了15种类型的功能注释,并添加了一个基于12种模式生物的超几何测试的富集分析选项,以及富集结果的可视化。特别的是,HemI 2.0可以下载高质量热图、聚类结果和富集分析结果,以供学术使用。


HemI 2.0支持多种文件格式的数据加载,包括Microsoft Excel工作表(.xls or .xlsx),文本文件(.txt)和字符分隔值文件(.csv)。文件上传后,数据将会在网页生成一张可交互的表格,通过点击选择范围或更改行列标签后(图2A),单击“Submit”按钮即可快速出图。HemI2.0的热图默认参数可适配广泛的场景,用户也可以单击“Heatmap Settings”按钮(图2B),以自定义方式轻松操纵生成的热图。如需以行和列对相应的数据进行聚类,用户可以通过单击“Clustering Settings”按钮来选择聚类方法和距离度量(图2B)。在“HEATMAP DISPLAY”页面的表格中,用户不仅可以通过鼠标右键点击行或列标签,将最多三层注释添加到热图中,而且可以通过鼠标左键单击一个或多个行标签来选择用于显示热图的基因或蛋白质,以进行进一步的富集分析。


HemI 2.0提供输入框,支持用户自定义添加基因或蛋白质到待进行富集分析的列表中。选择物种和功能注释后,点击“Enrichment Analysis按钮即可进行富集分析(图2C)。富集分析的结果将以表格形式展现在网页,用户通过点击表格选择通道后即可得到5种常用的可视化结果。如有需求,点击“Graphics Settings”按钮(图2D),可自定义重新调整图片。


通过HemI 2.0生成的热图

(图源:Wanshan Ning, et al.Nucleic Acids Res2022


HemI 2.0免费向所有人服务(https://hemi.biocuckoo.org/),关于HemI2.0的使用教程以及各种方法和注释请参照(https://hemi.biocuckoo.org/documentation/)。


文章结论与讨论,启发与展望
综上所述,该工具为众多生物学家提供了简单易操作的生成热图和聚类的方法,并且可以进一步对数据进行富集分析。HemI 2.0丰富的自定义设置可以满足绝大多数用户的需要,聚类结果和富集分析结果支持文档和图片多种方式下载。目前,HemI 2.0还存在一些不足。比如HemI 2.0仅支持数据矩阵热图,还不能处理基于图像的热图,如choropleth map和geospatial heatmap。未来,作者将包括更多的热图可视化类型,并在下一版本的HemI中实现实时交互。此外,网页仅提供了15种富集分析方法。在不久的将来,将包括更多的基因集和更多的富集分析方法。


原文链接:https://doi.org/10.1093/nar/gkac480 


通讯作者薛宇教授

(照片提供自华中科技大学生命学院薛宇团队)


人才招聘
【1】人才招聘︱“ 逻辑神经科学 ”诚聘文章解读/撰写岗位 ( 网络兼职, 在线办公)【2】“ 逻辑神经科学 ”诚聘副主编/编辑/运营岗位(在线办公)【3】“ 逻辑神经科学 ”诚聘编辑/运营岗位 ( 在线办公)
往期文章精选【1】Nat Neurosci︱刘胜/刘奕志/向孟清团队研究证实成年灵长类存在活跃的神经发生现象【2】Mol Psychiatry︱石云/杨建军/柳娜团队揭示谷氨酸受体缺陷引起人类攻击行为的新机制【3】Alzheimers Dement︱申勇团队提出中国阿尔兹海默病的血液诊断新标准【4】Nat Commun︱全舒/薛毅/吴斌团队合作揭示分子伴侣如何不消耗能量而释放底物的机制【5】Nature︱新靶点!冯国平团队揭示靶向丘脑回路拯救帕金森病小鼠运动和情绪缺陷【6】Sci Adv︱刘际团队揭示下丘脑GLP-1信号通过下行迷走神经环路调控血糖代谢的神经机制【7】STAR Protocols︱巫凌刚团队提出新型实时可视化方案观测活细胞内胞吞胞吐的膜动态变化【8】Nat Genet︱最新发现:自闭症表型异质性的遗传相关性【9】Nat Neurosci︱睡眠具有社会性:青少年睡眠与社会互动行为之间的发展联系【10】Frontiers Aging Neurosci︱褪黑素治疗帕金森病睡眠障碍
优质科研培训课程推荐【1】膜片钳与光遗传及钙成像技术研讨会 8月6-7日 腾讯会议【2】单细胞测序与空间转录组学数据分析研讨会(6月18-19日 腾讯在线会议)


参考文献(上下滑动阅读)  


1. Meyer,R.D. and Cook,D. (2000) Visualization of data. Curr. Opin. Biotechnol.11, 89–96.

2. Deng,W., Wang,Y., Liu,Z., Cheng,H. and Xue,Y. (2014) HemI: a toolkit for illustrating heatmaps. PLoS One9, e111988.

3. Liu,X., Hu,P., Huang,M., Tang,Y., Li,Y., Li,L. and Hou,X. (2016) The NF-YC-RGL2 module integrates GA and ABA signalling to regulate seed germination in Arabidopsis. Nat. Commun.7, 12768.

4. Chung,K.P., Hsu,C.L., Fan,L.C., Huang,Z., Bhatia,D., Chen,Y.J., Hisata,S., Cho,S.J., Nakahira,K., Imamura,M. et al. (2019) Mitofusins regulate lipid metabolism to mediate the development of lung fibrosis. Nat. Commun.10, 3390




本文完








您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存