iMeta | Sangerbox: 交互式整合临床生信分析平台
点击蓝字 关注我们
Sangerbox:交互、友好的整合临床生信分析平台
https://doi.org/10.1002/imt2.36
●2022年7月8日,哈尔滨医科大学宋湘团队联合杭州慕谷科技有限公司在iMeta 发表了题为“Sangerbox: A comprehensive, interaction-friendly clinical bioinformatics analysis platform”的文章。
● Sangerbox (http://vip.sangerbox.com)是基于网络的工具平台,用户可以在一个友好的交互页面中进行不同的分析。平台提供可交互的图形化分析工具,包括相关性分析工具,通路富集分析、WGCNA分析等常见的工具和功能。
● 第一作者:沈玮涛、宋紫光、钟晓
● 通讯作者:宋湘(song761231@sina.com)
亮点
● Sangerbox界面友好,支持差异分析、相关分析、通路富集分析、加权相关网络分析等
● 一种新的交互式绘图系统,允许用户调整图像中的参数,如直接拉伸、移动图表元素,导时矢量图等
●组织了GEO、TCGA、ICGC等数据库, 快速批处理降低了数据获取的难度,大大提高了效率。
基于Google Scholar统计,“Sangerbox”截止2022年7月23日被引532次,2022年上半年被引245次,每天至少助力一篇文章发表。
全文解读
近十几年以来,随着高通量测序技术的不断发展,医学研究中的数据体量不断增大,数据囊括的范围也越来越广,在不断产生庞大的公共测序数据的同时,几乎每一位临床研究者都拥有一份自己独立的组学数据,这为数据挖掘和更深入的了解基因功能创造了很好的条件。但对于这些数量庞大的数据,许多不论是常见的或是前沿的有效的生物信息研究方法仍然无法被广泛应用。这促使了许多分析平台的产生,有一部分数据库或平台旨在解决的用户的特殊分析需求,例如为了特定组学建立的网站平台MG‐RAST, IMG/M, Qiita, BIGSdb, TRAPR, imageGP和MetOrigin,还有一些为解决特定问题分析而设计的,例如Metascape旨在提供基因的功能注释和功能富集分析;BioNumerics和RidomSeqSphere+为了执行多位点序列分型设计;CARD仅提供抗菌素耐药性注释。此外,还有一部分网络服务功能比较陈旧,同时交互效率低下往往不能满足研究人员的精细个性化需求。因此海量的数据处理任务需要被完成,并且一个综合的生物信息分析平台亟待完成。
我们开发了Sangerbox (http://vip.sangerbox.com),一个基于网络的工具平台。用户可以在一个友好的交互页面中进行不同的分析。平台提供可交互的图形化分析工具,包括相关性分析工具,通路富集分析、WGCNA分析等等常见的工具和功能(图1)。用户只需要上传他们对应的数据到网站云端,输入需要的参数,等待计算完成后即可获得结果。我们还建立了全新的互动式绘图系统,这个系统允许用户在画面中直观的调整参数。同时,我们还优化绘图工具的性能,这一点允许用户在网页中调整大容量的矢量图的工具。除此之外,我们还整合了GEO、TCGA和ICGC等数据库,并且对这些数据进行了快速批量处理,大大降低用户获取数据难度的同时提高了生信分析中数据处理的效率。最后我们还提供丰富的生信分析课程资源,为研究人眼提供了一个分享和交流的知识的平台。
图1. Sangerbox的框架和内容
便捷、强大、可交互的分析和绘图工具
Sangerbox平台的分析及绘图工具加速了研究人员分析数据的效率,提高了公共资源和个人数据的利用率,有利于临床研究。长期以来,生物信息分析对于临床和专业实验的研究人员来说一直都是难以入门的,无论是代码变成技能、数学代数知识或是统计学、概率学都需要长时间的积累,如果每项技能都从头开始,需要研究人员付出大量努力和时间。其次,许多分析过程中需要高性能的网络、存储、计算服务,不少分析中,计算量不是个人电脑能够承受的。
Sangerbox提供了一个仅需了解工具分析原理和分析目的就可以进行计算的平台,平台中超过40中不同类型的工具可以更高效的帮助科研人员完成分析(图2),简化学习过程,降低学习成本,同时加快数据处理过程,消化不断增长的海量生物数据。同时平台拥有远远优于更个人电脑性能的云端服务器,可以完成更多个人电脑无法完成的分析类型,可以让研究人员轻松地突破计算力和分析方法的限制,完成对数据量更大、资源要求高、更复杂方法的应用。该平台还提供了一个可视化网页界面,研究人员可以通过输入自己的生物数据和设置参数来使用绘图工具和生物信息学分析工具。目前,Sangerbox平台集成了100多种常用的计算分析方法,提供的工具约40余种,涵盖统计、分析、可视化三大类工具。
绘图工具中涵盖了常见的图表类型,如森林图、雷达图、热图、小提琴图、箱线图、韦恩图和弦图等。绘图工具在提供绘制功能的同时还附带常用的一般统计信息,并允许用户在一些特定图表工具中选择组内或组间的参数或非参数检验等。其次,Sangerbox的绘图系统还对数据输入的格式进行了调整,更加符合一般用户的习惯,让绘图变成更加轻松方便。最后我们还对绘图工具进行了性能上的优化,让用户可以高效快速的使用,并且允许一些配置较低的电脑上运行大容量的矢量图。
对比一些常用的工具软件包,例如ggplot2,complexHeatmap等,Sangerbox的绘图工具在功能得到进一步加强的情况下还更加简单易于操作。
Sangerbox平台还为用户提供了多种广泛使用的生物信息分析工具,包括文本处理和数据标准化处理工具;数据分析包括降维、聚类、差异分析等以及一些常见的生物信息分析,例如加权相关网络分析(WGCNA)、生存分析、基因集富集分析(GSEA)等。Sangerbox将根据用户的不同需求不断改进工具、更新更多方法和统计数据,让Sangerbox的用户可以更高效的处理更多的临床生物数据、进而为临床研究发出贡献。
图2. 工具箱结果展示
强大的可交互可视化界面
为了获得更好的用户体验,我们开发了全新的可视化交互系统,不在需要繁琐的编程代码和复杂的参数设置(图3)。我们的系统基于D3.JS和jQuery.JS建立,使用JavaScript设计的交互式可视化界面允许用户通过鼠标点击、选择、拖动等操作,直观快速的获得矢量图形,从而实现“所见即所得”的目标。
同时,Sangerbox支持用户导出多种不同格式的位图或矢量图,以进一步支持用户的需求。
此外,矢量图绘制、计算需要占用大量绘图性能,为了让不同工作环境下的研究人员都能够良好的体验,我们优化了图像的性能,让用户能够在较低算力的情况下快速使用并调整大容量的图形。
图3. 堆叠柱状图可视化界面示例
公开数据的下载和处理
Sangerbox平台支持更轻松快速的下载公共数据,同时可以对数据进行批量处理,这有利于研究人员的数据研究工作。这些数据来自The Cancer Genome Atlas (TCGA)、International Cancer Genome Consortium (ICGC)、Gene Expression Omnibus (GEO) 和其他一些包含随访数据、临床数据、突变数据和表达谱数据等的数据库。
Sangerbox还为来自NCBI的GEO中的表达谱数据提供了快速预处理功能,用户可以直接获得重注释、标准化等预处理后的数据。同时整合了TCGA、ICGC、TARGET(therapeutically applicable research to generate effective treatments)等数据库的全新目录,更符合一般科研者的使用习惯,可以帮助用户降低数据获取的门槛。
Sangerbox还构建了完成的课程分享平台。在提供录屏课程的同时还有一些在线直播课程。包括帮助科研者熟悉平台操作,介绍分享某些领域的前沿研究方法和研究趋势。
引文
Weitao Shen, Ziguang Song, Xiao Zhong, Mei Huang, Danting Shen, Pingping Gao, Xiaoqian Qian, Mengmeng Wang, Xiubin He, Tonglian Wang, Shuang Li, Xiang Song. 2022. Sangerbox: A comprehensive, interaction-friendly clinical bioinformatics analysis platform. iMeta 1: e36. https://doi.org/10.1002/imt2.36
作者简介
宋湘(通讯作者)
●博导,哈尔滨医科大学教授,上海浦东新区周浦医院心研所主任
●目前是上海健康医学院附属周浦医院学术骨干和学科带头人,国家自然科学基金委员会评委及Frontiers in Renal and Epithelial Physiology杂志编委。长期致力于心血管病心力衰竭方面的研究,其中一些研究在相关领域原创性提出新的概念,首次发现并克隆出心脏尿素转运蛋白,将其新命名为UT-A7,开展UT-A7的研究获得国家自然科学基金的资助。近5年作为项目负责人主持包括国家自然科学基金2项、教育部归国留学人员科研启动金及省部级课题多项。以第一作者或通讯作者发表SCI 收录学术论文16篇,其中第一作者6篇,通讯作者10篇,影响因子累积超过50。目前围绕于性激素与心血管疾病的研究并已取得一些进展。
沈玮涛(共同第一作者)
● 杭州慕谷科技研发部,现已在Nucleic Acids Research , NEURO-ONCOLOGY等杂志发表SCI论文7篇
宋紫光(共同第一作者)
●哈尔滨医科大学博士研究生,已在Frontiers in cardiovascular medicine,Frontiers in public health,Journal of Cardiovascular Translational Research等杂志发表论文5篇
钟晓(共同第一作者)
●哈尔滨医科大学博士研究生。现已在Clinical and Experimental Pharmacology & Physiology,MICROVASCULAR RESEARCH杂志发表SCI论文2篇
相关推荐
杭州慕谷科技有限公司
●杭州慕谷科技有限公司是一家生物信息学技术公司,致力于将生物信息学大数据平台充分应用于癌症等重大人类疾病的诊断和治疗,为医生的临床研究和诊断治疗提供新型解决方案,我们的产品方向包括基于出版物数据的基因知识挖掘、基因数据分析的平台(SangerBox)和基因标志物的发现。
近年来企业研发团队和国内外高水准专业医院,共同完成了500多项基于生物信息学的分子标志物挖掘研究,并积累了大量的研发成果,涉及包括糖尿病,肥胖,特异性皮炎,多种实体瘤,类风湿关节炎等疾病
更多推荐
(▼ 点击跳转)
iMeta文章中文翻译+视频解读
iMeta封面 | 宏蛋白质组学分析一站式工具集iMetaLab Suite(加拿大渥太华大学Figeys组)
▸▸▸▸
iMeta | 东农吴凤芝/南农韦中等揭示生物炭抑制作物土传病害机理
▸▸▸▸
iMeta | 华南农大陈程杰/夏瑞等发布TBtools构造Circos图的简单方法
▸▸▸▸
iMeta | 叶茂/时玉等综述环境微生物组中胞内与胞外基因的动态穿梭与生态功能
▸▸▸▸
iMeta | 南农沈其荣团队发布微生物网络分析和可视化R包ggClusterNet
▸▸▸▸
iMeta | 华南师大王璋组综述人体肺部微生物组与人类健康和疾病之间的隐秘关联
▸▸▸▸
iMeta | 南科大夏雨组纳米孔测序揭示微生物可减轻高海拔冻土温室气体排放
▸▸▸▸
iMeta | 北大陈峰/陈智滨等发表口腔微生物组研究中各部位取样的实验方法(Protocol)
▸▸▸▸
iMeta | 华南农大曾振灵/熊文广等-家庭中宠物犬与主人耐药基因的共存研究
▸▸▸▸
iMeta | 深圳先进院马迎飞组开发基于神经网络分析肠道菌群的方法
▸▸▸▸
iMeta | 南医大陈连民等综述从基因组功能角度揭示肠菌对复杂疾病的潜在影响
期刊简介
“iMeta” 是由威立、肠菌分会和本领域数百位华人科学家合作出版的开放获取期刊,主编由中科院微生物所刘双江研究员和荷兰格罗宁根大学傅静远教授担任。目的是发表原创研究、方法和综述以促进宏基因组学、微生物组和生物信息学发展。目标是发表前10%(IF > 15)的高影响力论文。期刊特色包括视频投稿、可重复分析、图片打磨、青年编委、前3年免出版费、50万用户的社交媒体宣传等。2022年2月正式创刊发行!
联系我们
iMeta主页:http://www.imeta.science
出版社:https://onlinelibrary.wiley.com/journal/2770596x
投稿:https://mc.manuscriptcentral.com/imeta
邮箱:office@imeta.science
微信公众号
iMeta
责任编辑
微微