查看原文
其他

iMeta | OmicStudio:一款可组合的、即时反馈的可生成高质量的发表级图表的生物信息云平台

运营部-LFY iMeta 2023-06-29

点击蓝字 关注我们

OmicStudio: 可组合的高品质生物信息学云平台

iMeta主页:http://www.imeta.science

研究论文

● 原文链接DOI: https://doi.org/10.1002/imt2.85

 2023年2月6日,杭州联川生物技术股份有限公司方超团队在 iMeta 在线发表了题为 “OmicStudio: A composable bioinformatics cloud platform with real-time feedback that can generate high-quality graphs for publication ” 的文章。

● 本研究提供了一个基于云技术的生物信息学平台:OmicStudio。该云平台能够快速获取生信分析的图表结果,生成高质量的图表供发表,并自动与下游分析模块连接。此外,不受开发者审美的限制,用户可以自定义定制更优雅的图形。模块化设计,让用户在不同的应用场景下获得最舒适的体验。

● 第一作者:吕枫烨

● 通讯作者:方超 (cfang@lc-bio.com)

● 合作作者:韩斐然、葛长利、毛维康、陈丽、胡惠鹏、陈果果、郎秋蕾

 主要单位:杭州联川生物技术股份有限公司

亮   点

● OmicStudio能够快速获取生信分析的图表结果,生成高质量的图表供发表,并自动与下游分析模块连接

● 此外,不受开发者审美的限制,用户可以自定义定制更优雅的图形

● 模块化设计,让用户在不同的应用场景下获得最舒适的体验

摘   要

近十年来,基于云技术的生物信息学平台不断涌现,如Qiita[1]、EasyMAP[2]、MG‐RAST[3]、gcMeta[4]、ETCM[5]、Sangerbox[6]、antiSMASH[7]、EVenn[8]、Majorbio Cloud[9]等。这些平台极大地促进了生物、医学和宏基因组学的研究,为大数据提供了新的视角。他们有的部署了各种独立的工具[10-15],有的提供了完整的分析流程[16-20]。这些云平台的主要亮点是将复杂的编码工作转换为易于使用的基于网页的工具。它们的开发目的是简化操作流程,往往假设用户在操作时对于生物信息知识已经有足够的认知,但是往往忽视了真实的使用场景是,用户是一边使用一边学习的,同时还期望通过简易的操作获得达到发表水准的图表。

视频解读

Bilibili:https://www.bilibili.com/video/BV18Y4y1D7cx/

中文翻译、PPT、中文视频解读等扩展资料下载

请访问期刊官网:http://www.imeta.science/

全文解读

引  言

在这里,我们展示了OmicStudio云平台(https://www.omicstudio.cn/)的整体框架和每个独立模块。它不仅是一个提供高通量组学数据的一站式在线分析平台,还是一个探索性的生物信息学习平台。它可以实现快速获得结果、进行探索研究、获得高质量的发表级图表、自动关联下游分析模块等功能,兼具速度、质量和灵活度。总之,不仅能满足用户日常生物数据处理、统计和可视化需求,同时让用户能更自由地挖掘数据不受限于开发者的框架,并且获得更精美的可自行调整的分析结果而不受限于开发者的审美。

从网站框架上说,它拥有一般生信云平台都有的配置,如云工具、云分析、组学课程和资料中心等,为用户提供完整的生物信息服务。它自2019年初成立开始,已有用户3万多人,发表文章200多篇,涉及多组学领域。这表明一款低使用门槛、高质量结果输出的云平台可以为科研工作提供更多助力。

结  果

OmicStudio由六个模块组成,分别是云工具、云分析、云课堂、资料中心、用户文章和用户中心。云工具和云分析是生物信息学分析功能的主要组成部分。云课堂和资料中心帮助用户了解和学习生物信息学。用户文章收录了与联川生物合作发表的论文,供用户参考。用户中心是用户项目信息的集成管理模块。云平台的核心功能是云工具和云分析。主要的区别是云工具专注于简短、快速的分析,而云分析可以支持耗时的分析,并有一个项目管理后台。这两个模块的区别在于分析的性质:数据量大、计算复杂的分析需要能够在后台运行,以便用户可以离开网页,做自己的事情;简单的分析需要即时的结果,并且可以立即个性化。基于此考虑,模块设计可以让用户在不同的应用场景下获得最舒适的体验。其他模块服务于这两个核心模块。云课堂和学习资料中心分别以视频和文本的形式提供运行生物信息学分析的基础知识。用户中心管理分析结果,用户文章为新用户提供文章写作参考。OmicStudio云平台主要功能的创新性和特点将在后面说明。

根据组学类型和应用场景,云工具分为:通用组学、单细胞组学、富集分析、通用分析、数据库等(图1)。图1显示了OmicStudio中关于云工具和云分析的概述。

图1. 概述OmicStudio云工具和云分析

颜色表示不同的组学。粉色:通用组学;蓝色:单细胞;绿色:富集分析;黄色:普通分析;紫色:数据库;橙色:相关性;蓝紫色:微生物组;深蓝色:肿瘤WES。图标的形状表示工具类别:圆形-云工具,侧重及时响应与个性化调整;方形-云分析,可以后台运行,针对耗时较长的生信分析。 

OmicStudio特点

即时反馈的参数调整效果

一般的生信网站工具使用的是“先设置参数,再开始分析”的原则。这里的第一个问题在于要求用户在不明确设置后果的情况下就需要先做出判断,这是反人性的。大多数人的学习过程是“调整→查看结果→再调整→再查看结果......”如此反复循环。一般的生信网站在填写完参数并确认分析后会进入后台查看结果,再次调整需要返回之前的页面重新填写再回到后台查看结果,这就让这个过程变得无比漫长且需要大量重复操作。这里的第二个问题在于,对于不熟悉生信的人,他们不了解参数与结果的对应关系,无法将他们脑海中期望的效果与特定参数对应起来,所以要么花费大量的时间去学习与他们目标无关的参数的含义,要么花费大量的时间重复上述操作。这里的第三个问题在于,生物信息网站的开发标准并不统一,对于用户来说,学习一个网站的生信工具都是有时间成本的,所以为了避免引起用户的排斥,一个生信工具的功能往往被阉割,以求用户可以花费合理的时间获得期望的结果,但是这么做既会限制用户的认知(他们不知道他们简单的生信操作背后隐藏了多少关键信息),也限制了平台往更全能的方向发展,提供更个性化的生信工具满足更多高级的科研需求。

OmicStudio云平台的开发思路是“及时反馈”。用户可以在当前页面看到参数调整结果。这大大缩短了用户的调试成本,还非常生动地帮助用户理解参数与结果的对应关系,使枯燥的数据分析变成了一项游戏,在游戏中充分理解生物信息,理解这个平台的工具的运转逻辑。“即时反馈”使得数据探索者可以在不明白参数的深奥含义的情况下理解它所造成的影响,从影响倒推理解它的含义本身。这是OmicStudio在生物信息云平台开发上所做的突破,解放用户对于深奥的生物信息原理和工具操作上的理解困难。

提供默认参数,一键分析

上面提到,较多的参数也意味着较高的学习成本,OmicStudio通过提供全部默认参数来解决这个问题。极致简短的操作是,用户只需要上传文件,等待页面图片刷新完成(一般只需要几秒)就可以直接下载了。页面提供的参数虽然多,但是全部都有默认值,输入数据会直接用默认值绘制出一幅符合发表质量的图片,如果用户只为迅速地了解一下自己数据的情况(比如PCA降维看生物学重复情况,或相关性热图看数据的相关情况),就可以直接下载使用,整个过程可以在一分钟内完成,默认参数是高频使用的参数,在绝大多数情况下都可靠,所以不会成为用户的选择障碍。

高质量和自由可调的分析结果

一般的生物信息平台注重流程,故分析结果图片需要二次绘制调整才可以到达发表所需的美观程度。OmicStudio将图片绘制的调整模块也做了精心设置,默认的图片风格主题是经过精心排版的,而这个的排版是用户可以自行调整的,包括:主题背景、配色方案、字体字形、字号、标题等。如果有些需求云平台无法满足,OmicStudio也提供了进一步的解决方案:可下载PPT格式的图片。OmicStudio的图片在PPT中可以组件分离,即每一个元素都可以独立调整,只要是PPT菜单栏提供的功能,都可以用于图片的主题风格设置。这和AI软件可实现的功能一致,且学习成本更低。

自由关联下游分析模块

在进行科研分析时,除了自由调整参数,更近一步的需求是自由选择下游分析内容。一般的生物信息云平台在提供便利的分析流程时往往也对限制了用户选择分析内容的自由,用户只能在给定的流程中选择不要什么分析内容,而不能选择换一个分析内容。OmicStudio的分析模块是独立且关联的,如下图所示,在某个云工具的页面内,右侧边栏提供了一系列的相关云工具,点击可直接跳转分析(可基于目前的分析结果继续分析,无需上传文件)。这种模式的好处是,用户可以自由选择下一步需要分析什么内容,也可以决定分析在什么时候停止。图2显示了用于肿瘤或外显子分析的云工具之间的相关性。类似的系列模块包括相关性分析、富集分析等。

图2.说明云工具之间关系的流程图

高质量出版图表

OmicStudio生成的图形以其美观的设计而闻名。典型示例如图3所示,这些示例都直接从OmicStudio下载,无需任何额外调整。来自OmicStudio的图形设计得非常好,即使经过一些定制调整,它们仍然可以满足美学标准。此外,OmicStudio云平台支持图形参数的调整,如字体、配色方案、主题和轴的调整。方便用户根据自己的需求定制图形。

图3. 图片示例

(A)火山图,(B)相关热图,(C) GSEA富集图,(D)相关网络,(E) KEGG富集散点图,(F)经典富集图。

自动保存分析参数,方便回溯

一般的生物信息云平台会将分析参数保存在平台中,用户不可见,当用户撰写文章时,提取生信软件的参数值就对比较困难。OmicStudio的参数是随着分析结果一起下载给到用户的,这样不论时间过去了多久,平台更新了多少版本,用户永远可以找到自己分析时所用的参数。用户下载的分析记录包括:参考文献、分析方法及软件版本、分析参数、分析基础信息(在什么时间使用了云平台的哪个工具)、引用方法。这些信息在用户撰写文章时可以提供坚实的辅助。

为用户提供额外资源

云课堂模块提供了9大主题,近百节课程,方便用于根据自己的需求进行定向学习。这些主题课涉及生物信息、各组学知识和文献解读,旨在为用户提供从生物学意义的理解到操作到经验学习等全方位的科研需求。

用户文章模块收集了联川生物用户发表的近千篇研究论文,提供期刊名称、发表年份、影响因子、样本来源、使用方法等信息。用户可以搜索、预览和下载pdf版本的论文。方便用户获取感兴趣领域的知识,并通过OmicStudio再现分析结果。

OmicStudio专注于让科学研究更容易。自2019年10月起,平台服务内容升级迭代超过1000次。目前已有3万多名科研用户。在过去的3年里,超过400篇研究文章引用了OmicStudio (谷歌Scholar,截至2022年8月13日)。


致  谢

作者感谢王雯婧对这篇手稿的建议。

利益冲突

郎秋蕾是联川生物的股东,其他作者是联川生物的员工。

作者的贡献

吕枫烨设计了平台和思路。吕枫烨和韩斐然撰写了手稿。韩斐然负责对稿件进行编辑和修改。所有作者都为OmicStudio云平台的开发做出了贡献。

引文格式


Fengye Lyu, Feiran Han, Changli Ge, Weikang Mao, Li Chen, Huipeng Hu, Guoguo Chen, Qiulei Lang, Chao Fang. 2023. OmicStudio: A composable bioinformatics cloud platform with real-time feedback that can generate high-quality graphs for publication. iMeta 2: e85. https://doi.org/10.1002/imt2.85

作者简介

吕枫烨(第一作者)

●  杭州联川生物股份有限公司高级技术工程师

  毕业于上海海洋大学生物技术专业,主攻生物信息,擅长R语言与Shiny开发。负责联川生物云平台的架构、开发和运营,具有丰富的软件架构和开发经验,是联川生物云平台的核心技术负责

方超(通讯作者)

●  杭州联川生物股份有限公司生信总监,海南师范大学应用统计专业硕士校外指导教师

  毕业于韩国仁荷大学信息工学,主攻机器学习与人工智能算法方向,擅长底层算法优化,软件架构和大数据处理。具有丰富的大队列项目研发经验,相关成果获得8项软件著作权

更多推荐

(▼ 点击跳转)

高引文章 ▸▸▸▸

iMeta | 德国国家肿瘤中心顾祖光发表复杂热图(ComplexHeatmap)可视化方法

▸▸▸▸

iMeta | 浙大倪艳组MetOrigin实现代谢物溯源和肠道微生物组与代谢组整合分析

▸▸▸▸

iMeta | 高颜值绘图网站imageGP+视频教程合集                                      

第1卷第1期

第1卷第2期

第1卷第3期

第1卷第4期

期刊简介

“iMeta” 是由威立、肠菌分会和本领域数百位华人科学家合作出版的开放获取期刊,主编由中科院微生物所刘双江研究员和荷兰格罗宁根大学傅静远教授担任。目的是发表原创研究、方法和综述以促进宏基因组学、微生物组和生物信息学发展。目标是发表前10%(IF > 15)的高影响力论文。期刊特色包括视频投稿、可重复分析、图片打磨、青年编委、前3年免出版费、50万用户的社交媒体宣传等。2022年2月正式创刊发行!


联系我们

iMeta主页:http://www.imeta.science

出版社:https://onlinelibrary.wiley.com/journal/2770596x
投稿:https://mc.manuscriptcentral.com/imeta
邮箱:office@imeta.science

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存