查看原文
其他

【金猿产品展】荣联冷冻电镜数据分析平台——助力生物医疗科研创新

荣联科技集团 数据猿 2022-01-13





荣联科技集团产品

本项目由荣联科技集团投递并参与“数据猿年度金猿策划活动——2021大数据产业创新服务产品榜单及奖项”评选。

数据智能产业创新服务媒体

——聚焦数智 · 改变商业



冷冻电镜,全称冷冻电子显微镜技术(Cryo-Electron Microscopy),是应用冷冻固定技术,低温下使用透射电子显微镜观察样品的显微技术,可实现直接观察液体、半液体及对电子束敏感的样品,如生物、高分子材料等。冷冻电镜的出现,不仅解决了生物分子结构解析中的许多难题,还改变了许多生物领域的研究方式,在细胞生物学、医学、遗传学等大部分领域都有广阔的应用前景。

目前主要使用的几种冷冻电子显微学结构解析方法包括电子晶体学、单颗粒重构、电子断层三种。不同的方法下数据产量、分析方法、使用软件也不相同。主要应用包含冷冻电镜数据自动收数据软件,自动化预处理软件、单颗粒应用软件,Tomo应用软件等。通用的冷冻电镜数据分析平台多是硬件的堆砌,通用硬件,存储系统上部署操作系统、调度系统以及应用软件。应用软件一般由用户自行配置,通用方案缺乏对业务系统的整体理解,尤其是缺乏应用软件的理解。

为此,荣联科技集团推出智能化冷冻电镜数据分析平台,打通下机数据采集、传输壁垒,使数据预处理、数据可视化、二维和三维分析更加高效。

荣联冷冻电镜数据分析平台为用户提供了全套的冷冻电镜数据分析计算、存储解决方案。用户通过冷冻电镜和数据分析系统具备了完全的冷冻电镜结构分析能力。该平台可以直接接入和控制冷冻电镜光学系统,实现从数据采集到二维和三维生物结构的分析。系统的设计着眼于各种规模的冷冻电镜设施,针对多用户场景下规模化的冷冻电镜数据计算实践中的痛点问题,支持全自动化的数据分析流程和实时数据质量信息反馈,具有完备的、可视化的数据管理以及计算历史追踪和统计分析能力。

2021年重大更新升级


冷冻电镜数据分析系统包含基础资源层、系统层、应用层(即软件层)和用户层四个层次。基础资源层针对冷冻电镜数据的特点,提供最优化的计算、存储、网络架构设计;系统层实现数据管理、自动化流程管理和作业调度;应用层以冷冻电镜应用软件为核心,进行数据的分析和处理,用户层提供强大的用户监控和远程操控能力。


冷冻电镜业务流程

应用场景/人群


目前,荣联冷冻电镜数据分析平台解决方案主要应用于生命科学蛋白质结构解析工作线中,已成功服务于清华大学、西湖大学、中科院上海有机所、水木未来等客户,积累了丰富的行业经验。

二十一世纪是生命科学的世纪,而结构生物学是现代生命科学研究的前沿主流学科之一。客户单位内的科研人员利用冷冻电镜平台对生物大分子结构与功能的深入研究,解决一系列重大的基础科学问题,帮助人们更好地理解生命现象本质,并将极大地促进基于生物大分子结构的新药研究及开发。

产品功能


核心功能

基础资源层:该部分接收冷冻电镜的下机数据,数据在基础资源层上完成计算、存储、结构解析。一般依据下机数据的通量,以及数据处理的时效性精准匹配所需资源量。下机数据会转至工作站进行数据的预处理,工作站预处理后会将结果数据存放于集中存储(用于后续 2D、3D 分析),同时也可单独配置源数据存储系统,用于源数据备份。在整个的数据传输或是计算、存储过程中,数据对存储的带宽以及IOPS 有不同的要求,对于数据传输所需要的网络带宽也不同,由于应用程序的多样性,对于计算系统有不同的资源需求。均需依据具体的冷冻电镜的型号以及相机型号、数据处理时效性的要求,精准匹配方案。数据的预处理在 GPU 工作站完成。2D、3D 的处理采用 CPU/GPU 异构的计算集群方案。冷冻电镜数据分析平台支持全自动化的数据分析流程和实时数据质量信息反馈,具备计算分析、数据存储能力。

系统层:在系统层,进行物理资源的统一管理,作业管理,流程管理,用户管理,数据管理,包含集群管理软件、调度软件、编译软件等。

应用层:冷冻电镜的数据处理包含数据采集、图像预处理、颗粒挑选、二维重构、三维重构、结构优化等过程,通过多年在冷冻电镜领域的积累以及技术的布局,荣联初步建立了一套比较完整的冷冻电镜领域的应用系统,通过采用统计推断和深度学习等人工智能技术,使整个计算过程摆脱对用户干预的依赖,实现自动化处理。

用户层:采用基于Web 的云桌面系统,通过 URL 访问,提供多用户同时在 线进行计算作业,通过Web Linux 桌面进行业务软件的作业提交、作业监控与数据管理,支持用户通过 Web Linux 桌面实时处理 3D 性能加速的 Linux 桌面应用。

产品优势


方案特点

精准匹配、极速优化:平台不是硬件、软件的简单堆砌,结合冷冻电镜的类型以及数据类型、应用特点匹配最优的计算单元、网络单元、存储单元;深入挖掘应用特征,从硬件层、软件层、算法层对系统以及软件进行优化,平台具备最优性能。

易维护、可扩展:整体系统的基础环境由高性能计算集群以及分布式存储系统构成,系统通过xCAT 进行管理和维护,使用 Slurm 系统进行多种异构资源的管理和调动。随着数据量以及业务量的激增,平台可快速在线扩容。

收集自动化、分析模块化:冷冻电镜数据平台主要功能是数据采集、存储以及数据解析。然而,冷冻电镜的数据采集和分析处理仍然是一个费时费力的工作,极大地限制着该项技术的发展和应用。为解决这一问题,荣联携手合作伙伴、开发设计了一整套冷冻电镜数据采集和分析系统,包括从数据采集到最终的三维重构。在开发中引入了新算法思路,支持自动化的数据收集、处理分析,包括首次引入和实现基于深度学习的蛋白颗粒识别挑选,基于粒子滤波的高误差容忍度的三维重构参数搜索算法。整套系统可实现数据的自动化采集,将众多的漂移校正、颗粒挑选、2D、3D 等软件按照类别进行模块化封装,方便安装以及配置,让用户开机即用。

整体而言,为了方便数据收集和数据解析,推动冷冻电镜的发展和应用,方案中引入自动化收集系统、智能化解析系统,实现开机即用,无需重复性的软件编译,让科研工作者将大量精力集中在科学研究中。

操作可视化:通过URL访问Web的云桌面系统,通过 Web Linux 桌面进行Relion/MotionCorr2/Pymol/Coot/CCP4 等业务软件的作业提交、作业监控与数据管理,支持用户通过 Web Linux 桌面实时处理 3D 性能加速的Linux 桌面应用。

服务客户/使用人数


目前,荣联冷冻电镜数据分析平台解决方案主要应用于生命科学蛋白质结构解析工作线中, 2021年度开拓了清华大学、西湖大学、中科院上海有机所、水木未来等客户,服务于100多名科研人员。

市场价值


在西湖大学冷冻电镜数据分析平台建设项目中,西湖大学生命科学实验室冷冻电镜平台重点支持结构生物学研究,很多以往‘看不清’的生物大分子结构能够得到认识和解析,对探索生命奥秘、了解人类自身有着重要的作用。疫情期间,西湖大学冷冻电镜成功解析新冠病毒细胞受体空间结构。

荣联作为国内领先的数字化服务提供商,拥有二十余年的信息服务经验,在西湖大学成立初期就积极配合学校推进信息化建设,为西湖大学建设了校级信息化平台、为生命科学学院建设了冷冻电镜平台、承担了西湖大学智算平台总体建设工作,通过专业解决方案和丰富的项目实施经验,全面助力西湖大学的科研平台建设。

提示:直接点击文末左下角“阅读原文”链接可直达该产品官网页面

产品所属企业·荣联科技:

荣联科技集团股份有限公司(股票代码002642.SZ,简称“荣联科技集团”)是专业数字化服务提供商,面向行业客户提供企业数字化转型和IT基础设施建设全方位解决方案。20多年来,公司紧跟IT技术发展趋势,建立了覆盖全国的营销和服务网络,服务于数万家行业客户,成为客户数字化建设的优秀合作伙伴。未来,公司将围绕云计算、大数据等新一代信息技术,深入金融、政府公用、运营商、能源制造和生物医疗等优势行业核心应用,为企业数字化转型注入新动能。

目前,荣联科技集团已发展成为营收规模超30亿、员工800余名、业务遍及全国31个省市自治区及欧美、控股参股企业60余家的大型高科技企业集团。

公司战略

荣联科技集团以新一代信息技术集成服务为核心,以云服务和数据服务为两大战略方向,积极布局云服务、数据服务、自有产品及服务、数据中心建设四大业务板块,深耕金融、运营商、政府公用、能源制造、生物医疗五大行业,以先进的数字化服务赋能客户全面数字化转型升级,为数字中国建设助力。


《2021企业数智化转型升级服务全景图/产业图谱1.0版》

《2021中国数据智能产业图谱3.0升级版》

《2021中国企业数智化转型升级发展研究报告》

《2021中国数据智能产业发展研究报告》

❷ 创新服务企业榜 

❸ 创新服务产品榜

❸ 最具投资价值榜 

❺ 创新技术突破榜

条漫:《看过大佬们发的朋友圈之后,我相信:明天会更好!》


联系数据猿

北京区负责人:Summer

电话:18500447861(微信)

邮箱:summer@datayuan.cn

全国区负责人:Yaphet

电话:18600591561(微信)

邮箱:yaphet@datayuan.cn

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存