查看原文
其他

大咖论健 | 荣之联王东辉:生物云是基因行业的基础设施 | 第45期

2017-07-14 基因慧 基因慧Pro


【大咖论健】2017年6月29-30日,由华大基因、中国生物信息云计算产业联盟发起,华大基因、英特尔、阿里云、京东云、微基因、贝壳社、聚道科技、荣之联、基云惠康等单位联合主办的第二届基因组云计算技术开发者大会(GCTA)在深圳举办,就基因组云计算的行业现状、重大突破以及发展趋势等问题进行了深入交流和合作。基因慧受邀作为大会首席媒体支持单位,对部分演讲嘉宾进行了专访。



本期精彩内容



云计算在基因健康行业的应用 

关键词云计算   基因大数据


1. 基因慧:荣之联生物云技术在2017年成功获得北京市科技计划支持,同时荣之联也是华大基因长期的合作伙伴。在云计算落地基因组大数据的应用上做出了很多持续创新和努力,您认为对于基因组大数据领域,BT和IT的结合上,IT的主要定位是基础架构还是加速器?如何推动BT特别是基因组学的发展呢?


王东辉:BT和IT的结合中,IT一直是生物信息分析的基础,不但需要提供数据的存储和管理,还需要保证各种分析软件在计算集群中的调度和并行运行。通常测序业务会面临两个方面的挑战:一方面当测序规模快速扩张时,数据量会快速增长,导致IT设施无法满足需求,特别是很难申请的大城市用电指标和无法短时间完成扩建的机房环境;另一方面,竞争和应用需求的增长迫切要求缩短信息分析时间,降低计算成本,以配合测序成本的快速减低。


2. 基因慧:近两年精准医疗是比较热门的话题,随着精准医疗行业的发展,伴随着EB级别的数据和庞大存储和计算需求,衍生出“生物云”的跨界应用领域,关于生物云的发展现状和前景,基因慧曾经也邀请华大基因BGI Online负责人金鑫、药明康德旗下明码生物的NextCloud负责人戴珩,GeneDock负责人李厦戎做过深入探讨。荣之联创立16年来,从IT基础架构服务商转型到云计算、大数据和物联网的信息技术领先公司,您作为资深IT专家,可否与众多生物云的同行谈谈您对于生物云的理解。

 

王东辉:生物云一直是比较热门的话题,但是发展过程比较波折。通常生物信息分析工程师更倾向于写脚本进行分析,给他们图形界面使用他们反而不太习惯;另外,之前用的软件大多是开源软件,没有统一标准,但进入到生产环节后,对整个流程开始有严格的控制,在分析流程不变的情况下,如果大规模进行生产,生物云相对来说会更加便捷和实用。当然根据数据量的大小,还需要考虑数据上传下载的成本,以及信息安全等问题。我们提供的生物云可以适用于各种应用场景,比如,希望自己持有系统的客户,我们可以提供从托管服务到IaaS、PaaS和SaaS等。

 

(图2:王东辉接受基因慧记者采访,经作者授权发布)


3. 基因慧:目前谈到基因大数据时,数据量大,但数据本身的信息挖掘尚未形成产业格局,特别是数据结构化、规范标准和开放共享尚没有形成完全成熟的模式;于此同时,2016年国家陆续启动了近百万人群的大型的精准医学队列研究、样本库和知识库项目。您怎么看待基因数据管理和数据挖掘,荣之联在这些方面做出了哪些实践创新呢?


王东辉:从长远看,这些需求大部分是数据管理需求。目前测序成本越来越低,数据量越来越大,数据管理已经是一个很大的问题。例如,我们测算过华大之前拥有的50PB数据,如果全部看一遍需要6-7个月的时间。假如没有数据管理平台,几乎完全失控,导致数据很难查找。我们相信基因测序公司对数据管理的需求会越来越强烈,同时也会要求分析流程自动化。数据管理的本质是通过记录数据变化的过程和人为打标签,实现对数据的管理,即元数据的管理,进而实现数据应用时不必考虑数据的具体存储位置。以前的作业调度,都是让数据跟着应用跑,而我们的生物云中实现了以数据为中心,让应用跟着数据跑,并实现作业的跨集群调度。


4. 基因慧:和国际云计算相比,如 AWS, Google Cloud,您认为国内的云计算服务商,在整体上还存在哪些差距呢,还有哪些发展空间呢?在逐渐趋于稳定的市场局面中,未来会形成一个什么样的共存关系?


王东辉:差距肯定是有的,比如AWS本身,国内提供的AWS服务就比海外的缺了一些服务组件或服务内容,从而增加了应用开发难度。进一步提供更完整的服务组件可能是国内云计算服务商需要努力的方向。国内云计算发展空间广大,客户对云计算的接受仍在启蒙中,大规模应用还没有开始。各个公有云和其他更多的行业云将长期共处,各自发展。公有云服务提供商进入具体行业应用时面临诸多挑战,首先是行业知识和经验的积累;其次是通用设施如何满足行业的特殊配置需求,如信息分析时对大内存节点的要求;第三,存储之外的数据管理、作业调度和数据可视化需求;第四是专用算法的调优。


5. 基因慧:最近几年,基因行业的新兴企业爆发式增长,16年增长了600余家,接近2000家,仍然有很多初创企业仍然涌入这个领域,您对于初创基因企业,从在IT基础架构和云计算应用上,可以提供哪些建议呢?


王东辉:两个建议,第一,IT基础设施不可能是公司的核心能力,但会在公司业务高速发展时严重制约公司发展,避免自建,通过选外包服务,集中自己的精力做专业核心能力建设可能是明智之举;第二,商业模式的建立不但需要好的客户,也需要完整的IT系统支撑。



欢迎产、学、研、资、政相关代表参与《大咖论健》(info@genonet.cn)



您可能还会感兴趣的:


☆ 36位基因健康行业CEO的年终总结

 华大基因金鑫谈云计算及基因大数据

 华大/明码生物/聚道首次同台谈生物云

☆ 哈佛医学院沈亦平:精准医学基本功是大数据共享

☆ 基因慧为牛津大学著作《基因组革命》作序

☆ 为生命计算,从基因大数据到临床应用有多远?

☆ 国家“云计算和大数据”五年专项指南

☆ 国务院: 2020年初步形成健康医疗大数据产业体系



   识别下面二维码进入“优脉通”  ↓↓↓   


We Need You

媒体编辑/行业分析师/互联网产品运营/BD

基因慧等你来 info@genonet.cn




点击“阅读原文”,更多分享。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存