2000物种基因分析耗费550万核时算力,成本如何降低80%?
4月16日以来,15头亚洲象一路向北迁徙的消息牵动着很多人的心。在亚洲象北迁及生物多样性保护集中采访活动中,国家林业和草原局亚洲象研究中心主任陈飞表示,“目前我们已经采集了野象粪便,正在做宏基因组测序和微生物培养研究,希望能够通过分子手段研究野象健康状况,为野生保护管理提供支撑。”
对物种的基因组进行测序,并将这些数据和现有基因组进行比对分析,可以帮助科学家们确定了重要的DNA位点,这些信息有助于研究人类疾病突变,以及如何最好地保护濒危物种。
目前基因组分析工具已在物种保护和研究中广泛应用,其依赖于海量的测序数据以及高效的计算机来实现。
某港澳大学生物信息课题组需对约2000个物种进行基因组分析,预计需要使用600万核时计算资源,并发约2000核。课题组原计划是租用本校超算中心的云资源进行计算,但预估成本将远超过预算几倍。经过多方比价,课题组最终选择了北鲲云超算平台。
RepeatMasker是重复序列检测的常用工具,通过与参考数据库的相似性比对来准确识别或屏蔽基因组中的重复序列,属于同源预测注释的方式。课题组直接通过北鲲云超算平台使用RepeatMasker软件,无需安装,即可开启高效、灵活及经济的云上高性能计算服务,最终耗费约550万核时在预算内完成了整个项目,较租用本校超算中心云资源成本降低了80%。
丰富的基因数据给生物医学领域解锁了新的研究方向,同时也带来了大数据存储的难题。课题组成员介绍,“在对2000多个物种进行基因组分析的过程中产生约2PB的临时数据及100T以上的最终结果数据,北鲲云存储高达10PB,跨地域全网覆盖25个节点,总带宽达到 Gbps 级别,且项目存储及结果下载完全免费,不仅解决了海量数据的存储、计算、下载问题,更是节约了一笔不菲的开销。”
基因组学技术以前所未有的方式打破传统野外种群研究方法的局限性,从分子层面提供了物种的遗传多样性特征数据,在种群跟踪观测、保护策略制定当中提供了重要的数据支持。在这条生命科学的漫漫征程中,面向未来,北鲲云将紧跟科技的发展和用户需求的变化,持续进行研发迭代升级,伴随生命科学行业一路前行!
除基因组分析外,北鲲云还提供了蛋白折叠、虚拟筛选、蛋白结构模拟、分子动力学模拟等应用场景的高性能计算解决方案,助力生命科学领域的研究和发展。
联系我们获取2000核时算力体验券
立刻开启云上高性能计算
部分图片来源于网络,如有侵权请私信删除
- END -
推荐阅读
扫码关注我们
北鲲云
高性能计算解决方案领导者