北鲲云

其他

24小时完成1074个氨基酸分子动力学模拟,为北京高校药学院科研攻关提供强力支撑

有限的超算中心和自建计算集群的方式已无法满足超算用户计算业务和创新的需要,无需排队的、独享式的云端高性能计算集群越来越受中国乃至全球科研人员的青睐,成为科研创新的一大推动力。寻找大规模算力资源项目背景&客户需求北京某高校药学院药物化学课题组需要研究和测定氨基酸类药物在人体中的扩散系数及热力学性质。氨基酸在医药上主要用来制备复方氨基酸输液,也用作治疗药物和用于合成多肽药物。不论是使用过程还是生产过程,都涉及药物水溶液的扩散及相关一些热力学性质的数据。课题组本地拥有2台GeForce
2022年3月14日
其他

从100天缩短至4小时,助力新冠病毒相关蛋白预测

随着云端高性能计算的发展,越来越多的用户选择将业务迁移、部署至云端。国内某985高校长期以来一直依靠其内部高性能计算集群来支持多个科学、工程和医学领域的研究活动。然而,随着研究计算需求的不断增长,当前系统的计算资源和容量开始满足不了用户需求了。考虑到成本及时效等因素,高校最终选择了北鲲云一站式云超算平台,为师生提供一个高效便捷的云端高性能计算环境。该方法证明既有成本效益又非常灵活。课题组高教授介绍说:“借助于北鲲云超算平台,我们可以拥有满足工作所需的计算能力,并且只要工作需要,我们就可以随时随地使用这些计算资源。这是一种满足运行计算工作需求非常有效的方式。”课题组团队目前正在使用北鲲云超算平台进行新冠病毒相关蛋白预测。他解释说:“具体来说,Covid19主要是通过S蛋白与宿主细胞表面ACE2受体结合感染宿主细胞,因此S蛋白是绝大多数新冠疫苗发挥作用的主要靶标。德尔塔和奥密克戎毒株也是刺突蛋白的氨基酸突变所导致的变异,导致其传播能力更强。”他补充道:“启动一台服务器计算500条.fasta文件,需要计算2000小时,差不多100天!通过北鲲云超算平台使用alphafold2对刺突蛋白进行建模,可启动500台Nvidia
2021年12月2日
其他

1.5小时完成1万分子虚拟筛选,以超高算力助力中医药研发

在中国对抗新冠疫情的战争中,中医药广泛参加新冠肺炎治疗,深入介入诊疗全过程,发挥了积极作用,成为抗疫“中国方法”的重要组成部分。据湖北省卫生健康委员会消息,湖北省中医药使用率累计达到91.91%,方舱医院中医药使用率超过99%,集中隔离点中医药使用率达到了94%。上海中医药大学创新中药研究所立足于促进创新中药的应用与应用基础研究。2020年,林国强院士团队和陈红专教授团队从临床抗新冠病毒有效的中药方剂出发,通过计算机辅助虚拟筛选并运用SPR及NanoBit等生物技术及药理学的研究发现了甘草酸可以显著阻断新冠病毒棘突蛋白和人体内靶蛋白ACE2的结合,是抗新冠病毒活性的有效中药单体。随着科研项目的增加和使用人数的上升,受限于本地设备,在科研高峰时期,作业排队现象尤为突出,严重影响了基于中药的新药创制进程。为了保证筛选计算能够高效、顺利完成,上海中医药大学创新中药研究所和北鲲云达成了长期合作,通过北鲲云一站式云超算平台,科研人员可随时随地调用最新的硬件资源进行高通量计算,单集群最高可支持100000核心算力;还可以拥有10PB的存储容量,用于存放处理数据和计算,并支持多任务在多机环境下并发处理。上海中医药大学创新中药研究所研究员表示,“通过北鲲云超算平台调动96核CPU,使用Discovery
2021年9月10日
其他

Alphafold2初体验|24小时并行完成1000个蛋白质结构预测

历史上有科学家耗费几十年时间才能得到一个清晰的蛋白质三维结构,蛋白质三维结构的测定成了生物学领域非常困难的研究。Alphafold2的出现,为蛋白质三维结构研究提供了新的突破口。上个月北鲲云超算平台上线了AlphaFold2,针对客户最关心的适配、计算效率、运行成本等问题,今天为大家介绍三个典型客户案例,方便大家更直观的了解。计算904个氨基酸耗时6.33小时客户A是某高校生命科学学院的博士,从事结构生物学研究。在初次体验过程中,他选择可视化作业提交方式,直接使用可视化输入框完成AlphaFold2配置,调用1张Nvidia
2021年9月3日
其他

小米发布仿生四足机器人“铁蛋”!解读背后的建模和仿真技术

今年雷军的年度演讲,为我们带来了一只狗!小米第一代仿生四足机器人:CyberDog。当然你也可以叫它如雷贯耳的中文名:铁蛋!铁蛋是一个四足机器人,全身配有11个高精度传感器,可以感知图像、光线、距离、速度、声音等环境信息。搭载NVIDIA
2021年8月18日
其他

北鲲云超算平台助力新材料发掘速度提升100倍

新材料是决定一国高端制造及国防安全的关键因素,成为国际竞争的重点领域之一。2011年我国新材料产业总产值仅仅为0.8万亿元,预计到2021年有望突破7万亿元。以往新材料的研发,大多采用试错法。一种新材料从最初的研究开发,经过性能优化、系统设计与集成、验证、制造再到投入市场,整个周期通常需要10-20年时间。最近在工程领域出现的集成材料计算与计算机技术相结合范例表明,可以把现有的材料研发周期缩短到2-3年。中南大学杜勇团队首先采用热力学软件Thermo-Cale调用硬质合金多组元热力学数据库CSUTDCCI计算相关成分下烧结区域的相图。然后利用动力学模拟软件DICTRA,根据合金制备时的参数如合金成分、烧结温度、烧结时间及烧结气氛等,可预测梯度硬质合金中梯度层的厚度及成分分布、相分布。根据模拟结果,设计所需的工艺参数以制备出具有期望显微组织的梯度硬质合金。最后对合金进行显微组织、相和成分分布及性能等的研究。通过计算模拟可对梯度硬质合金进行高效设计,大大减少人力和物力成本,缩短产品的开发周期。
2021年8月13日
其他

高性能计算为濒危物种撑起保护伞

在保护和开发濒危物种过程中,研究人员往往会对濒危物种进行基因测序,并利用测序结果,采用生物信息学的方法来比对和分析濒危物种COI基因序列及遗传多样性。“采用生物信息学的方法来比对和分析濒危物种COI基因序列及遗传多样性”这部分需要更加庞大的算力和数据存储技术支撑。要得到正确的结果,最重要的还是研究人员采用科学严谨的方法来做工作,高性能计算能够加速这一过程。我们以居延海大鳍鼓鳔鳅为例。居延海位于内蒙古阿拉善盟额济纳旗,曾是西北地区最大的湖泊之一。1992年居延海干涸,大鳍鼓鳔鳅由此消失于此区域。2003年黑河改水工程后居延海又正式蓄水,使得大鳍鼓鳔鳅在居延海重新出现。课题组对52个标本的COI基因进行序列测定,得到了全部标本的长度为645bp左右的COI基因序列。645bp左右的COI基因PCR扩增产物的测序结果经过校对和拼接后,同源排序得到了52个鱼标本的同源基因序列626bp。对测定的DNA序列进行人工校正,采用DNA
2021年8月5日
其他

开源的AlphaFold2 怎么用?打开北鲲云超算平台就能在线用

AlphaFold2再登Nature,以一举之力让科研圈再次震动。不仅完成了98.5%人类蛋白结构预测,而且预测的大部分结构达到了空前的准确度,与实验方法不相上下,还远超解析新蛋白质结构的其他方法。目前,DeepMind在GitHub上公开了
2021年7月31日
其他

2000物种基因分析耗费550万核时算力,成本如何降低80%?

4月16日以来,15头亚洲象一路向北迁徙的消息牵动着很多人的心。在亚洲象北迁及生物多样性保护集中采访活动中,国家林业和草原局亚洲象研究中心主任陈飞表示,“目前我们已经采集了野象粪便,正在做宏基因组测序和微生物培养研究,希望能够通过分子手段研究野象健康状况,为野生保护管理提供支撑。”对物种的基因组进行测序,并将这些数据和现有基因组进行比对分析,可以帮助科学家们确定了重要的DNA位点,这些信息有助于研究人类疾病突变,以及如何最好地保护濒危物种。目前基因组分析工具已在物种保护和研究中广泛应用,其依赖于海量的测序数据以及高效的计算机来实现。某港澳大学生物信息课题组需对约2000个物种进行基因组分析,预计需要使用600万核时计算资源,并发约2000核。课题组原计划是租用本校超算中心的云资源进行计算,但预估成本将远超过预算几倍。经过多方比价,课题组最终选择了北鲲云超算平台。RepeatMasker是重复序列检测的常用工具,通过与参考数据库的相似性比对来准确识别或屏蔽基因组中的重复序列,属于同源预测注释的方式。课题组直接通过北鲲云超算平台使用RepeatMasker软件,无需安装,即可开启高效、灵活及经济的云上高性能计算服务,最终耗费约550万核时在预算内完成了整个项目,较租用本校超算中心云资源成本降低了80%。丰富的基因数据给生物医学领域解锁了新的研究方向,同时也带来了大数据存储的难题。课题组成员介绍,“在对2000多个物种进行基因组分析的过程中产生约2PB的临时数据及100T以上的最终结果数据,北鲲云存储高达10PB,跨地域全网覆盖25个节点,总带宽达到
2021年6月22日
其他

分子对接从数周缩短至2小时,北鲲云为新药研发按下加速键

近年来,在政策引导和资金推动下,创新药正成为中外药企的重兵集结地。但据Nature公布的数据显示,新药的研发成本大约是26亿美元,耗时约10年,成功率不到十分之一。如何提高新药研发的速度和效率,是中外药企的核心关注点。计算机辅助药物设计(computer
2021年6月16日
其他

每步需要上万亿次计算?北鲲云为分子动力学模拟提速

分子动力学模拟是分子模拟中最接近实验条件的模拟方法,能够从原子层面给出体系的微观演变过程,直观的展示实验现象发生的机理与规律,促使研究向着更高效、更经济、更有预见性的方向发展,因此,分子动力学模拟在生物、药学、化学、材料科学的研究中发挥着越来越重要的作用。分子动力学(MD)主要的瓶颈是在计算时长和效率上。在生物大分子的分子动力模拟中,生物大分子连同水溶液环境通常包括几万到上百万的原子数,在每步的模拟中,最耗计算时间的势函数求解理论上与原子数的平方成正比,因此每步都要做几亿到几万亿次计算。同时,分子中包含的原子的最快振动周期要求分子动力学模拟的步幅在1-2飞秒范围,而生物大分子行使功能所需的时间则多在微秒~秒范围,甚至更长的时间尺度,因此为得到有意义的相空间取样,需要至少109~1015个模拟时间步。每步计算的规模之大,加上需要计算的步骤之多,要求必须具有极高性能的超级计算机。选择自购服务器,但采购周期长,算力限制大、维护成本又高;租用超算中心节点,扩展空间小,常常需要长时间的排队。针对上述难点,北鲲云自主研发了一站式云超算平台,该平台通过对AWS、阿里云、腾讯云、微软云、谷歌云、华为云等主流公有云服务厂商的资源整合,配合独有的并行计算调度管理模块,能为用户快速构建与安装部署一个“独享式“云端超算中心资源,提供从数据、软件到算力的全流程服务。01超高性价比,最新硬件资源北鲲云超算平台在全球拥有25个地域节点,超过10万台服务器,单集群最大可支持100,000核心算力;兼具海量存储空间,为PB级数据存储管理提供高效可靠支撑,满足日益增长的数据存储需求。02支持大规模并行,提高计算效率分子动力学模拟多为浮点计算,非常适合大规模并行。北鲲云超算平台提供了280万IOPS和20GB/s吞吐能力的并行文件系统,高IOPS、高吞吐,低时延的数据存储服务,将大幅提升分子动力学模拟、科学计算等高性能计算的工作效率。03有效利器,降低上云成本上云成本高?选择尤为重要。北鲲云超算平台使用模式灵活,最低0.08元/核时超低计算资源价格,无任何初始投入和运维成本,计算完全按需付费;且拥有海量云端异构资源,可根据不同应用需求灵活优化CPU、内存与GPU之间的比例,自动匹配最适合的算力资源组合,有效提升资源利用率。资源的精准组合加上云服务的弹性,将大大降低成本。04一站式全流程服务,构建高算力科研环境目前分子动力学模拟应用最为广泛的几款软件主要有NAMD、GROMACS、LAMMPS等。上述软件,北鲲云超算平台都已预装,并支持开箱即用,实现了高性能计算项目全周期的网上运作与管理。同时,可在10分钟内启动上万台服务器资源,作业排队时间趋近于0,可随时随地云计算,从而减轻、松绑科研创新活动对场地、时间的依赖性,让网上科研成为新常态。除分子动力学模拟外,北鲲云还提供了基因测序、蛋白折叠、虚拟筛选、分子设计、蛋白结构模拟等应用场景的解决方案,助力生命科学领域的研究和发展。
2021年6月10日
其他

深度学习模型识别耳部疾病,准确率提升至95%

-推荐阅读借力北鲲云超算,深圳大学智能机器人科研再提速突破存储与算力极限,助力生命科学领域破译“达芬奇密码”案例分享
2021年6月8日
其他

北鲲云超算平台全新客户端上线,云上高性能计算更方便!

来了、来了北鲲云一站式云超算平台Windows&Mac客户端上线啦!现在申请试用,即可获得2000-5000核时算力体验券还有精美小礼品等你来抽~-
2021年6月3日
自由知乎 自由微博
其他

借力北鲲云超算,深圳大学智能机器人科研再提速

近日,北鲲云为深圳大学电子与信息工程学院部署了一套支持混合云模式的云超算平台。通过此次合作,巧妙地解决了智能机器人实验室算力资源不足和管理难题,将GPU资源利用率提升至30%以上,整体教学和科研工作效率提升45%,作业排队时间趋近于0,智能机器人科研和教学工作驶入快车道。深圳大学是广东省高水平大学重点建设高校,深圳大学智能机器人实验室隶属于深圳大学电子与信息工程学院,专注于图像/视频内容分析处理,计算机视觉技术,机器学习包括深度学习最新技术的研究和开发。为了支持智能机器人教学科研工作,近几年深圳大学电子与信息工程学院为实验室配置了8台4卡的深度学习服务器,然而随着智能机器人应用场景的增加、更多更频繁的训练和使用人数的上升,实验室对GPU及CPU算力规模需求越来越大,智能机器人算力资源调度管理问题也逐渐凸显。北鲲云整合实验室本地服务器资源和云上资源。当实验室本地服务器算力资源不能满足自身需求时,支持通过集群调度系统平台自动溢出到云上,与云上资源无缝对接,实现了作业无需排队,从而提高计算效率。通过slurm作业集群调度系统和并行计算调度管理模块,HPC管理员可以清晰地了解到每个使用者对资源使用和提交训练任务的状况,并灵活地配置用户的资源配额、设置收费模式及查看报表,防止资源过多占用和浪费。为了全方位确保实验室的信息数据安全和隐私,北鲲云采用AES-256数据传输加密、AES-256数据落地加密、双向TLS通信加密、密钥对链接集群、数据定时自动清除五大安全防护设备。“北鲲云超算平台还支持可视化界面、命令行、工作站等多种方式,内置多种主流深度学习框架和开发组件,能够快速部署开发环境,提高了实验效率。”深圳大学智能机器人实验室一名研究员坦言,“北鲲云超算平台投入使用后,为我们创造了一个高效的研发环境,可以把精力更多地投入到教学与科研中去。”深圳大学电子与信息工程学院借力北鲲云超算平台解决本地算力资源不足、算力分布不均、设备管理维护等难题,是校企合作的典型范例,将进一步加速推进智能机器人科研创新与人才培养,打造智能机器人教研标杆高校。关于我们北鲲云致力于为有高算力需求的企业和科研人员提供一站式的Cloud-HPC产品和服务,解决算力不足问题,覆盖领域包括生命科学、人工智能、芯片设计、高科技制造、CAE/CFD、大气海
2021年5月28日
其他

突破存储与算力极限,助力生命科学领域破译“达芬奇密码”

基因技术作为被大家公认的有可能改变人类命运的关键技术,如今已经渗入到我们的日常生活。通过基因测序,可以对孕妇进行无创伤的产前先天遗传缺陷检测,也可以通过检测肿瘤基因特征片段提早预防癌症,还可以通过基因技术来寻找最优的药物治疗方案。目前市场上主要采用的是第二代测序技术。先将整个基因组打乱,切成随机碎片,然后测定每个小片段序列,最终利用计算机对这些切片进行排序和组装,并确定它们在基因组中的正确位置。这个过程看似简单,但基因测序工程动辄需要数万或数十万个基因测序及模型建立,需要很大的计算和存储资源。所以要求HPC平台需要满足以下几点:第一,要满足大数据量需求。基因数据的产出量基本上每18个月就要增加一个数量级,所以数据产出量一直处于快速增长的状态。如某全球最大的基因组学研发机构目前拥有超过200台测序仪,其中用于新生胎儿基因测序每天大约产生10000个样本
2021年5月20日
其他

案例分享 | 用1/5的计算周期完成语音识别模型训练

语音识别技术简单来说指的是机器或程序完成接受口令、解释声音含义、理解和执行口头指令所需的技术。在当下智能时代,智能终端的应用普及面越来越广,相应的越来越多的场景在设计个性化的人机交互界面时,以对话为主的交互形式。而一个完整的对话交互是由过程是由“输入—分析—输出”三个环节共同组成一个闭环。其中,“输入”需要语音识别技术;“分析”需要自然语言处理技术;“输出”需要语音合成技术。其中,“分析”环节由编码和解码组成,编码主要用于对输入内容的特征进行提取;解码则是通过声学模型和语言模型进行解析。语音识别技术是对话交互的开端,是保证对话交互高效准确进行的基础。语音识别技术自20世纪50年代开始步入萌芽阶段,发展至今,主流算法模型已经经历了四个阶段:包括模板匹配阶段、模式和特征分析阶段、概率统计建模阶段和现在主流的深度神经网络阶段。
2021年3月18日
其他

单模型最多使用200张Nvidia V100 GPU,深度学习模型训练周期缩短5倍!

人工智能是下一次工业革命的核心力量,目前最流行的深度学习技术占据着人工智能最新成果的核心领域,机器人开发、语音识别、图像识别、自然语言处理和专家系统等不断推陈出新,可以设想,未来由人工智能塑造的科技产品,将会是人类智慧的“容器”。《国务院关于印发新一代人工智能发展规划的通知》的发布,明确了人工智能产业将成为新的重要经济增长点,中国将成为世界主要人工智能创新中心。深度学习技术的实质,是通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。深度学习模型训练最大难点收敛速度慢深度学习其实就是一个反复调整模型参数的过程,得力于GPU等硬件性能的提升,使得复杂的深度学习训练成为了可能。收敛速度过慢,训练时间过长,一方面使得相同总训练时间内的迭代次数变少,从而影响准确率;另一方面使得训练次数变少,从而减少了尝试不同超参数的机会。怎样才能加快收敛速度,减少训练时间呢?解决方法:使用GPU并行计算深度学习模型训练,基本由卷积计算和矩阵乘法构成,都很适合并行计算。使用多块GPU并行加速已经成为了深度学习的主流,可以大大加快收敛速度。要达到相同的精度,50块GPU需要的时间仅为10块GPU的1/4左右。并行计算(Parallel
2021年3月11日
其他

0门槛,超好用!仅需2步即可开始GROMACS进行分子动力模拟!

随着人类基因组计划的完成、蛋白组学的迅猛发展,以及大量与人类疾病相关基因的发现,药物作用的靶标分子急剧增加;计算机辅助药物设计是通过计算机模拟、计算和预算药物与受体生物大分子之间的关系,设计和优化先导化合物的方法;在计算机技术推动下,现在每项有一定规模的新药研究工作中,计算机辅助药物设计的研究都是一个基本的工作,世界上绝大多数制药公司都在使用计算机技术,致力发展该技术,应用前景十分广阔。分子动力学模拟是分子模拟中最接近实验条件的模拟方法,能够从原子层面给出体系的微观演变过程,直观的展示实验现象发生的机理与规律,促使我们的研究向着更高效、更经济、更有预见性的方向发展。分子动力学模拟在生物、药学、化学、材料科学的研究中发挥着越来越重要的作用。在分子动力学模拟中,一般需要模拟微秒级或毫秒级的病毒或肿瘤蛋白折叠过程才能积累到足够的样本量,因此需要用到高性能计算来进行分子动力学模拟。高性能计算具有优化存储环境、缩短企业综合成本、计算服务更灵活等优势。但用户在使用高性能计算来进行分子动力学模拟时,会遇到一些常见的问题:NO.1
2021年3月5日
其他

喜讯丨为企业打造一站式云超算平台,「Cloudam云端」获数千万Pre-A轮融资

2019年10月完成一千万天使轮融资近日获数千万Pre-A轮融资从瑞典斯德哥尔摩到深圳专注于为企业提供一站式云超算Cloud-HPC平台Cloudam的云超算平台使用模式灵活,无任何初始投入,计算完全按需付费;且资源充足,目前已经接入了全部的主流公有云厂商;同时使用门槛低,支持GUI和命令行模式,适配不同用户的使用习惯;预装了300+以上的计算软件,开箱即用。1.「Cloudam云端」获数千万Pre-A轮融资2.超算中心VS公有云VS云超算平台3.面向高性能计算需求,业务覆盖多行业客户4.全球Cloud
2021年3月3日
其他

10+家上市药企都在用的一站式云超算平台!只需3步即可完成超大规模虚拟筛选!

新药的研发速度慢且成本高昂,一款新药的研发往往需要10-15年时间,耗费20-30亿美元。主要原因之一是因为湿实验(wet-laboratory指台式实验)过于昂贵且耗时以及初始化合物命中率低。大多数研发团队最想解决的问题就是:1.速度:如何用计算机算力来取代部分湿实验,从而大幅度提升新药研发的速度?2.成本:如何用最少的人员及设备投入得出研发成果,更好的降低整体成本?3.准确率:如何扩大虚拟筛选规模,增加筛选化合物,提升真阳性率?VirtualFlow的开源药物发现平台,能通过云端整合海量的CPU对超大规模化合物库进行基于结构的虚拟筛选,提高药物发现效率。相比传统的研发手段,利用云计算来进行药物研发的优势有哪些?1.提供了更大的灵活性和扩展性由于“云”的规模可以动态伸缩,这样就可以不用加大投资硬件设备的力度来满足应用和用户规模增长的需要,同时也在无形中起到了降低成本的作用。如果项目突然废弃,也没有什么大的损失,所以在这方面,云计算是相当灵活和易于扩展的。2.可以解决一些特殊的场景很多公司都是在特定的时期盈利较大,比如一些情人节和圣诞节,一些公司就是在这段时间的营业额比较大,在一年中的其他时候,几乎不能盈利,在这种情况下,如果按照传统的软件部署习惯,势必会造成一定的浪费。正如一个有大量波峰和波谷的企业一样,你可能就被迫要将更多的IT资源分配给峰值时期使用。这种情况下将峰值需求外包就能节约更多成本。3.节约了建立基础设施的成本其实对于每个企业来说基础设施都是一笔开支比较大的费用,而且除了费用之外还需要专门的人力和物力的投入,在这个过程中又要保持快速的软硬件更新速度来适应市场的不断变化,所以云计算的出现是一种很好的解决方案。很多时候,我们也会时常注意到数据中心使用面积不够、应用软件超出基础架构的承受能力、软硬件更新太快等问题,云计算服务能帮助企业将资本转移到运营费用上,所以在这方面来说优势是很明显的。Cloudam云端一站式云超算平台就以独特的产品优势,很好的满足了企业及科研机构的需求:√最新高配CPU及GPU资源√完备的软件市场,支持超200种软件开箱即用√高速的文件传输,输入/输出数据比传统超算快10倍传输√经济的价格,跟传统超算类似的价格享受新2代的硬件资源√海量的存储,支持PB级别存储√7x24小时技术支持服务,30分钟内响应为了支持新药研发,云端软件已经基于弹性算力平台云E推出了VirtualFlow
2021年2月26日
其他

【开局2021】“算法、数据、算力”驱动人工智能三要素

云计算是互联网中一切的基础,为大数据对海量数据的处理提供了算力支持;人工智能或者说智能系统不仅在一定程度是上达到了对数据进行智能化、自动化的采集、表示、存取和处理,同时还能在各种不同的应用场景中完成特定的功能设定。大数据本质上是一种从海量数据中加工出有价值数据的处理技术,它用来处理智能设备产生的海量数据;5G作为互联网中一条快速传输的通道,为快速、海量、多样和低价值密度的数据提供了快速稳定传输的保障。中国信息通信研究院发布的《全球人工智能战略与政策观察(2020)》报告称,截至2020年12月,全球已有39个国家和地区制定了人工智能的战略政策、产业规划文件。人工智能对新经济发展的驱动作用日益受到重视。随着算法的创新、算力的增强、数据资源的累积,传统基础设施将实现智能化升级,人工智能技术有望推动经济发展全要素的智能化革新。截至2020年6月底,我国人工智能核心产业规模达770亿元,人工智能企业超过2600家。我国人工智能产业快速发展的同时,关联产业也迎来巨大发展机遇。预计2021年,围绕算法、数据和算力人工智能的三要素,人工智能产业链建设力度将持续增大。《2020-2021中国人工智能计算力发展评估报告》指出,人工智能三要素中,算力成为驱动AI产业化发展的关键要素。服务器是人工智能基础设施的核心。该报告显示,我国人工智能基础设施市场规模在2020年达到39.3亿美元,同比增长26.8%。其中,AI服务器市场规模占整体人工智能基础设施市场的87%以上。但目前我国整体在人工智能算力基础设施方面准备不足,体现在芯片端对外依赖较大,服务器市场国内企业份额有限。在算力方面,相关行业对算力的需求将更为庞大。2021年我国5G通信网络部署加速,数据的增长速度越来越快,人工智能训练所需的计算量将进一步呈现指数增长。在数据方面,产业数据标准化和互联互通水平严重不足,降低了数据的可用性和可迁移性。在算法方面,国内企业的算法框架和平台尚未得到业界广泛认可和应用,在深度学习框架核心技术领域支撑不足。与此同时,人工智能行业在专业人才和典型场景应用等方面也面临突破。应推动建立专用的AI计算设施夯实算力基础,构建智能生态圈,打造软硬件协同能力,持续支持人工智能开源开放和公共服务平台建设,更好推动产业发展。云E弹性算力平台的出现大大改善了目前的局面。作为基于公有云的高性能计算云平台,云E适用于人工智能深度学习、科学计算等领域,为高校、科研机构、高新企业提供方便、易用、高性价比的GPU云算力服务。
2021年2月7日
其他

VirtualFlow教程 | Enamine数据库的更新及其虚拟筛选

/public/software/.local/easybuild/software/virtualflow/libs/enamine-adv-202005/ligand-library│
2020年11月9日
其他

手把手教你用云E(四):LigandScout 使用云计算资源完成药效团虚拟筛选

1.摘要命令行方法使用高性能计算资源阻碍了HPC的可用性,传统的商业软件将计算资源限制于单机方法也限制了用户对高性能计算的利用。本文演示了Ligandscout-remote如何使用云端高性能计算资源加速Ligandscout的虚拟筛选以实现加速药物发现。2.Ligandscout-remote:图形界面与高性能计算的无缝集成HPC集群在科学研究中起着重要的作用。但是,使用群集通常很麻烦,尤其是对于没有正式计算机科学背景的研究人员而言。它需要准备和传输输入数据,手动收集结果以及命令行使用等专业知识。当前改善远程HPC群集可访问性的方法主要集中在提供基于Web的图形前端,这些前端允许将作业提交到群集上的分布式资源管理系统(scheduler)。与命令行用法相比,这具有显著的可用性优势,但并未绕过手动处理输入和输出文件的需求。尤其对于初学者,任何命令行都是痛苦的挑战。Figure
2020年10月19日
其他

高性能计算之源起——科学计算的应用现状及发展思考(下)

摘要现代科学研究和工程技术中,高性能计算应用将建模、算法、软件研制和计算模拟融为一体,已成为高性能计算机实现在重大科学发现的前沿基础科学研究领域应用的必要纽带。文章从高性能计算机的发展趋势、不同科学计算应用对高性能计算机的需求谈起,回顾和剖析了来自中国科学院多个学科的科学家协同通关,发挥学科深度交叉的优势,在“曙光1000”并行计算机上完成了多个应用软件并在天然DNA的整体电子结构理论计算、激光晶体材料(LBO)电子态理论分析及广义本征值并行计算等方面取得了令人瞩目的高水平成果的案例。多年来,中国科学院始终位列我国科学计算应用发展的前沿。在应用水平、计算规模及成果显示度均取得了长足进步的背景下,文章选取了大气科学、生命科学、高能物理、计算化学和材料科学等典型传统科学计算应用,从科学家的视角对它们的现状、领域发展促进及未来趋势作了介绍,以期能引发读者更深入的思考与关注。最后,提出了进一步发展我国科学计算的若干建议。关键词:科学计算
2020年10月14日
其他

高性能计算之源起——科学计算的应用现状及发展思考(上)

摘要现代科学研究和工程技术中,高性能计算应用将建模、算法、软件研制和计算模拟融为一体,已成为高性能计算机实现在重大科学发现的前沿基础科学研究领域应用的必要纽带。文章从高性能计算机的发展趋势、不同科学计算应用对高性能计算机的需求谈起,回顾和剖析了来自中国科学院多个学科的科学家协同通关,发挥学科深度交叉的优势,在“曙光1000”并行计算机上完成了多个应用软件并在天然DNA的整体电子结构理论计算、激光晶体材料(LBO)电子态理论分析及广义本征值并行计算等方面取得了令人瞩目的高水平成果的案例。多年来,中国科学院始终位列我国科学计算应用发展的前沿。在应用水平、计算规模及成果显示度均取得了长足进步的背景下,文章选取了大气科学、生命科学、高能物理、计算化学和材料科学等典型传统科学计算应用,从科学家的视角对它们的现状、领域发展促进及未来趋势作了介绍,以期能引发读者更深入的思考与关注。最后,提出了进一步发展我国科学计算的若干建议。关键词:科学计算
2020年10月9日
其他

从源头开始模拟! GPU让原子模拟应用VASP提速10倍

Tesla加速计算平台的加持下,VASP模拟计算的性能相比CPU可加快10倍,帮助科学家更快更深入地解决最棘手难题。“从源头开始模拟”VASP全称“Vienna
2020年9月25日
其他

如何让 Gaussian 计算飞起来?

“量化穷三代,计算毁一生”?量化计算的硬件配置什么最重要?不花冤枉钱,3万元内性价比最高的硬件推荐!学校的计算节点永远要排队?研究所的数据中心算力不足?量化计算无服务器解决方案,零投入,三分钟让你的
2020年9月21日
其他

手把手教你用云E(二):VINA分子对接

protein.pdbqt准备分子对接配置文件配置文件需要设定结合位点的中心点以及box尺寸,其中从2.2提取配体的质心是可靠结合位点中心,用openbabel可以获得box文件:obabel
2020年9月17日
其他

药物开发中的人工智能:现状与未来展望(下)

摘要人工智能的发展正在全面推动我们的生活新药研发过程中初始命中率低导致的成本升高是制药行业亟需解决的问题制药行业正在尝试与人工智能研究者合作来解决这一问题人工智能将提高药物开发过程的效率AI在寻找分子靶标中的作用在药物开发中,人工智能已经通过整合基因组信息、生化属性和靶标追溯性(tractability)等方式改变了治疗疾病通路或靶标识别的方法。一项研究表明使用“Open
2020年9月14日
其他

药物开发中的人工智能:现状与未来展望(上)

摘要人工智能的发展正在全面推动我们的生活新药研发过程中初始命中率低导致的成本升高是制药行业亟需解决的问题制药行业正在尝试与人工智能研究者合作来解决这一问题人工智能将提高药物开发过程的效率介绍人工智能(AI)是计算机对人类智能过程的模拟。该过程包括获取信息、制定使用信息的规则、得出近似或确定的结论以及自我校正。尽管有许多人担心人工智能的广泛应用会造成大规模的失业,但不可否认,从创新的教学方面到商业和工业流程自动化,人工智能已经被广泛应用于各个领域。在药物开发过程中采用AI的新思想已经从炒作变成了希望。这篇文章介绍了人工智能在药物开发策略和过程等环节能起到的作用。人工智能、机器学习和深度学习在发现类药物小分子中使用AI的方法涉及化学空间的利用。通过计算枚举可能的有机分子,化学空间为鉴定全新的优质分子提供了舞台。此外,机器学习技术和预测模型软件还有助于识别目标特异性虚拟分子,以及分子与各自目标的关联,同时优化安全性和功效属性。人工智能系统可以通过减少之后在体外或体内系统中测试的合成化合物的数量来降低损耗率和研发支出。经过验证的AI技术可用于提高药物开发的成功率,而正在开发中的AI技术必须在应用于药物开发过程之前进行验证。药物开发过程中最关键的部分是所选分子的合成。因此,人工智能具有很高的价值,因为它能够根据合成的难易程度对分子进行优先排序或开发出对最佳合成途径有效的工具。AI在合成类药物化合物中的意义图1简明地显示了AI在医疗行业中的整合。说起人工智能辅助新药研发,就不得不提到人工智能的子领域机器学习(ML)。1959年,机器学习的先驱之一亚瑟·萨缪尔(Arthur
2020年9月8日
其他

Science封面:谷歌实现量子计算化学模拟

图片来源于网络上图是氢原子线性链的能量随着每个原子之间的键距增加而增加。其中实线是使用经典计算机进行的Hartree-Fock模拟,而点是使用Sycamore处理器进行计算的。图5
2020年9月3日
其他

云端软件冯建新:力推硬科技发展,打造高性能云计算“新基建”

编者按战“疫”硬仗还在继续,“疫”后引领经济复苏的集结号已经吹响。中央近期先后五次提到关键词——“新基建”,各地政府陆续发力,把“新基建”作为引领经济复苏的杀手锏。广东省2020年重点项目投资7000亿元,其中高铁、特高压、5G网络、新能源等新基建项目打头阵。“新基建”是什么?新在哪里?如何帮助中国经济实现短期稳步增长和长期提升发展?在这一过程中,将会出现哪些新的产业机会?与之前的“旧基建”有什么区别和联系,有哪些规律和经验是值得借鉴的?凤凰网广东推出《新基建•新未来》系列访谈,对话专家学者、政府官员、湾区商会协会及企业家,全面解码“新基建”;共同探讨如何抓住“新基建”,引领“疫”后经济复苏和升级;帮助产业和企业拥抱“新基建”、发现新机遇、遇见新未来。本次对话,凤凰网广东访谈了云端软件CEO冯建新,看看他如何解析“新基建”下的历史机遇。“新基建”为中国“硬科技”的腾飞奠基对于“新基建”,冯建新有自己独特的理解。他认为与被戏称为“铁公鸡”的旧基建相比,新基建的根本目的是为了给中国“硬科技”的腾飞打好基础。以铁路、公路、机场、港口、水利等基础建设为主的旧基建在中国近几十年来民生安定与经济腾飞中起到了巨大的作用。到现在,中国的经济以及“软科技”都已经达到了世界领先水平。“但中国的‘硬科技’与美国相比还有一些差距。”多年的海外工作经历让冯建新对这一点感受深刻,他说:“所谓‘硬科技’,就是指人工智能、航空航天、生物技术、光电芯片、信息技术、新材料、新能源这些高精尖科技。而
2020年8月31日
其他

侧链虚拟筛选:全PDB和ChEMBL数据分析

log单位(pIC50,pKi等)以内或更大范围内的配体。而且还要求侧链至少具有六个重原子,以消除细小的变化(即甲基化)。经过这些过滤器后,剩下402个数据集,包含四个标识符:ChEMBL
2020年8月28日
其他

超算云,云超算,谁才是高性能计算云端化的明天?

在数据驱动、万物互联的今天,高性能计算(High
2020年8月25日
其他

手把手教你用云E | VirtualFlow 实现超高通量虚拟筛选

进行基于结构的虚拟筛选。详细操作步骤VirtualFlow的文档与教程可以从它的主页获得:https://virtual-flow.org。本文的主要目的是演示如何在Cloudam上使用它。1.
2020年8月11日
其他

2020年人工智能深度学习 GPU 解决方案推荐

纵观人类几百年来的科技发展史,几乎所有的新兴学科的发展背后都有两个字——“烧钱”!作为近年来最火热的行业——人工智能,在烧钱方面同样不遑多让。众所周知,人工智能的训练和推理都需要海量的高性能计算,大型企业或者研究机构可以一掷千金部署
2020年8月5日
其他

手把手教你用云E | 用FLARE FEP计算相对结合自由能

Tools,OpenMM,LOMAP,Sire和BioSimSpace等开源工具与Cresset专业、直观特性相结合,为完全自动化的FEP工作流程提供了用户友好的界面(图1)。Figure
2020年7月29日