查看原文
其他

上云记 | 青云科技护航清华天津电子院产学研创新

服务数字中国的 青云科技
2024-08-23

作为清华大学电子信息学科的成果转化基地,清华大学天津电子信息研究院(简称“清华天津电子院”),在天津滨海新区政府和中新天津生态城管委会的支持下成立,由清华大学电子工程系负责运营管理,发挥清华大学高水平科学研究及人才培养的优势,推动电子信息领域科研成果的工程实现及产业化。

为了更好地推进人工智能产学研用生态体系建设,实现人工智能科教生态圈目标,清华天津电子院构建了人工智能大数据平台。平台为用户提供自主可控的算法资源、科学精准的计算服务和算力澎湃的人工智能训练运算环境。同时中心聚焦人工智能行业应用,提供整体解决方案服务、算法和数据的混合云服务。

与大多数高性能计算的应用平台一样,清华天津电子院最初采用了全物理集群。对于师生来说,常常需要排队等待资源,紧急作业无法立即执行的情况时有发生。对于技术中心来说,任务计算完毕后有效回收资源存在一定难度,部分单个任务经常超额占用物理节点,导致资源利用效率低下。

云计算与 EHPC 统一运营运维


高性能计算资源利用最大化
为更好满足教科研一体化、科技成果转化的需求,清华电子院计划以云平台实现云资源池和 HPC 集群的统一管理与维护,实现运营计费能力,提供丰富 PaaS 服务组件的同时,以简单、易用的页面支持师生自助服务,提升管理效率与自动化水平。

通过青云科技多元算力的超级智算平台,清华天津电子院实现同一平台下同时管理云计算集群和 HPC 集群,重构硬件资源,以云计算和 EHPC 服务形成了智慧运营的创新基础设施,通过统一架构的超算云平台对内对外提供服务,同时可以根据需求灵活配置所需的软件仓库,除了独享节点的 HPC 服务,也提供弹性计算集群的 EHPC 服务,且均可以通过图形化界面进行自助操作。

其中,EHPC 使用虚拟化的方式运行集群,提升硬件资源使用率,可以保证紧急任务的完成。通过青云提供的全栈云计算能力,清华天津电子院丰富了资源提供类型,实现业务快速上线和网络、安全、计算、存储等资源的弹性扩展,资源利用率也大幅提升。

运营运维更简便
此外,青云提供了租户的资源隔离与计量计费,并提供多种计费模式、运营指标报表,清华天津电子院可以通过计费及资源到期的技术手段来实现资源回收。

同时,从用户视角的出发,青云以私有化的部署让清华天津电子院的云平台使用者得到了公有云的体验。通过统一的门户,用户可自助在平台上申请自己所需的服务、功能及硬件资源,完整的操作目录、直观的访问界面与操作提示,让用户能够快速上手。

依托青云大规模数据中心的管理经验,清华天津电子院的 IT 人员不仅可以自动化部署提升运营效率,还可以通过统一运维平台,便捷实现日常巡检运维,以极低人力投入实现故障处理、问题跟踪、性能分析等复杂工作。

有了扎实的底层支撑,清华天津电子院通过共享人工智能领域最新科技成果和解决方案,服务于不同行业的实际业务场景,充分将产学研融合落到实处。青云科技将持续为其科技创新工作和数字化创新业务提供服务,促进大量科研成果转化,构建应用生态,支持创新、创业、创造实践活动的开展,与清华天津电子院共同为“创新中国”共同努力。

- FIN -

更多推荐



   

点击“阅读原文”了解更多用户案例

继续滑动看下一个
青云科技
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存