查看原文
其他

华为盘古大模型:自主创新,不会开源

雨仔 IT之家 2023-09-02
在 7 月 7 日举行的华为开发者大会 2023 上,华为云 CEO 张平安宣布,盘古大模型 3.0 正式发布
张平安表示,盘古大模型 3.0 是一个完全面向行业的大模型系列,包括 5+N+X 三层架构,IT之家汇总如下:
第一层 L0 层是盘古的 5 个基础大模型,包括自然语言大模型、视觉大模型、多模态大模型、预测大模型、科学计算大模型,它们提供满足行业场景的多种技能。
盘古 3.0 为客户提供 100 亿参数、380 亿参数、710 亿参数和 1000 亿参数的系列化基础大模型,匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。同时提供全新能力集,包括 NLP 大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力,这些技能都可以供客户和伙伴企业直接调用。无论多大参数规模的大模型,盘古提供一致的能力集。
第二层 L1 层是 N 个行业大模型,既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等;也可以基于行业客户的自有数据,在盘古的 L0 和 L1 上,为客户训练自己的专有大模型
第三层 L2 层是为客户提供更多细化场景的模型,它更加专注于某个具体的应用场景或特定业务,为客户提供开箱即用的模型服务。
盘古大模型采用完全的分层解耦设计,可以快速适配、快速满足行业的多变需求。客户既可以为自己的大模型加载独立的数据集,也可以单独升级基础模型,也可以单独升级能力集。
在 L0 和 L1 大模型的基础上,华为云还为客户提供了大模型行业开发套件,通过对客户自有数据的二次训练,客户就可以拥有自己的专属行业大模型。同时,根据客户不同的数据安全与合规诉求,盘古大模型还提供了公用云、大模型云专区、混合云多样化的部署形态。
据介绍,盘古可以一己之力做到网络搜索、请教专家、参考案例、查阅书籍等,让每个开发者都拥有一个自己的编程助手,甚至还可以实现一句对话代码生成、一个按键用例测试、一次点击自动注释、一条指令智能部署,极大地简化了开发的流程。
在气象领域,盘古气象大模型号称是首个精度超过传统数值预报方法的 AI 预测模型,同时预测速度也有大幅提升。原来预测一个台风未来 10 天的路径,需要在 3000 台服务器的高性能计算机集群上花费 5 小时进行仿真。现在基于预训练的盘古气象大模型,通过 AI 推理的方式,研究者只需单台服务器上单卡配置,10 秒内就可以获得更精确的预测结果。
张平安称,盘古大模型 3.0 围绕“行业重塑,技术扎根,开放同飞”三大方向,持续打造自己的核心竞争力。
此外,华为云相关负责人表示,华为云盘古大模型全栈技术均由华为自主创新的,没有采用任何开源技术,另外,由于华为云盘古大模型定位于赋能千行百业,这里面必将聚集无数行业大数据(涉及行业机密等),因此未来盘古大模型不会开源。
在谈到目前行业领先的 ChatGPT 时,华为云 CEO 张平安表示,ChatGPT 主要用来聊天,盘古大模型没时间聊天,二者“不在一个轨道上”。
张平安还批评了目前市面上的 AI 作诗 / 作画工具:“如果一个大模型不能解决行业问题,参数再多也没有什么用处,AI 最不应该做的就是作诗、作画,这些工作应该人类艺术家来做。”

另外,近期还有不少热门内容,点击下方蓝字即可查看:


再次遥遥领先 
↓↓↓

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存