查看原文
其他

从讯飞华为联手,我们看到了国产大模型的“三级跳”

山核桃 财经无忌 2024-01-21






时间拨回到今年5月6日,星火认知大模型刚发布时,“国产大模型追上chatGPT还要多久”成了一个热议的话题。当时,科大讯飞董事长刘庆峰向外界展示了这家有着24年历史的AI龙头企业在大模型浪潮中清晰的发展时间表——到10 月 24 日,也就是昨天,科大讯飞要开发出中文水平超越 ChatGPT,英文水平与之相当的大模型应用。

“我们如期兑现了自己给大家的时刻表。”

在合肥体育中心内,现场座无虚席,会场两侧都站满了人。在昨天举办的2023科大讯飞全球1024开发者节上,刘庆峰宣布了讯飞星火认知大模型V3.0版本(以下简称:星火V3.0),两个多小时的现场分享中,刘庆峰一如既往地语调洪亮。

星火V3.0在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力和多模态能力7大方面都有了显著的提升。根据国务院发展中心国研经济研究院的横评报告,星火大模型综合能力已超越ChatGPT,实现国内领先,国际一流,且在教育、医疗和法律行业表现尤为突出。

星火V3.0七大能力持续提升  作者摄

半年内完成大模型能力的三次大升级,这是科大讯飞交出的大模型答卷。而与华为的合作成为了这场发布会的另一大重要看点。

在同日的发布会上,刘庆峰官宣了与华为最新的动态,科大讯飞联合华为打造了基于昇腾生态的自主可控大模型算力底座“飞星一号”平台,讯飞星火大模型将在下一阶段开启对标GPT-4的更大规模训练。

大半年来,讯飞华为的生态合作,是当下国产大模型加速竞争下的一个新趋势。头部科技企业之间,基于各自生态位的合纵联横和强强合作,既能形成技术与业务间的互补,又能加速大模型的商业化与行业化落地。

我们好奇的是,这一联手合作将对中国大模型的未来有什么深远意义?



一个业内的共识是,由ChatGPT引爆的“百模大战”至今,国产大模型已从“卷参数”进入了“卷应用”,红衫资本在近期的一份研究报告中也指出,当下的大模型竞逐已进入第二阶段,比起技术,更强调产品体验与应用形态。

一位国内头部券商传媒领域分析师曾对财经无忌分析:“中国科技公司最擅长的场景与应用,移动互联网时代已是存量博弈,大模型时代会更有机会。”

但进入“应用战”后,横亘在国产大模型眼前,也有看得见的两道关卡:

一是,成本难关。暴涨的算力需求下,随着AI大模型加速商业化部署,需要高功率、高算力的基础设施。大模型研发高度依赖高端AI芯片、集群及生态,不断攀升的算力成本,让许多企业只能“望模兴叹”。

二是,应用难关。不同行业场景中企业和开发者,对于大模型的和使用方式有不同的差异,如何进一步降低大模型的使用门槛,让大模型真正用起来,需要国产大模型厂商找到高频刚需的应用场景,打造杀手级应用。

而讯飞与华为的携手,本就是为了纾解上述国产大模型的燃眉之急。

首先,华为有更强的算力基础。华为此前已宣布,昇腾AI集群规模已从最初的4000卡集群扩展至16000卡,是业界首个万卡AI集群,拥有更快的训练速度和30天以上的稳定训练周期。

其次,科大讯飞也有更强的大模型能力。作为一家人工智能龙头企业,一方面,科大讯飞有着强大的算法优势与清晰的技术路径。

另一方面,对场景的理解能力,不同于其他大模型厂商,科大讯飞思考的不止是技术,而是前沿技术开发与商业化的齐头并进。

星火认知大模型迭代至V3.0版本,科大讯飞在现场重点演示了星火V3.0在数学能力、小样本学习、代码能力、英语能力和多模态能力的提升。

以英语能力与多模态能力为例,星火能自如地进行更native的英文阅读、写作与润色。而在多模态能力上,星火现场制作起了儿童绘本,能够跟自如地根据prompt生成更多细节与故事性的图案。

正如上文所说,科大讯飞在创业的24年中,已形成了研发与商业化并行的路线。因此,每一次随星火认知大模型同时能力迭代的,是科大讯飞一系列的产品与行业方案的升级。

星火现场制作起了儿童绘本  作者摄

在现场,科大讯飞发布了星火V3.0的能力集成与部署进一系列赋能行业与场景的商业化产品中,这之中既包括了一系列落地于教育、办公、医疗等行业场景的AI原生应用,如全新升级的iFlyCode2.0(智能编程助手),与中科院文献情报中心联合打造的星火科研助手、教育领域的AI心理伙伴、医疗领域的晓医助手等,也包括了直面C端的智能硬件产品,如具备英语AI答疑辅学的讯飞AI学习机、面向未来的人形机器人等。

星火文献科研助手可阅读文献、

整理综述与润色文本  作者摄

讯飞晓医助手现场演示

如何分析体验报告 作者摄


这是科大讯飞区别于其他互联网大厂的独到优势。多年创业路上对人工智能技术商业化的思考以及服务政企、教育等客户的经验,让科大讯飞具备了更快地将前沿技术结合前端市场需求,进行变现的能力。

科大讯飞很早就提出了“1+N”架构,对于大模型与行业结合,有自己一套清晰可见的布局。讯飞研究院院长刘聪曾在一次采访中表示,大模型与行业的结合,不是简单把大模型的能力API调过去就能用,而是要具体设计产品功能,并且要结合用户的需求。

当方向正确清晰,路径与方法论就自然而然地形成,焦虑也就化为了动力。

刘庆峰坦言,在chatGPT横空出世之时,身边很多人都十分焦虑:“担心我们的技术会差。”。

但讯飞华为基于各自优势领域的互补与协同,从供给与需求两侧,能更务实地解决当前国产大模型所面临的焦虑。

一方面,在供给侧,以华为昇腾AI为核心,软硬件协同优化,讯飞星火认知大模型在算力层构建了性能更优越、供给更稳定和数据更安全的大模型训练集群,为大模型的深度应用提供了自主创新的算力底座。

另一方面,在需求侧,讯飞星火认知大模型的技术优势与场景理解能力,本身也能高效适配昇腾AI,进而降低大模型使用门槛,加速行业落地。

而在刘庆峰看来,另一重关键意义则是缩短国产大模型与GPT-4之间的差距。

“中国现有的大模型根基实力,与GPT-4仍有差距。”刘庆峰坦言,在复杂知识推理、小样本快速学习、超长文本处理以及跨模态的统一理解上,国产模型还有不小的差距。

只有正视差距,才能实现超越。此次讯飞与华为携手,无疑也将为讯飞星火等国产大模型在下一阶段对标GPT4,实现超越,做好更长期准备。



从技术的演进与发展史来看,一个颠扑不破的规律是,颠覆性的技术从实验室走向普惠,强强联合远比单打独斗效果要好,过去科技巨头们的经验已印证了这一观点。

在PC时代,微软和英特尔就曾为推动个人电脑产业的发展,组成了Wintel联盟,英特尔的硬件优势与微软的软件生态结合,双方协同创新,最终拉动了产业的升级,大大促进了个人电脑性能的提升与用户体验的升级。

在移动革命掀起时,早期苹果之所以能重新定义消费电子产品,背后离不开与芯片设计公司ARM的深度合作。

讯飞与华为所形成的国产AI生态合作,也是如此。超越零和博弈的竞争思维,寻求技术落地的破局点,上述案例已然印证了,“强强联合”往往能引领一个时代的发展。

大模型的诞生第一次让人们瞥见了通往AGI世界的可能,但大模型能力的进化必须依赖更先进的算力底座,而算力底座从能用到好用,必须依赖成熟大模型厂商的协同,没有使用,就不能形成规模优势,形成数据飞轮,就无法均摊算力底座高昂的技术投入。

今年8月中旬,科大讯飞联合华为推出了大模型算力硬件 “星火一体机”。一体机的特点是可以私有化部署大模型,让所有企业都可以在国产自主创新平台上私有化部署大模型。

1个月后的华为全联接大会上,刘庆峰在演讲中透露了与华为的进一步合作。而在昨天,科大讯飞联合华为正式推出基于昇腾生态的自主创新大模型算力底座“飞星一号”平台,支持讯飞星火大模型在对标GPT-4之路上,实现更大规模的训练。

发布会现场,
科大讯飞董事长刘庆峰给出的时刻表   作者摄

“科大讯飞敢于对标 ChatGPT 并超越,让人们对中国大模型时代快速发展的未来充满信心”。据华为科技有限公司副董事长、轮值董事长徐直军透露,发布“飞星一号”平台,让星火的训练效果翻番。

超越ChatGPT 并不容易,但这是国产大模型必须要走的关键一步,也是中国大模型生态进化的关键一步。



从更深远的价值来看,讯飞华为联手,实则在更加严峻的逆全球化趋势下,为国产大模型发展提供了一条自主创新的路径,也为全世界的大模型发展提供了第二选择。

“讯飞华为携手,不仅是中国企业的相互抱团,更是为世界提供第二选择。”刘庆峰说。

科大讯飞董事长刘庆峰

强调了技术的自主可控   作者摄


从此前美国商务部工业安全局多次针对中国算力产业链的制裁就能看出,无论是将关键企业列入实体清单,还是升级管制规定,本质上都是延缓中国技术的发展速度。

在大模型技术爆发的当下,中美也掀起了新一轮技术军备竞赛,尽管仍旧存在着差距,但在此轮技术升级中,中国科技企业也并非是仓促应战。

据财经无忌观察,中国大模型生态为实现真正的自主创新,主要沿着两条路径:一是产业链关键环节的自研,例如自研芯片、框架、工具链等;二是通过扩大生态,国产大模型厂商与自主创新的算力底座相结合,共同培育本土产业链生态。

后者无疑更有未来,产业意义也更大。国际产业链表现所表现出的不确定性,倒逼中国企业必须要认清现实。一方面,在智算资源部署上,如华为一样的科技公司将AI算力做精、做实。

另一方面,而在模型具体能力升级上,如科大讯飞一样的人工智能企业也在通过不断的技术投入与跃升的产品能力,加速大模型落地行业。

刘庆峰在现场分享了一个讯飞华为的细节小故事。为了更快地构建算力底座,推出“飞星一号”,华为派遣了员工入驻到讯飞合肥总部,组建“联合特战队”,整个合作过程中,双方团队都出了许多心血。

“随着核心技术的突破,产业生态的持续完善,利用场景的深化,训练数据的打磨,大模型时代的序幕才刚刚拉开。”刘庆峰对国产大模型的未来做出这样的判断。

毫无疑问,大模型赋能千行百业将是一场硬仗,但只有自主创新才能真正实现超越。讯飞华为所选择的无疑是一条更难的路,但也是一条更广阔的路。











继续滑动看下一个

从讯飞华为联手,我们看到了国产大模型的“三级跳”

山核桃 财经无忌
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存