全红婵的水花,是如何消失的
撰文 | 龚 正
编辑 | 马 路
10月17日,刚在杭州亚运会收获2枚金牌的女子跳水运动员全红婵,和她的梦之队队友一起出现在了百度世界大会2023的会场。
她现在或是央视新闻主播“最怕”的知名运动员之一。很多主持人都因为把她的名字念成“金红婵”而被扣了鸡腿。所幸世界大会的主持人没有念错。作为全场最有公众知名度和人气的运动员,全红婵的一句话,解开了她成为顶级运动员的秘密之一。
#01
全红婵的半个教练
一身红色运动服,全红婵一走入百度世界大会会场,便受到全场热烈的掌声。在杭州亚运会的10米跳台决赛中,她以7个10分的绝佳成绩,一举斩获该项目金牌。
大众都好奇,她的“水花消失术”是怎么炼成的。
很朴实的全红婵在这场以AI为主题的大会上,青涩地揭了秘。
“百度的AI跳水辅助训练系统可以及时回放,平时训练我也会用它来抠动作细节,相当于我的半个教练。”
由于语气有点像背书,用词也说得很书面,全红婵的这一“硬广”一脱口而出,便让全场观众都会心一笑。
其实,全红婵说的是目前行业的一个趋势——即比赛已经“高度数据化”。一些项目的运动员,会身穿用来监控身体数据的训练背心,生成大量数据。而现在AI的进化版——大模型,能通过分析这些数据,帮助运动员调整自己的状态和策略,从运动员的训练分析、训练计划优化,到伤病预防与康复,都能发挥比以前更优的作用。
人工智能对体育锻炼的辅助与帮助其实不算新鲜事。不只游泳,从篮球到足球,很多体育项目都在使用AI来助力,因而也诞生了“AI体育”一词。
除了专业运动外,大模型也在普惠一般大众的健身。一些用户可能还记得智能健身镜这种产品,2020年后开始流行于中国市场。
这个产品的始祖是美国一位芭蕾舞演员发明的Mirror,2018年发明,初代产品价格1495美元(按时下汇率,合人民币10939元),不算便宜。
后来这类产品被中国智能制造持续升级,一个被增强的卖点就是在这面镜子里,配置了所谓的“AI智能动作指导”,为用户实施动作纠错。百度旗下的小度,也曾推出添添健身镜产品。
它的原理应该和专业跳水队用的AI系统一致。通过拆分用户的动作细节,来对提升成绩提供指导。同时AI也在这个过程中,通过数据学习,提高自己对该项运动的智能化理解。
目前国内一些智能健身镜品牌已宣称,将把AI大模型进一步与硬件进行创新融合,打破各种数据孤岛,进一步提升产品性能。
回到全红婵。其实,她“代言”百度的AI力,只是百度世界大会2023的一个插曲,展现的是AI、大模型在体育运动中应用的一个侧面,但这肯定不是大模型应用的全部。
#02
李彦宏问如何在承德买房
这次世界大会,百度正式发布了文心大模型4.0。李彦宏的一句话,直接把它送上了热搜——“文心大模型4.0的综合水平与GPT4相比已经毫不逊色。”
有敏锐的网友马上把“毫不逊色”上升到华为“遥遥领先”热词的高度。虽然这个词还没有完全破圈,但与今年3月百度上线文心一言内测版比起来,李彦宏确实自信了许多。有网友就评,至少敢现场测试文心大模型了。
“我想回承德买房,能用公积金贷款吗,手续怎么办?我在北京工作。”
这是李彦宏对文心一言做的第一个测试。现场,文心一言进行了回答。
这个提问有讲究,短句为主,逻辑有倒叙、句子背后藏着相关社会背景、政策背景,理解起来有一定门槛。很多普通人向大模型提问时,句子也不会像书面语那样严谨,反而会比较杂乱。这就特别考验大模型的智能理解水平。
李彦宏把大模型分为四个核心能力,理解、生成、逻辑和记忆。
理解就是大模型理解用户提问内容的能力,不仅是一般的理解,而是更深层次的理解。比如李彦宏的承德买房提问中,就隐藏着诸多社会信息——在北京工作、承德买房,意味着这是异地购房,每个城市都有相关的买房规定,大模型是否能给出有逻辑的正确答案。
而所谓的记忆能力,就是大模型能记住你之前问过什么,而不会每次打开大模型,都像和一个失忆的人对话,需要重新开始。
从结果论来看,李彦宏对文心大模型4.0的现场测试,提高了围观者对文心大模型的认知与信赖水平。
目前,不管是一般普通用户,还是企业端用户,都逐渐熟悉了大模型这类原本有点儿陌生产品的操作,并将其用于自己的生活与工作。比如写歌、写文章、作画,询问问题,加速自己的作业流程。
据公开发布,目前仅百度的文心大模型用户规模已经达到4500万,幕后相关的开发者有5.4万人。这还只是中国发布的130多个大模型中的一个(美国目前已有100多个参数规模10亿以上的大模型,编者注)。
借着大模型风口带来的机遇,李彦宏也在会场宣布,百度会用AI重构一切产品,这里面既包括新创的产品,也包括对既有产品的升级。
在这次大会上,百度就新推出了中国首个生成式商业智能产品——百度GBI(生成式商业决策工具)。
其在百度百科上的功能介绍颇为“幽默”,称其能听懂总裁问题,快速接入数据库(不再需要人工去跨数据库、跨表格分析),由AI来实时分析、快速得出结论。
在职场中,一些领导总希望员工能快速分析数据,给出决策方向。GBI因应的就是这一场景。你可以想象,作为职场中的你,在周会上对领导那种见招拆招的飒爽感。
另外,百度的一些传统产品也通过大模型技术改造,实现了功能升级。
比如百度的核心产品搜索,就升级为“百度新搜索”。比如,当输入“过去20年各国工业增加值排名”这一问题时,新的搜索结果会出现动态的图表,这被认为能提高公司内部做资料研究、做决策分析的效率。李彦宏表示,新搜索不是给链接,而是通过大模型的理解生成最好的答案。
又比如百度网盘和文库,演变成了“生产力工具”。网盘不仅能够实现视频的精准定位,还可总结提炼视频内容并形成金句和要点,文库则能够基于10亿优质资料实现写稿和PPT制作等功能,从而解放用户大脑。
这一切产品的升级,都来自于大模型能力的智能涌现与能力释放。
#03
国内大模型走到哪一步了
国内大模型的热潮已经持续近一年,市场有三类玩家入场,一是头部科技企业,包括互联网的百度、阿里、腾讯、华为、字节,以及人工智能企业如讯飞、商汤等;二是以复旦大学、中科院为代表的高校研究院;三是新型创业公司,比如前不久刚刚从阿里、腾讯、小米宣布获得3亿美元融资的百川智能。
目前,中国与美国事实上形成了全球大模型风潮的两大引领之一。对于中国而言,发力大模型领域的根本原则是“自主可控”。
不过从市场供需来看,部分声音认为,国内的大模型在数量上已经出现了泡沫。李彦宏就曾说过,“卷大模型没有意义,卷应用机会更大。”
对普通大众、乃至公司用户而言,关注大模型,一般关心两个方面。
● 国内大模型是否真的能同ChatGPT4分庭抗礼了?
● 国内大模型的实际应用如何?
对于第1个问题,过去几个月,中国企业的确是以ChatGPT为目标来进行追赶型发展的。
比如,阿里于今年4月发布的通义千问大模型,被称为最接近ChatGPT的水平;腾讯于今年9月初上线的混元大模型则称,中文能力已经超过GPT3.5;科大讯飞称,于今年10月发布的星火大模型的明年目标是超过GPT4。而最新的百度世界大会,李彦宏则称文心大模型4.0已经“毫不逊色”GPT4。
随着国内各企业的实践,市场基本形成了这样几个认知:
● 国内大模型从表面上看有同质化趋势;
● 大模型的训练成本昂贵,比较烧钱(ChatGPT的训练成本昂贵。市场有一说:每训练一次,相当于报废3000辆特斯拉汽车),想要进入这个领域的企业或创业者需要有清醒的认知,没必要家家户户都做大模型。比如新希望董事长刘永好就表示,“传统制造业企业没必要花几十亿、上百亿去做大模型。”
● 国内互联网企业在算力上拥有优势,考验的难点在于是否拥有优质的开源中文数据集(目前国内“数据孤岛”现象比较重,不互联互通),以及对数据的处理能力(包括数据配方能力、数据清洗能力、参数设置能力等)。实际上这些看不到的能力,各家还是有差别的。
对于第2个问题,实际应用如何?
之前业内一个说法是每个行业都需要有自己的垂直大模型,后来有人认为,更准确的说法是“大模型在垂直领域的功能强化”。
从目前大模型对产业的实际赋能来看,已经有了一些早期的实践,积累了初步的成果。
医疗领域,华为云发布的盘古医学大模型,着重强调自己具备医学临床辅助能力;金融领域,腾讯云行业大模型称,为10大行业提供了50个解决方案。其中,就有对金融客户建构自身大模型的服务。
交通领域,百度智能云发布了基于大模型重构的智能交通解决方案——ACE3.0,将车、路、云、图的基本能力和交通要素进行了整合和升级,在交通感知、认知、预知、交互能力上做了提升。
这次世界大会,百度集团资深副总裁、智能驾驶事业群组总裁李震宇就表示,大语言模型上车,会让两者更紧密地结合到一起,多模态端到端的技术将会成为智能汽车的核心大脑,让智能汽车从底层真正意义上变成一个全新的物种。
当然需要看到,这些赋能还处于初级阶段,行业使用大模型的热情还需要进一步激发。这背后是行业者的一个潜在共识和期盼,徒有技术、没有产品,让技术走下高坛,不会真正产生生产力和创造力。
或许可以借用这次百度世界大会上的一个概念来总结大模型与产业之间的关系:大模型到了从“能力涌现”到“价值涌现”的时候了。
没有获得感,大模型就永远只在模型环节。