赶超GPT4!百度文心大模型4.0发布,10余款AI原生应用亮相
GPT4国内最强对手来了?
今天上午,百度正式发布了文心大模型4.0,同步开启邀请测试。
百度创始人、董事长兼首席执行官李彦宏表示,文心大模型4.0的“综合水平与GPT4相比毫不逊色”,并现场展示了其在理解、生成、逻辑和记忆四大能力上的显著提升。
同时,百度发布了十余款AI原生应用,包括搜索、网盘、地图、文库等产品全新升级,以及国内首个生成式商业智能产品“百度GBI”。
这些AI原生应用长什么样?将在我们的工作和生活中发挥什么作用?“头号AI玩家”为你总结了本次大会的主要亮点。
文心大模型升级4.0,
逻辑和记忆能力提升更大
大模型的战场首先比的是速度。
文心大模型一直在快速迭代中。自3月发布以来,文心一言在一个月内即完成四次升级,让大模型的推理成本降低至原来的十分之一;文心大模型升级至3.5版本后,训练速度提升到原来的3倍,推理速度达到原本的30多倍。
百度首席技术官王海峰介绍道,相比3.5版本,文心大模型4.0版本在理解、生成、逻辑、记忆这四大核心能力上都有了显著提升,其中理解和生成能力的提升幅度相近,逻辑和记忆能力的提升更大。
李彦宏现场演示了文心一言这四大能力在不同场景中的应用。
1.理解能力:一句话帮你办理公积金贷款
“我想回承德买房,能用公积金贷款吗?手续怎么办?我在北京工作。”
这样一个前后乱序、意图模糊的复杂表述对模型的理解能力提出了更高的要求,而文心一言准确理解了提问者的户口在承德、公积金在北京缴存的潜台词,给出了针对异地贷款购房的政策解释。
2.生成能力:3分钟生成汽车广告素材
输入一张汽车照片,要求文心一言生成两张图片,背景是富有生机的景色,同时呈现车的飞驰感。
继续输入指令,让文心一言结合官网上这款车的信息,做一张竖版的广告海报,再写5条文案,包含标题和描述,最后再生成一个数字人的口播广告视频。
以上全过程不到3分钟,AI就能生成一整套图文并茂、可以用于信息流投放的广告素材。随着AI的生成能力不断增强,内容生产效率得以大幅提升,李彦宏表示未来“一个人就是一支营销队伍”。
3.逻辑能力:帮家长轻松辅导功课
在逻辑推理能力方面,李彦宏让文心一言帮助家长辅导孩子做作业,展现大模型重塑教育的智能化水平。
面对一道几何数学题,文心一言的回答逻辑清晰,给出了详细的解题步骤,还能指出涉及了哪些知识点,培养孩子举一反三的能力。
4.记忆能力:人机共创武侠小说
记忆能力是衡量大模型智能程度的重要指标。我们可以通过多轮对话来测试大模型对前后文的记忆是否统一。
比如让文心一言写一篇武侠小说,它很快给出了背景设定,给女主角命名为“灵儿”,说她拥有操纵内力和飞行的能力,并设计了一个反派首领“黑影”,简要讲述了故事的开篇、高潮和结尾。
李彦宏表示这里面的人物关系太简单了,要求文心一言再增加四个角色,然后再给故事主线增加戏剧冲突。文心一言按照要求进行了补充和修改,并设计了剧情反转,黑暗势力背后的真正主导者其实是一位德高望重的宗师级人物。
经过多轮对话,文心一言记住了前面所有的需求和答案,最后写出了完整的故事大纲,拟定小说标题《江湖风云之正义之战》,每个章节的情节和人物都能准确对应。
当然,这四大能力并不是单一存在的,我们看到的AI产品多是在此基础上的综合应用。李彦宏还演示了AI数字人医生如何结合语音、视觉等多模态能力,帮助患者解读药品说明书,满足个性化需求。
目前文心大模型4.0已开始邀测,现场观众扫描嘉宾证二维码,登录文心一言官网或下载最新版文心一言APP就可以体验;企业客户也可以通过百度智能云千帆大模型平台来申请测试文心4.0 API。
所有产品用大模型“重做一遍”
除了大模型的最新进展,在本次大会上,百度也展示了一系列用大模型重构的AI原生应用,为各行各业提供全新的智能化解决方案。
正如李彦宏所说,卷大模型不如卷应用。什么是AI原生应用?他认为需至少满足三个条件:第一,能用自然语言交互,这是最根本的变化;第二,能充分利用理解、生成、推理、记忆等,这些过去不具备的技术能力;第三,每个应用的交互都不超过两级菜单。
1.百度新搜索:更懂你的互动式搜索
搜索是百度的起点,而有了大模型支持的搜索结果将呈现出全新的面目。百度新搜索具备极致满足、推荐激发、多轮交互三个特点。
比如搜索“过去20年各国工业增加值排名”,以往可能是一条条相关但不准确的回答,需要自己费力筛选,现在AI可以一步给出最极致的答案,不仅提炼出准确数据,还能以图表的形式展现结果,并继续推荐用户可能感兴趣的相关问题。
“北京周边登山去哪比较推荐?” 在多轮交互中,百度搜索可以根据不同人群的偏好需求,逐步细化和明确问题,推荐比如适合新手的亲子游,登山徒步所需的装备等。
李彦宏称生成式AI与搜索是天作之合,扩大了产品边界,将来搜索会变成一个贴心助手,随时唤起来解决问题。
2.百度GBI:企业决策利器
不同于百度搜索,百度GBI是一个从0做起的新产品,李彦宏介绍这是“企业真正的决策利器”。
产品宣传视频显示,GBI能直接听懂总裁问题,在会议中实时执行数据查询与分析,快速得出结论,让总裁当场决策,不用人工去跨数据库、跨表格分析。GBI可以把商业分析师十几天才能完成的数据分析、撰写报告工作,缩短到分钟级。
3.百度新如流:一键总结会议、安排差旅
如流是百度推出的智能办公平台,AI超级助理可以帮员工一键总结会议纪要,上千条未读的群聊信息也能1秒提炼,划出重点。
在差旅场景中,AI助理还能帮助搞定繁琐的机酒预订、行程安排等工作,通过和CRM等公司系统数据打通,还能让AI根据项目进展生成一份洽谈的参考资料,预设客户可能提出的问题。
李彦宏表示,提升效率,就是提升竞争力,如流让“智能工作”代替“勤奋工作”。
4.百度新文库:向生产力工具进化
百度文库是李彦宏认为目前重构最彻底的一款产品,从内容工具变成了生产力工具。
比如准备一场“AI在心理学领域的应用”的主题演讲,过去需要花好几天查资料、整理素材、写稿、写PPT、美化PPT,现在用一句话就能启动创作。
基于对10亿文档内容的理解,百度文库可以快速找到需要的专业素材,一键生成实用的文档,对文稿进行润色和排版,并结合资料自动生成PPT,用户可以切换模板风格,甚至让AI推演观众的提问生成答案。
不久前,百度文库新版本开放首日,AI新功能迎来了超过200万人次体验。
此外,李彦宏还现场演示了大模型与更多百度产品的应用:在百度地图中,用户只需说出需求,地图就能调动几千个服务接口,帮助用户推荐餐厅、对比多地点信息、给出出行建议;百度网盘不仅能精准定位到视频某一帧,还能在几秒钟内总结完长达1小时的视频内容,并从中提炼出金句和要点。
大模型开启繁荣的AI生态,
插件开发者超2.7万
比如大模型接入权威法律数据的“智能法律助手”,能为用户提供法律咨询的相关建议,而简历助手插件则能帮用户一键生成简历模板。
9月百度推出了灵境矩阵插件平台,上线一个月已经有超2.7万家开发者申请入驻,覆盖了20多个领域,其中个人开发者占比超过了30%。
AI原生应用调用基础大模型的主要方式是API。在百度的千帆大模型平台上,企业可以快速调取包括文心一言在内的各种大模型的API,获得大模型的能力。
据李彦宏介绍,目前千帆大模型平台已有42个主流大模型入驻,17000家企业基于此开发产业模型和解决方案,覆盖近500个场景。
李彦宏认为,未来AI原生应用一定是多模态的,在信息世界之外,一定会重构物理世界。随着大模型技术不断提升,今后大量AI原生应用将不断涌现,数字技术与实体经济将深度融合,共同创造新一轮经济增长。
“我们即将进入一个AI原生的时代,一个人机通过prompt交互的时代。” 百度等头号AI玩家的竞争愈演愈烈,而我们正在见证大模型逐渐改变我们的生活。
「头号AI玩家交流群」进群方式:添加微信“banggebangmei”并备注姓名+职业/公司+进群,欢迎玩家们来群里交流,一起探索见证AI的进化。
也欢迎围观小红书@头号AI玩家,我们在这里日常练习AI绘画。