查看原文
其他

腾讯揭开大模型面纱

北京商报 北京商报 2023-11-07


全文共2371字,阅读大约需要5分钟



业内人士并不是今天才听到混元大模型这个名字,但在腾讯全球数字生态大会上,混元是第一次当主角。


记者丨魏蔚



不再低调,腾讯大方展示大模型产品。


9月7日,腾讯大模型混元在2023腾讯全球数字生态大会上正式对外亮相。在现场,腾讯高管演示了混元大模型功能,罗列了已经接入混元大模型的腾讯云、腾讯广告、腾讯游戏等50个业务和产品。


图片来源:企业供图


自大模型风起,腾讯的态度始终是不着急慢慢来,这让当天的高调展示像是剧情反转。巧合的是,蚂蚁集团将在9月8日发布自己的大模型产品,科技巨头的大模型PK才刚刚开始,腾讯要走的大模型+产业之路是同行们的默契之选。


秀肌肉


在腾讯云每年最重要的全球数字生态大会上,神秘的腾讯混元大模型终于来了。“混元,正式面向产业亮相。”腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生在9月7日宣布,“腾讯混元大模型拥有超千亿参数规模,预训练语料超2万亿tokens。目前,混元已经与腾讯的产品,进行了广泛的对接和集成,在腾讯云、腾讯广告、腾讯会议、腾讯文档、微信搜一搜等多个业务线应用。”



以腾讯会议+混元大模型为例,用户只需要简单的自然语言指令,就能完成会议信息提取、内容分析等复杂任务,会后还能生成智能总结纪要。据实测,在指令理解、会中问答、会议摘要、会议待办项等多个方面,混元大模型均获得较高的用户采纳率。


其实,业内人士并不是今天才听到混元大模型这个名字,了解它的功能,但在腾讯全球数字生态大会上,混元是第一次当主角。为了展示,腾讯集团副总裁蒋杰花了大量时间,在现场演示混元在降低幻觉现象、生成超长文本等方面的能力。



据蒋杰介绍,针对大模型容易“胡言乱语”的问题,腾讯优化了预训练算法及策略,让混元大模型的幻觉相比主流开源大模型降低了30%-50%;通过强化学习的方法,让模型学会识别陷阱问题;通过位置编码优化,提高了超长文的处理效果和性能;提出思维链的新策略,让大模型能够像人一样结合实际的应用场景进行推理和决策。具体到功能,混元大模型可以进行内容创作、逻辑推理等。


北京商报记者查询国家网信办官网发现,腾讯混元助手大模型出现在第二批境内深度合成服务算法备案清单中,清单上还包括腾讯云智能数智人算法、腾讯云AI绘画算法、腾讯云多行业客服场景大模型等。


不着急


和科技圈同行相比,腾讯对大模型更加谨慎。3月16日,百度大模型产品文心一言启动邀请制内测。当月,360智脑大模型1.0版本亮相。4月初阿里云自研大模型“通义千问”开始邀请用户测试体验,5月科大讯飞星火认知大模型紧随其后。据不完全统计,目前国内已有100多个大模型。


从节奏上看,腾讯的动作不算迅速。8月初,腾讯混元大模型进入公司内应用测试阶段。收到内部邮件要求的腾讯员工,可以通过网页或者小程序体验混元大模型。据了解,混元大模型支持文字输入、语音输入,可以生成小红书种草文案、短视频脚本、社群营销文字、朋友圈文案等,支持赛博朋克、像素插画、马赛克等风格的AIGC(人工智能生成内容)绘画生成。



对于节奏,腾讯有自己的想法。在5月的财报会议上,马化腾将AI类比发明电的工业革命,“对于工业革命来讲,早一个月把电灯泡拿出来,在长的时间跨度上来看是不那么重要的。关键还是要把底层的算法、算力和数据扎扎实实做好”。


腾讯后知后觉的风格也不只体现在大模型风口,在元宇宙爆火时只提全真互联网,云计算群雄并起时不慌不忙。


回到当下的大模型竞赛,腾讯云6月中旬推出MaaS(模型即服务)已经是最有代表性事件。这个方案能为客户提供模型预训练、模型精调、智能应用开发等行业大模型解决方案。企业可以根据腾讯云TI平台内置的大模型,加入企业自己的数据,生成专属模型,或根据自己的业务规模,选择不同参数、不同规格的模型服务。当时,腾讯云的行业精选模型商店提供覆盖10个行业超50个解决方案。


有默契


这组数据在9月7日有了更新版。汤道生披露:目前腾讯云行业大模型精选商店既提供混元大模型,还上架了20多种行业开源通用大模型,以及覆盖金融、文旅、零售等20多个领域的行业大模型。


9月7日,腾讯再次强调,混元大模型将作为腾讯云MaaS(大模型即服务)服务的底座,客户可以直接通过API(应用程序编程接口)调用混元,也可以将混元作为基底模型,为不同产业场景构建专属应用。


根据最新财报,2023年二季度代表腾讯toB业务的“金融科技及企业服务”营收同比增长15%至486亿元,占总营收的32%。这一板块中企业服务营收有所改善,实现低双位数同比增长,得益于视频号直播带货交易产生的营收以及云服务的轻微增长。



不管通过云计算、AI还是数字经济的市场规模看未来,toB赛道都离天花板尚远。


腾讯集团副总裁、云与智慧产业事业群COO、腾讯云总裁邱跃鹏表示:“云是大模型的最佳载体,大模型将开创下一代云服务的全新形态。”“基于产业场景”是腾讯反复强调的方向,也是其他同行的目标。仅这一周时间,召开大模型相关发布会的百度、百川智能都不掩饰自己的toB野心。


“传统产业数字化过程中有痛点想提效,科技企业有解决方案要营收,大厂的优势在于更容易给样本,原来的云计算客户就是潜在客户,创业公司的压力会比较大”,比达分析师李锦清向北京商报记者表示。



但在百川智能联合创始人茹立云看来,“大厂和创业公司都在做通用领域的大模型,未来很多垂直领域跟行业数据或者场景,会出来很多大模型,这是非常有机会的点。大模型应用生态刚刚起步,无论是toB还是toC未来都有广袤的机会留给创业公司”。


值得一提的是,2023腾讯全球数字生态大会召开的同时,蚂蚁的2023 Inclusion·外滩大会也隔空启动。北京商报记者从蚂蚁相关人士处了解到,蚂蚁集团将于9月8日发布自己的大模型产品。



编辑丨汪乃馨 
图片丨北京商报、企业供图、腾讯云官网截图、壹图网、视觉中国


继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存