查看原文
其他

腾讯发布混元大模型!

见实 见实
2024-09-05
关注「见实」,获取超全一手私域案例合集

于9月7日召开的数字生态大会上,腾讯正式发布“混元大模型”。

腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示:

混元大模型已接入腾讯50多个业务并取得初步效果,包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等业务和产品。

汤道生表示,千行百业也可以通过API调用混元,或者将混元作为基底模型,为不同产业场景构建大模型应用。为此,腾讯已经和1万1千家生态伙伴展开紧密合作,推出了覆盖100多个产业场景的行业解决方案。

根据当天公布的信息显示,腾讯混元大模型拥有超千亿参数规模,预训练语料超2万亿tokens,具有强大的中文理解与创作能力、逻辑推理能力,以及可靠的任务执行能力。

腾讯集团副总裁蒋杰

表示:“我们研发大模型的目标不是在评测上获得高分,而是将技术应用到实际场景中。”

汤道生称腾讯将迈入“全面拥抱大模型”时代:“以大模型生成技术为核心,人工智能正在成为下一轮数字化发展的关键动力,也为解决产业痛点,带来了全新的思路。腾讯产业互联网将通过智能增强、数据增强、连接增强,持续助力产业增强。”

对了,在小程序搜索‘腾讯混元助手’,即可申请内测体验,以下是汤道生和蒋杰两位高管在现场的分享要点,供大家参考:

腾讯集团高级执行副总裁
腾讯云与智慧产业事业群CEO 汤道生

尊敬的各位领导、嘉宾、媒体朋友们:


早上好!欢迎大家光临腾讯数字生态大会,非常高兴再一次相聚深圳宝安,在这里,我也特别感谢深圳市政府、宝安区政府,一直以来对我们的大力支持。


从上一届合作伙伴大会到现在,虽然只有一年的时间,但我们与宝安的合作,进展迅速。腾讯云工业互联网总部基地,已经助力了300多家宝安企业的数字化转型;“大湾区人工智能创新中心”和“智能网联技术创新联合实验室”先后建成,全面拥抱人工智能时代。


这是争分夺秒的深圳速度,也是全国各地、各行各业加速拥抱产业互联网的真实写照。产业数字化,越来越多从构想走向现实。腾讯对实体产业的助力,覆盖越来越广,场景越来越深,能力越来越强,我们与合作伙伴的定位与协同,分工越来越清晰,生态也越来越繁荣。


我们深信产品为王,坚定做扎实的技术,构建性能卓越、自主可控的云产品体系。


五年来,腾讯的研发投入超过2300亿,在核心数字科技的许多领域,实现了性能的突破。

比如在音视频领域,腾讯编码器在MSU世界大赛中,一次性包揽了全部15个世界冠军。又比如,结合了腾讯云高性能的星星海服务器、深度优化的操作系统Tencent OS与自研数据库TDSQL,腾讯云在最近一次TPC-C性能测试中,创下了每分钟支撑8.14 亿笔交易的世界纪录。

此外,我们在人工智能、云原生、音视频通讯、区块链、网络安全等领域,在全球获得专利授权3.3万件,申请总数超过6.6万件,位列中国企业第一名,全球第二。


我们聚焦产业场景,以解决痛点为目标,推动前沿创新加速落地,助力企业降本增效。


在制造领域,腾讯工业互联网平台WeMake连续三年,入选国家级双跨平台,帮助60多万家制造企业,实现了更好的生产管理。在出行领域,我们与45家头部车企合作,通过腾讯生态车联网TAI,为超过800万车主,提供便捷舒适的车上数字生活。

在零售领域,我们用云和连接能力,助力600家头部零售企业,提高销售成绩,助力品牌发展,其中60多家企业,在微信私域里销售额突破10亿。在医疗领域,我们的AI导辅诊覆盖全国1000多家医院,为患者提供更准确的咨询、更详尽的解答。


我们让伙伴“唱主角”,共建高质量的数字经济新生态。


我们和1万1千家生态伙伴展开紧密合作,推出覆盖100多个产业场景的行业解决方案,共同服务千行百业。

我们提出聚焦产品,在生态体系中做好数字化工具的提供者,将集成、交付、销售等环节,更多交给生态伙伴,请伙伴“唱主角”。彼此定位清晰,分工明确,角色互补。去年,生态伙伴收入占到腾讯云整体收入的三分之一,收入增速是腾讯云增速的4倍。


腾讯的冠军产品,广泛适配和被集成到伙伴的系统中,成为伙伴破局的“尖刀”。例如,我们的数据库TDSQL,就与250多家合作伙伴的业务系统适配,覆盖金融、政务、能源、工业等关键行业。


立足过往,展望未来,我们也正在迎来全新的机遇。正如腾讯董事会主席马化腾先生所说,“人工智能技术的不断增强,让企业获得一种越来越重要的生产工具,将数据中潜藏的‘信息能源’,源源不断地转化为实体经济高质量发展的新动能。” 


以大模型生成技术为核心,人工智能正在成为下一轮数字化发展的关键动力,也为解决产业痛点,带来了全新的思路:大语言模型让人机交互体验变得更简单,理解意图与操控系统的能力也更强大,大幅度提升数字化在产业中的可用性、易用性。

企业的核心中枢,也从由人来驱动,走向由人和机器协同驱动,大大提升决策的质量、响应的速度与执行的效率。


腾讯产业互联网也将全面拥抱智能时代,我们将通过三个“增强”,助力产业建构“智能引擎”,挖掘数据价值,连接场景应用,实现高质量发展。


第一,我们以“智能增强”,构筑产业发展“新动能”。


今天我们也非常高兴地告诉大家,腾讯自主研发的通用大语言模型——混元,正式面向产业亮相!


腾讯混元大模型拥有超千亿参数规模,预训练语料超2万亿tokens,具有强大的中文理解与创作能力、逻辑推理能力,以及可靠的任务执行能力。

目前,混元已经与腾讯的产品,进行了广泛的对接和集成,在腾讯云、腾讯广告、腾讯会议、腾讯文档、微信搜一搜等多个业务线应用,为用户提供更贴心的智能服务,提高工作效率。


同时,我们也诚意邀请各行各业接入体验,企业可以通过API调用混元,或者将混元作为基底模型,为不同产业场景构建大模型应用。


我们始终认为,大模型需要基于产业场景,与企业数据融合,才能释放出最大的价值。AI通过对企业生产、销售、服务各个环节的影响,助力产业生产效率提升、服务创新。


因此,我们推出了“腾讯云MaaS服务”,在腾讯云行业大模型精选商店中,我们不仅提供混元大模型,还上架了20多种行业最新、最流行的开源通用大模型,以及覆盖金融、文旅、零售、政务、医疗、教育等20多个领域的行业大模型。


企业可以根据需要,选择合适的模型,然后借助腾讯云智能的TI平台,导入企业专有数据,做进一步的训练与精调,快速生成更有针对性的专属大模型,满足企业个性化需求。


同时,我们也将大模型与腾讯的行业解决方案、企业级应用结合,在生产、营销、售后服务、办公等多个环节,实现能力提升,达至降本增效。


通过智能生产,我们以创新方式破解场景痛点。

例如,在能源领域,我国有大量的电网设备,散布在偏远地区,依靠人工巡检方式,故障隐患无法及时发现和处理,影响电力生产安全。我们通过训练电力视觉大模型,一个模型可以有效适应不同电网场景,具有高检出率、低误检率、支持少样本训练、泛化能力强的优势,助力电网生产经营和减负增效。


我们通过智能营销,提升服务效率。

在营销中,新一代的腾讯企点智能客服,基于行业模型,结合客户业务需求进行训练与精调,可以提供更精准、更详细的回答,复杂问题的解决率,比之前提升了30%。同时,销售人员用自然语言提问,就可以实现准确的商业分析,几秒钟可以获取一份PPT,不再需要花费大量的时间,学习复杂的软件、制作看板。


在上海仁济医院,我们将数智人,与医疗大模型结合,合作开发了“数智人医疗智能客服”,通过这个“虚拟护士”,患者可以用语音,无障碍咨询,看哪个科室,找哪个医生,做什么检查?系统的回复也更准确、更人性化。即保障患者高效就医,也避免了三甲医院专家资源的浪费。


同时,我们也通过智能办公,助推高效协同。

现在,腾讯会议、腾讯文档、企业微信、腾讯乐享等应用,已经全面接入大语言模型能力,助力工作效率大幅提升。

例如,我们的企业社区产品——腾讯乐享,拥有培训学习、知识管理、文化建设等多元能力。在腾讯内部使用过程中,沉淀了150万篇员工创作的各类技术、经营文档,每月平台浏览量超过5千万次。腾讯乐享搭载大模型能力之后,通过AI助手,可以帮助大家在复杂的资料库中,快速检索和提炼对自己有用的信息。在数字化培训中,AI还能在线进行课程答疑,一键生成测试题库,助力更有效率的企业培训。


第二,我们以“数据增强”,夯实企业数字化基石。


很多人注重大模型,但对数据关注不够。数据已经成为社会和企业运行的关键生产要素,随着智能时代的到来,数据将发挥更大作用,甚至成为企业竞争的核心壁垒。在“数据爆炸”的时代,解决好数据的处理、挖掘、安全等问题,将成为企业和开发者必须翻越的山峰。


数据处理能力有多强,决定了业务发展天花板有多高。我们持续增强数据库、大数据等能力,满足企业运行中对海量数据的存储、读写、调用和弹性管理需求。


腾讯云数据库TDSQL,单实例存储规模达到PB级别,单实例日请求次数超百亿次,在Garner报告中,OLTP(在线事务处理)及轻量级TP能力得分均为国内第一。


我们也推出AI 原生的向量数据库 Tencent Cloud VectorDB,这是国内首个从接入层、计算层、到存储层全面AI化的数据库。当你想在大模型中找到一张带“猫”的图片,腾讯云向量数据库能在1百毫秒内,从10亿张向量化的图片中,返回查询结果。


腾讯云大数据,则通过不同的大数据分析引擎和相应的数据开发、算法开发服务,帮助企业实现数据仓库、用户画像、精准推荐、风险管控等大数据应用服务。算力规模达到千万核,每天实时计算量数百万亿次,规模量级位居国内第一。我们通过云原生数据湖仓,将数据仓库的高性能和管理能力,与数据湖的灵活性融合;实现存储智能调优、无差别的数据访问体验,让存储和计算引擎无缝对接。


在数字化时代,企业的日常经营,高度依赖各种数字系统。数据需要在安全合规的情况下被使用。如果数字系统一旦被攻击,用户数据一旦被泄漏,对企业经营可能造成重大的损失,对企业信誉带来长期负面的影响,因此企业必须高度重视与投入数字安全防护能力的建设。


腾讯具备业界领先的安全能力,在威胁情报、风控反欺诈、数据安全、云安全托管服务、零信任等领域,腾讯安全多年来被权威市场分析机构,评为“领导者”和行业第一的位置,也服务了80%以上的金融行业客户、90%以上的头部能源企业、80%以上的头部车企。


广州农商行通过腾讯安全“SOC+安全运营体系”,以自动化策略拦截攻击2千万条。同时,日常威胁分析时间从原来的4小时,降到了30分钟,在有效保障系统安全同时,大幅度提升了安全运营效率。


第三,我们以“连接增强”,激发场景创新。


做好产业数字化,还需要推动数据像水一样,不断滋养人、财、物等传统生产要素,才能生长出像参天大树一样的、健康高效的企业经营管理体系。流动的水才有活力,而流动的数据才能发挥作用,“连接”就是数据保持流动的“河道”。


过去,我们通过QQ、微信等连接了超过10亿用户。今天,我们也将这样的连接,拓展到产业场景中人与人、人与物、物与物的连接。企业微信连接超1200万真实企业及组织,腾讯会议用户数超过3亿。


在产业互联网中,我们仍然致力于连接用户,把用户身份贯穿多个企业应用,过程中也发现了企业身份ID管理上的许多痛点。

在企业的数字办公环境中,身份ID是员工进入业务场景的“工卡”。随着企业内网与云上的数字系统越来越多,如果不同系统各有自己的账号"门禁",多重身份ID的维护成本很高,用户无法在不同系统间自由切换,数据也打不通、不同步,给员工带来许多不便,同时割裂的权限管理也大大增加了数据安全的风险。


今天,我很高兴向各位宣布,腾讯统一身份ONE ID,正式发布。它能帮助企业统一管理员工的身份架构、登录方式、应用权限,一处管理,各处身份一致。员工用一个身份,就可以顺畅访问各业务系统。

One ID不仅与腾讯会议、腾讯文档、腾讯乐享等,自研SaaS应用兼容,也将全面兼容第三方应用。One ID的统一身份能力,也可以让业务系统,自由组成松散套件,让企业客户能够自由选择最符合业务需要的应用,有更好的业务联动体验。


在全真互联的时代,我们以实时数字孪生,连接时间、空间、物体和人,基于AI、实时计算、仿真推演、大数据等技术对数据整合处理,实现物理世界在虚拟世界中可观察、可分析、可预测、可管控。


腾讯与故宫合作打造“数字孪生智慧管理平台”,不仅在线上复刻了古建筑的样貌和结构,还打通了照明、湿度、仓储、门禁等多个管理系统。可以根据丝绸、陶瓷、青铜等不同材质,自动调整灯光、温湿度、二氧化碳浓度等参数,为文物提供最适宜的环境,最大程度减少损耗。同时,对烟雾、火灾、入侵等危险情况,进行实时监测和预警,保障文物与建筑安全。


各位嘉宾,各位伙伴!过去五年,在社会各界的共同努力下,数字科技已经深入各行各业,“上云”已经从“共识”成为“现实”。在产业互联网的征途中,我们已经开始全力攀登“智慧化”的阶梯,开创产业升级新局面。

在探索未来的道路上,我们期待,与伙伴携手,共同探索大模型等全新行业机遇,持续拓展下沉市场。我们将坚持打磨“好产品”,拥抱“被集成”,搭建“数字化大舞台”,请伙伴当好主角,唱好戏;以持续稳定的合作规则,让伙伴与腾讯的合作分工更清晰、投入更有积累、收益更可预期。


我们将立足于未来,立足于实效,让数字化工具在产业中用起来、用得好,以智能增强、数据增强、连接增强,持续助力产业增强。我们会继续以创造价值为目标,坚定地投入技术与创新,不断完善产品,提升服务体验,与生态伙伴、产业客户同心协力,共建产业智能未来!谢谢大家!


腾讯集团副总裁 蒋杰

腾讯集团副总裁蒋杰介绍,腾讯混元大模型从第一个token开始从零训练,掌握了从模型算法到机器学习框架,再到AI基础设施的全链路自研技术。


从2021年开始,腾讯先后推出千亿和万亿参数的NLP稀疏大模型,打破CLUE三大榜单记录,实现在中文理解能力上的新突破。


目前,业界大模型在场景中的应用依然有限,主要集中在容错率高、任务简单的休闲场景。腾讯在算法层面进行了一系列自研创新,提高了模型可靠性和成熟度。


针对大模型容易“胡言乱语”的问题,腾讯优化了预训练算法及策略,让混元大模型的幻觉相比主流开源大模型降低了30%至50%;通过强化学习的方法,让模型学会识别陷阱问题;通过位置编码优化,提高了超长文的处理效果和性能;提出思维链的新策略,让大模型能够像人一样结合实际的应用场景进行推理和决策。


此外,腾讯还自研了机器学习框架Angel,使训练速度相比业界主流框架提升1 倍,推理速度比业界主流框架提升1.3倍。


腾讯混元大模型 全链路自研


得益于全链路自研技术,腾讯混元大模型能够理解上下文的含义,并且有长文记忆能力,可以流畅地进行专业领域的多轮对话。除此之外,它还能进行文学创作、文本摘要、角色扮演等内容创作,做到充分理解用户意图,并高效、准确地给出有时效性的答复。


在中国信通院《大规模预训练模型技术和应用的评估方法》的标准符合性测试中,混元大模型共测评66个能力项,在“模型开发”和“模型能力”两个重要领域的综合评价均获得了当前的最高分。在主流的评测集MMLU、CEval和AGI-eval上,混元大模型均有优异的表现,特别是在中文的理科、高考题和数学等子项上表现突出。


上海财经大学校长刘元春认为:“借助于全链路自研,中国将不断积累大模型相关人才和技术,逐渐形成体系化的产业链、人才链、技术链和创新链,最终走出一条发展通用人工智能的中国路径,助力我们在数字技术的创新上取得突破性进展。”

蒋杰还表示:“我们研发大模型的目标不是在评测上获得高分,而是将技术应用到实际场景中。腾讯将全面拥抱大模型。”


在此次大会上,蒋杰展示了腾讯会议、腾讯文档、腾讯广告等多个业务,在接入腾讯混元大模型后的实际应用情况。


比如腾讯会议基于混元大模型打造了AI小助手,只需要简单的自然语言指令,就能完成会议信息提取、内容分析等复杂任务,会后还能生成智能总结纪要。据实测,在指令理解、会中问答、会议摘要、会议待办项等多个方面,混元大模型均获得较高的用户采纳率。


腾讯混元大模型在腾讯会议中的应用


在文档处理方面,腾讯混元大模型支持数十种文本创作场景,在腾讯文档推出的智能助手功能中已有应用。同时,混元还能够一键生成标准格式文本,精通数百种Excel公式,支持自然语言生成函数,并基于表格内容生成图表,目前这些功能正在内测阶段,将在成熟后面向用户开放。


在广告业务场景,腾讯混元大模型支持智能化的广告素材创作,能够适应行业与地域特色,满足千人千面的需求,实现文字、图片、视频的自然融合。此外,基于混元大模型的能力,广告智能导购能够帮助商家在企业微信等场景,提升服务质量和服务效率。

腾讯混元大模型在腾讯广告中的应用


据了解,今年6月,腾讯云推出了模型即服务(MaaS)解决方案,提供涵盖模型预训练、模型精调、智能应用开发等一站式的行业大模型服务。


最近,腾讯云也全面接入Llama 2、Bloom等20多个主流模型,和混元一样,都支持直接部署调用。客户可以根据实际需求,基于混元、也可以基于开源模型,打造自己专属的行业大模型。



PS:9月20日我们在北京举办的AIGC主题的千人峰会,将会分享到更多利用AIGC起到降本增效,提升工作效率的可能。欢迎老铁们下方报名参加这场千人头脑风暴,面对面深聊更多!
以及您想获取的私域资料和白皮书、私域服务、私域换量、游学等活动,请在见实公号菜单栏领取;

或添加见实小boss微信(微信号:jskj44)报名加入会员。

↘私域服务对接
1.私域讲师团 2.私域换量联盟 3.私域服务商黄页  4.超全843篇私域案例大汇总!

推荐阅读
AI创业要求剧变:拿到融资前必须先挣到钱
重磅:微信公众号发布功能新升级
卖爆视频号?看这3个要素

见实团队再招 4 位新同事
9月20日的见实大会,定了更多AI强应用嘉宾与新策划

继续滑动看下一个
见实
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存