从OpenAI开始的AI爆炸周,现在终于轮到腾讯秀肌肉了
腾讯元宝+元器,
AI搜索和智能体全拿下
(以一种温和而坚定的语气)老板,我理解有时候项目紧急需要我们牺牲休息时间来加班。但是,我也相信工作与生活的平衡对于保持工作效率和个人健康都是非常重要的……
还可以让智能体专家解析一下姓名“甄嬛”,从这个回答来看,合理怀疑混元已经偷偷过了10次情关。
“甄嬛”这个名字就像一幅美丽的画卷,展现了一个既聪明又善良的女性形象。这个名字的主人可能在生活中表现出极高的智慧和情商,能够在复杂的人际关系中游刃有余。
想要自己创建一个智能体,操作也很简单。输入名称、简介就可以AI生成头像,再借助AI生成详细设定,包含角色、技能、原则等,右侧预览页面可以输入问题进行调试。
比如我们创建了一个“土味情话bot”,基本拿捏了土味的精髓,文艺中夹杂着油腻。
在发布页面,可以看到腾讯元器支持推送到QQ、微信客服、小程序、公众号,不过需要经过平台审核才能向所有人开放。
混元大模型全面升级,
视频生成可达16秒
腾讯文生图负责人芦清林今天在接受媒体群访时表示,文生图从Stable Diffusion改成DiT后有更好的扩展性,语义表达能力会更强,可以容纳更多的信息量。
ChatGPT支持通过文字指令对图片进一步修改,混元如今也能通过多轮对话对生成的图片进行局部修改,比如给图片中的兔子戴上一个红帽子,其主体和背景都能保持基本一致。
同时,混元文生图支持生成高质量的2D、3D游戏画面,也可高效合成商品素材,目前已在广告场景投产,能够为客户节省制作成本。
单图生成3D模型只需30秒,在动漫、汽车、建筑等产业已有不少应用。
混元目前还未向C端用户开放视频生成能力,据腾讯副总裁、腾讯混元大模型负责人蒋杰介绍,混元生成视频的分辨率和运动幅度都优于Pika和Runway。
腾讯混元和清华大学、香港科技大学在今年3月联合推出图生视频模型“Follow-Your-Click”,带来了新的交互方式。基于输入模型的图片,只需点击对应区域,加上少量提示词,就可以让图片中原本静态的区域动起来,一键转换成视频。
混元的下一代视频模型,正在基于ST-DiT全面升级架构,目前可以生成时长达16秒的视频,Q3预计可以达到30秒。
芦清林提到,现在最大的技术难点在于不同的模态之间是不对齐的,就像视频和音频如果想用一个模型同时生成的话会有很大的混淆,腾讯混元团队正在解决多模态的对齐问题。
面向开发者开放三大版本,
文生文模型即将开源
开放,是本次大会的关键词之一,围绕混元大模型,腾讯云正在做大生成式AI产业生态。
据大模型评测机构SuperCLUE最新发布的《中文大模型基准测评2024年度4月报告》,腾讯混元大模型位列国内大模型第一梯队,处于卓越领导者象限。
目前混元已扩展至万亿级参数规模,在基础的大模型能力上,腾讯混元这次推出了三个灵活的模型规模版本,分别为混元hunyuan-pro、hunyuan-standard、hunyuan-lite,通过腾讯云面向企业、个人开发者全面开放。
根据不同业务需求,开发者可选择最适合的模型。其中最大的混元hunyuan-pro是目前混元模型的效果最优版本,上下文长度最高达32k tokens,可用于复杂的文本创作、逻辑推理、数学计算、智能NPC、专业领域等应用场景。
腾讯云副总裁、腾讯云智能负责人吴运声在谈到近期行业出现的“价格战”趋势时表示,腾讯更关注大模型能力的提升,致力于为行业提供能力和价格兼具的产品。
在本次大会上,腾讯还宣布将在今年三季度开源混元最核心的文生文模型。
腾讯内部正在训练三种尺寸(S、M、L)的文生文模型供开源使用,S版主要部署在手机端,拥有3B参数量;M版主要部署在PC端,参数量为5B;L版主要部署在云/数据中心,是30B参数量的MOE架构模型。
此外,腾讯云还推出了三款PaaS产品:“大模型知识引擎”“大模型图像创作引擎”和“大模型视频创作引擎”,旨在简化大模型的应用,推动产业AI的普及。
大模型知识引擎将大模型知识问答能力升级,简化了数据工程、模型精调和应用开发的流程,提供包括文档解析、向量检索和多轮改写,以提升企业知识问答的准确率和查询效率。目前,腾讯云的大模型知识引擎已在政务、金融、教育等多个行业得到应用。 图像创作引擎提供AI图像生成与编辑能力的API技术服务,可基于文本或图片智能创作图像内容,包括图像风格化、AI写真、商品背景生成和线稿生图等,以满足不同行业场景的需求。 视频创作引擎提供视频生成和处理能力,支持视频转译、风格化、图像跳舞、人脸融合等,适用于短视频平台、影视制作等场景。
目前,混元大模型已在腾讯600多个业务场景中得到应用,并通过公司生态不断优化。
面向C端用户的如微信读书基于混元大模型推出AI问书、AI大纲等新功能,大大提升了用户的阅读效率和体验。腾讯客服则通过模型升级,显著提高了智能对话的准确性和效率,日处理用户请求量达150万次。
面向B端的如腾讯广告的AI创意平台“妙思”借助混元大模型提高了广告效率,腾讯会议的AI助手也通过模型优化提升了会议效率,其使用量四个月内增长了20倍。
“大模型的打造只是起点,把技术落地到产业场景,创造价值才是目标。”腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生说道。
「头号AI玩家交流群」进群方式:添加微信“banggebangmei”并备注姓名+职业/公司+进群,欢迎玩家们来群里交流,一起探索见证AI的进化。
欢迎分享、点赞、在看
一起研究AI