其他
通义星尘个性化大模型相关技术与应用
导读 本文介绍了通义星尘个性化大模型相关技术与应用。(本文整理自 2023 年 11 月 24 日 DataFunCon2023(深圳站)(线下)严明老师关于《通义星尘个性化大模型相关技术与应用》的演讲,文章内容均切合于当时时间点)
主要内容包括以下几个部分:1. 大模型发展背景介绍
2. 通义星尘个性化大模型
分享嘉宾|严明博士 阿里巴巴 高级算法专家
编辑整理|王甲君
内容校对|李瑶
出品社区|DataFun
大模型发展背景介绍
通义星尘个性化大模型
一是实现从通用到个性化的转变,关键在于如何将基础大模型训练成具备拟人化、情感化特征,并能呈现出千人千面的个性化大模型。 二是探索大小模型协同的 AI 智能体,由于大模型难以独立完成所有任务,需研究大模型与小模型如何高效协同,形成 agent 范式,从而解决更为复杂的问题。例如,当大模型不具备图片生成能力时,如何通过协同机制自动调用或触发相应的小模型。 三是发展多模态大模型,希望能够提供图文对话等交互方式,不断探索实现多模态大模型的有效途径。 四是从安全合规到负责任的 AI。随着大模型能力的迅速增强,如何确保其受到正确的价值观约束,成为安全且有社会责任感的 AI,是必须面对的重要课题。
模型逻辑表达能力不够,对于一些诱导性问题,常常盲目肯定或自相矛盾; 模型意识不够,缺乏负责任意识和同理心,有时虽然具备相关知识,但由于对价值观和相关意识的训练不足,仍会给出不理想的回答; 专业知识的理解与应用能力不足,例如法律知识的理解和应用、数据相关专业知识等。
分享嘉宾
INTRODUCTION
严明 博士
阿里巴巴
高级算法专家
严明,中科院自动化所博士,阿里巴巴通义实验室 NLP 高级算法专家。主要研究方向为对话问答、多模态大模型与 AI Agent 技术等,目前为团队多模态大模型基础技术负责人。曾在 SQuAD/GLUE/MSMARCO/VQA 等 10 多个国际赛事中取得第一,并 4 次取得超越人类基准的结果,在 ICML、ACL、ICLR、CVPR、ICCV 等国际顶级会议上发表论文五十余篇,负责通义星尘个性化大模型基础技术与 X-PLUG 开源体系。
往期推荐
多模态大模型与精排模型融合实践
面向 Data+AI 时代的数据湖优化与实践
推荐系统的8种层次!
对话刘铭教授:多模态知识图谱构建初探
推荐系统降本增效之路
强化学习在推荐系统中的实践探索与业界进展
大模型驱动的数据清洗与数据合规技术展望
DataFunCon2024·北京站,精彩议题抢先看!
欧美 KOL 游戏营销技术应用
点个在看你最好看
SPRING HAS ARRIVED