大模型在风控领域的应用已经慢慢深入。当然遗憾的是,目前还没有明确的大模型在风控领域的成熟应用。不过从简单到困难的场景,都有一定的成效。
在简单场景,大模型可以基于自然语言进行风控建模提效,例如NL2SQL和内部知识库搜索。这些技术可以将自然语言作为输入,嵌入到风控评分模型中。
在中等场景,大模型可以用于客户服务和交互。通过大模型,我们可以实现智能客服,自动回答客户的问题,提供个性化的服务。同时,大模型也可以用于客户交互,例如通过自然语言处理技术,实现智能对话系统,从而提高客户满意度和忠诚度。
最后是困难场景,大模型可以基于文本信息进行摘要和审核,以及自动特征工程。这些场景需要大模型具有高度的理解能力和推理能力,以实现对文本信息的准确理解和处理。
大模型在风控领域的应用前景广阔,还有很多有潜力的场景等待探索和实践。
秉持“数聚垂域,智领未来”信念,DataFunCon2024·上海站将继续顺应趋势,组织大模型技术与应用等各大论坛,邀请数据智能技术专家、行业专家,探讨模型微调、模型推理、AI Agent等热门话题,在推荐风控等关键场景的应用,以及数据智能落地的现在与未来。(文末阅读原文可查看大会详细信息,也可以扫码咨询报名~)
扫码咨询报名
(*点开大图更清晰)
① 主题论坛
个人介绍:刘一鸣,目前负责阿里云ODPS等自研大数据产品,主攻云原生一体化数仓引擎能力的演进和商业化,在数据仓库、大数据计算、开源大数据行业有15年以上工作经验。原Kyligence 副总裁,Apache Kylin PMC。演讲简介:Data+AI时代,大数据平台该如何建设?我们认为需要具备计算效率、开发效率、处理效率为一体的高效能力,才能保障企业AI时代下的业务创新。阿里云提供了从数据集成、清洗、建模、计算到服务的大数据+AI整套产品解决方案。 同时,阿里云自研大数据平台 MaxCompute 推出分布式计算框架 MaxFrame,100% 兼容 Pandas 等数据处理接口,打通数据管理、大规模数据分析、处理到 ML 开发全流程,打破大数据及 AI 开发使用边界,大幅提升开发效率,助力企业快速构建AI时代的基础设施。扫码咨询报名
① 新一代数据架构论坛
出品人:赵健博 快手 数据引擎与存储技术团队负责人个人介绍:赵健博,大数据领域、存储领域专家,快手数据引擎与存储技术团队负责人,目前负责快手下一代数据基础架构、资源调度管理,以及存储技术的规划,建设与应用工作。
个人介绍:2013年华中科技大学计算机学院硕士毕业。2014年加入美团数据组,深度参与美团Hadoop集群规模从百到十万级的架构演进。主要负责离线数仓生产、Adhoc查询、OLAP分析引擎与服务在美团业务场景的落地与演进。演讲提纲:OLAP被广泛应用在经营报表、商业分析、活动运营、风控等业务场景,本次演讲主要介绍美团OLAP场景的特点,OLAP引擎选型的思路和演进历程以及在性能优化方面的实践经验。听众收益:了解互联网公司在生产环境下面临的不同业务场景及技术挑战,提供OLAP引擎选型思路和实践经验参考。个人介绍:毕业于中国科学院大学,博士学历。曾任职于360系统部,担任离线计算组负责人。现任职于快手数据平台部数据引擎技术中心,负责离线生产引擎及数据湖研发。演讲题目:Blaze:SparkSQL Native算子优化在快手的大规模应用实践Spark作为当前离线生产场景的主力引擎,其性能提升对于企业数据生产链路的降本增效至关重要,用更底层的语言来开发向量化引擎提升性能则是近年来计算引擎的主流共识。Blaze是快手自研的基于rust和datafusion/arrow开发的Spark向量化执行引擎,经过持续的迭代优化,目前已经在快手内部得到大规模的推广应用并取得线上收益。本次分享将介绍Blaze的架构原理,在上线过程中遇到的各种问题及对应的深度优化措施,以及大规模上线应用的推广方案。孙超 小红书 数据引擎Lakehouse团队负责人个人介绍:2017年硕士毕业于复旦大学计算机学院DasLab;毕业后先后在PayPal、字节跳动履职,从事大数据相关工作;2021年加入小红书数据平台部,负责实时湖仓团队的工作,聚集于OLAP、数据湖、计算引擎等相关技术的探索与实践落地结合小红书的线上真实场景及需求,分享小红书基于OLAP及数据湖技术的架构选型、核心优化及落地效果听众收益:了解如何利用StarRocks、Iceberg等技术对数据生产及查询进行降本增效个人介绍:上海炎凰数据首席架构师及联合创始人,主要负责后端半结构化时序数据系统的研发。之前曾在Splunk等公司参与数据库CDC以及大规模数据采集等项目的研发。Apache Arrow Contributor。演讲题目:JIT技术在数据系统中的应用:通过Gandiva实现数据计算加速· 介绍Gandiva表达式编译器, LLVM及其工作原理1. JIT即时编译技术的基本概念以及为什么需要JIT3. 如何使用Apache Arrow/Gandiva的JIT即时编译技术加速计算Patrick Huang,RisingWave Labs,Tech Lead个人介绍:毕业于美国卡耐基梅隆大学(CMU)计算机系,曾就职于硅谷 LinkedIn Streaming Infra 团队担任核心开发4年,回国后曾就职于腾讯 Wechat Infra,现就职于 RisingWave Labs,担任数据库内核存储团队 Tech Lead。演讲题目:重新定义流计算:RisingWave 云原生流数据库1. 如何借助 RisingWave 轻松上手流计算3. 如何以数据库的方式降低流计算的开发和运维成本扫码咨询报名
② 数据治理与指标体系论坛
个人介绍:李直旭,复旦大学计算机科学技术学院研究员、博士生导师,上海市数据科学重点实验室主任助理,复旦大学知识工场实验室执行副主任,曾兼任科大讯飞苏州研究院副院长,博士毕业于澳大利亚昆士兰大学,主要研究方向为认知智能与知识工程、多模态知识图谱、大数据治理与挖掘等。在领域主流期刊和国际会议上发表论文近200篇,主持十余项国家和省部级科研项目。工业出品人:温绍锦 阿里云资深技术专家、阿里云DataWorks技术负责人个人介绍:温绍锦,阿里云资深技术专家,花名高铁,阿里云 DataWorks 技术负责人。个人介绍:2014~2016:数据产品质量负责人,2017~2019:外部数据引入负责人,2019~2022:数据质量风险架构,2012~2024:数据安全合规架构。02-数据质量治理挑战:数据质量产生分析、数据质量治理挑战、数据质量治理思路03-数据质量治理实践:数据质量治理架构、数据质量治理方案、数据质量治理案例个人介绍:浙江大学硕士毕业,曾就职于华为。2017年加入滴滴,一直从事数据中台建设,主要涉及数据开发、数据资产和治理以及数据服务等方向,目前主要专注于指标服务化和指标标准化建设。演讲提纲:介绍滴滴指标标准化的背景,方案发展过程,以及指标标准化的方案的核心设计出发点,实现途径,以及生态建设。最后介绍指标标准化的后续规划。个人介绍:12 年数据业务从业经验,历任阿里集团淘宝商业分析负责人、阿里音乐商业智能中心负责人、蚂蚁集团用户增长分析与洞察产品负责人。在数据体系搭建、数据分析、用户标签建设、用户洞察、用户增长等方面,拥有丰富的数据驱动业务实践经验。演讲题目:第三代指标平台如何摆脱 ETL 宽表开发 做“轻”数仓1. 企业管理层和业务人员:如何借助自动化指标平台实现更加灵活、高效、准确的数据洞察2. CDO:指标“管、研、用”一体,真正兼顾敏捷分析、数据有序、成本可控、语义资产沉淀与复用3. 数据工程师:做“轻”数仓,数据集市层 NoETL,不再疲于应对大量的报表开发田奇铣 阿里云高级产品专家、阿里云DataWorks产品负责人个人介绍:阿里云DataWorks产品负责人,打造全链路数据开发治理平台支撑阿里巴巴集团与阿里云上众多客户的数字化转型。演讲题目:AI For Data,大模型驱动阿里云 DataWorks 数据开发治理新范式演讲提纲:“一站式”已成为数据平台产品的共识,随着 AI 新浪潮袭来与大模型的发展落地,阿里云 DataWorks 从一站式到全面智能化演进,DataWorks Copilot 帮助数据开发和分析提效 30%,让企业数据治理进入“自动化”阶段,帮助企业构建下一代数据开发治理新范式。扫码咨询报名
③ 大模型训练推理与微调论坛
出品人:李永 阿里云人工智能平台 PAI 引擎负责人个人介绍:阿里云人工智能平台 PAI 引擎负责人,长期参与超大规模模型训练、异构资源调度、MLOPS 等领域的研发。个人介绍:华东师范大学硕士毕业,有将近十年的机器学习应用实践经验,目前就职于携程,主要研究方向为智能化决策和大模型的应用演讲介绍:大语言模型的发展日新月异,其核心能力可以大致分为:生成、总结、提取、分类、检索与改写六大部分,我们结合实际业务场景探索了大模型在相关能力上的表现。本次分享将介绍大模型在旅游行业的落地应用,主要包含AIGC技术在内容营销领域的探索实践、多模态大模型在交互页面的应用以及开源大模型在客服场景提高人效的实践经验,会涉及到开源大模型的应用对比、大模型的微调实践以及不同推理框架的性能和效果对比总结。3. 学习大模型的推理性能优化技术以及相关框架应用博士毕业于亚利桑那州立大学计算机系,本科毕业于同济大学计算机系,曾就职于亚马逊美国搜索部门,阿里飞猪搜推算法部门,目前在阿里巴巴企业智能事业部。主要研究方向为大模型应用、搜索与推荐技术、图数据挖掘,在人工智能相关的顶级学术会议和期刊上发表论文30余篇。演讲提纲:企业内部大量的应用、文档和工作流为企业数字化转型提供了大量的数字原油,然而由于缺乏有效的通信和信息共享仍然难以有效转化成宝贵的用于决策的燃料油。AI大模型以其惊艳的生成和推理能力,是这个时代企业跨越新数字鸿沟,消灭数字时代鲍莫尔成本病的引擎。本次演讲将介绍我们打造员工和企业智能交互界面的尝试,利用大模型帮助员工高效地找信息(找人、找应用、找知识、找服务、办事)和找产品,达到有问必答,问题终结。我们会阐述我们的技术选型(通过检索增强的方式帮助大模型理解企业内部的知识),数据闭环(数据清洗,标注、反馈、微调、评估、回流),大模型微调(SFT和RLHF阶段的数据探索):3. 企业智能数字化办公的技术方案(大模型整体架构、微调、评测)2. 开拓一些新思路,用新方法如何解决传统的一些企业办公问题3. 目前领域相关的挑战,以及大模型应用的未来的展望个人介绍:本科毕业于上海交通大学电子系,随后取得香港中文大学信息工程博士学位,毕业后加入新加坡高级数字科学中心(美国伊利诺伊大学在新加坡的研究所)从事科研工作,在计算机网络和分布式系统领域相关的顶级国际会议发表多篇论文。加入Alluxio前,傅正佳曾在新加坡科技公司Bigo Technology担任机器学习研发总监。演讲题目:Alluxio AI 新一代AI/ML训练中台的数据I/O解决方案演讲介绍:在以数据驱动的AI时代,高效访问存储中的大量数据对于模型训练和服务至关重要。然而,I/O 挑战往往会阻碍性能并限制 GPU 的利用率。本次分享,我们将介绍基于 Alluxio 构建的高性能数据访问层,如何克服 I/O 挑战并显著提高 GPU 利用率。通过丰富的用户案例和实验数据,您将了解在Alluxio中缓存数据集和模型的方法,将有多大幅度的性能提升。1. 介绍常见的 I/O 挑战及其对 GPU 利用率和整体性能的影响2. 如何将高性能数据访问层无缝集成到 ML 工作流中,以减少 I/O 开销听众收益:通过此次分享,与会者将深入了解到由数据驱动的AI工作负载所带来的 I/O 挑战,并了解如何将 Alluxio 作为一种有效解决方案加以利用。我们将重点分享来自Meta、Uber、Shopee、知乎等用户的实践经验、探讨我们的方法对 GPU 利用率和整体性能的影响。个人介绍:本科/博士毕业于浙江大学,2020年加入阿里云机器学习平台 PAI,先后参与了平台的 Workflow、算法训练、SDK 的产品设计和开发,目前主要专注于平台的 MLOps 能力建设。演讲提纲:大语言微调训练是提升模型应用性能的关键手段,直接上手微调一个大语言模型并不是一件轻松的事情,本次分享主要围绕以下主题展开:2. 微调训练实践,包括数据准备、模型和微调算法选择、微调模型评估等。3. 通过 “PAI-QuickStart” 一站式完成模型的微调训练、评估和部署。扫码咨询报名
④ AI Agent论坛
出品人:卢暾 复旦大学教授、上海市数据科学重点实验室副主任个人介绍:复旦大学计算机学院教授、博导,上海市数据科学重点实验室副主任,复旦大学社会计算研究中心主任,美国卡耐基梅隆大学(CMU)访问学者。现为中国计算机学会杰出会员、协同计算专委秘书长,上海市计算机学会协同信息服务专委会副主任。研究兴趣包括社会与协同计算、人智协同与交互、群智协同与系统、数字社会智能治理等。主持多项国家自然科学基金项目、科技部重点研发计划课题、863课题和上海市项目。成果发表在 CSCW、 CHI、 UbiComp、 NeurIPS、 WWW、 SIGIR、 IEEE TKDE、 ACM TOIS 等权威会议和期刊上。常规担任 CSCW、CHI 等的 AC,担任多个国内外学术会议的 PC/TPC Chair 以及多个国内外学术期刊的 AE 和 GE。个人介绍:百度主任架构师。百度信息流推荐系统负责人。在AI系统,云原生服务有十余年丰富业务架构经验。演讲题目:AI 原生应用中的 AI Agents 探索与实践2. AI 原生应用中 AI Agents 系统探索2. 学习大规模 AI 原生应用中 AI Agents 实践经验3. 思考 AI Agents 系统在业界未来发展方向洪思睿 DeepWisdom 算法/技术负责人,MetaGPT一作个人介绍:洪思睿,DeepWisdom团队NLP&AIGC方向算法负责人。前智能控制上市企业NLP团队负责人,牵头千万级行业知识图谱及多项自然语言处理技术的应用落地;在DeepWisdom负责包括法律、物流、美妆、电商等多个领域的知识问答,搜索系统、多模态应用等行业落地;开源多智能体框架MetaGPT一作;NeurIPS AutoDL 顶级竞赛世界冠军,相关工作/论文发表于TPAMI顶刊。演讲题目:MetaGPT:重塑自然语言编程,多智能体引领代码生成与协同的革新探索演讲提纲:介绍多智能体编程框架MetaGPT,讲述如何通过自然语言进行智能体编程,高效实现智能体协作能力和代码能力提升,探索多智能体设计&开发创新之路。3. 协作与自我提升:SOP嵌入与递归式能力提升的探索1. 深度解读前沿多智能体框架,了解智能体设计开发实践2. 如何增强智能体的代码能力和推理能力,支持复杂工具使用个人介绍:小米小爱同学团队高级算法工程师,担任大规模语言模型的训练、推理与应用工作。负责并研发多项语音助手场景中的深度学习算法落地工作,搭建算法框架助力小爱同学体验升级。在语义理解、对话管理与信息检索等方向有丰富经验,相关成果发表于ACL、NAACL等刊物。搭建以大模型为核心的Agent框架,从而解决语音助手场景中更加复杂多样的需求。通过Prompt设计、信息检索、与RAG等流程,实现性能出色、表现稳定的Agent能力。2. 了解Agent在工程落地时的潜在问题与解决方案个人介绍:清华大学电子工程系长聘副教授,教育部长江学者。长期从事城市科学与城市模拟相关研究,在Nature 子刊等高影响力综合期刊发表论文数篇,发表学术论文100余篇(CCF-A类70篇),被引超过20000次,连续两年入选科睿唯安"全球高被引科学家", 10篇论文入选ESI前1%高被引论文;申请专利35项、已授权12项。入选国家"万人计划"青年拔尖人才计划、科协青年人才"托举工程"、获IEEE通信学会亚太杰出青年学者奖、教育部科技进步一等奖、湖北省技术发明一等奖、电子学会科技进步一等奖、电子学会自然科学二等奖、吴文俊人工智能科学技术奖优秀青年学者奖。演讲题目:基于大模型 Agent 的城市社会经济系统仿真模拟2. 基于大模型 Agent 的仿真模拟的优势与特色扫码咨询报名
⑤ 推荐系统论坛
出品人:熊贇 复旦大学教授,上海市数据科学重点实验室副主任个人介绍:熊贇,教授,博士生导师。上海市数据科学重点实验室副主任。长期从事数据领域研究,研究工作获得了国家自然科学基金、国家863计划、上海市科委基金等以及企业资助。发表论文80余篇。获中国计算机学会科学技术发明奖、上海市科技进步奖、上海市计算机学会科技进步奖等奖项。在国内率先开展大数据和数据科学的研究工作,2009年出版第一本数据科学专著,原创性地提出了数据科学的定义和内涵;提出了一批新型的大数据挖掘算法,这些算法已经被应用于证券交易所、医联平台、交通信息中心等上海市大数据建设重要领域。
个人介绍:2012年硕士毕业加入百度,一直从事推荐系统相关的架构工作。目前是百度信息流推荐系统后端架构的技术负责人,负责推荐内容架构及其存储与索引相关的架构工作。主要分享在大语言模型兴起的背景之下,百度信息流推荐系统重构的一些新的产品形态及其业务收益。面对大模型带来的新的架构挑战,对应的一些解决方案与架构演进。翁力雳 eBay 算法Team Lead,Applied Researcher个人介绍:我自2021年6月至今一直在eBay担任推荐算法Team Lead。在全站推荐业务中,我带领团队使用算法能力解决多个业务痛点,显著提高了eBay首页与商品详情页的GMV和广告收入。在之前的工作中,我曾在iQIYI爱奇艺公司担任高级机器学习工程师,领导了短视频推荐系统的开发,旨在提供高度个性化的视频推荐。我的学历背景包括香港大学计算机科学的本科与硕士学位,入选过院长荣誉榜(2011/12年,前10%),获得过宋庆龄奖学金。演讲题目:eBay多模态与GNN商品嵌入技术:提升推荐系统效能与用户体验演讲提纲:在本次演讲中,eBay的推荐系统专家将深入介绍他们创新性的多模态与图神经网络商品嵌入技术,旨在提升推荐系统的效能与用户体验。通过优化召回模块,整合多模态信息,以及运用图神经网络,演讲者将分享如何解决传统推荐系统中的挑战,提高推荐准确性,并展示这些技术在实际业务中如何根据用户痛点量身定制解决方案,为每一位用户创造更为个性化、精准的购物体验。听众收益:如何使用算法能力撬动用户痛点的杠杆:深入讨论如何利用算法能力根据eBay业务实际特点解决用户痛点。通过演示多模态商品嵌入和GNN的应用,探索算法在推荐系统中的实际业务场景中如何精准地满足用户需求,提高购物体验,解决用户在推荐系统中可能遇到的问题,为业务实际特点量身定制解决方案。多模态召回模块优化:通过整合多模态信息,提升召回模块的准确性,解决单一模态在复杂情境下的推荐困难,为用户呈现更相关和个性化的推荐结果。图神经网络在推荐系统中的实践经验:深入探讨了GNN在构建用户-商品行为交互图上的应用,展示了GNN召回模型的在线实验结果,证明其在提升CTR和PTR方面的显著效果。钟灵 阿里云人工智能平台 PAI-REC 推荐系统负责人个人介绍:四川大学计算机硕士,具有多年搜索推荐场景的算法和工程实践经验,为数十家阿里云客户提供场景优化建议和效果优化。议题简介:本演讲将阐述在降本增效的时代,如何通过工程化手段提升推荐系统建设效率,并分享真实业务案例。主要内容包括: 2. 通过组件化的模型搭建加快新的推荐模型的实验;3. 通过模型训练优化和推理性能优化来降低离线训练和在线服务的成本;王昊奋 同济大学 百人计划,特聘研究员,博士生导师个人介绍:王昊奋,同济大学百人计划,特聘研究员,博士生导师。长期在一线人工智能公司担任CTO之职。他是全球最大的中文开放知识图谱联盟OpenKG发起人之一。他负责参与多项国家级AI相关项目,发表100余篇AI领域高水平论文,被引用次数达到3100余次,H-index达到29。他构建了全球首个可交互养成的虚拟偶像—“琥珀·虚颜”;所构建的智能客服机器人已累计服务用户超过10亿人次。目前,他担任中国计算机学会术语工委副主任,SIGKG主席,上海秘书长,自然语言处理专委会秘书长,中国中文信息学会理事,语言与知识计算专委会副秘书长,上海市计算机学会自然语言处理专委会副主任,上海交通大学AI校友会秘书长等社会职位。演讲提纲:当前推荐系统领域面临诸多挑战,如数据长尾分布、个性化推荐、多轮对话和冷启动推荐,而大语言模型的出现为推荐系统带来了新的机遇,两者融合逐渐成为下一代推荐系统的趋势。然而,单纯使用LLM用于推荐仍存在局限性,如个人信息利用不足、上下文长度受限、存在幻觉以及无法学习所有历史交互数据等问题。因此,引入知识检索增强(RAG)显得尤为必要,这有助于控制幻觉、减少对上下文的依赖、学习新知识并可以与传统推荐系统快速协同。本报告系统梳理了当前推荐系统的局限,LLM增强推荐系统的现状,RAG的技术路线、范式和其在增强推荐系统方面的应用,并阐述了在RAG视角下推荐系统的机遇和发展趋势。1. 推荐系统的挑战以及目前大模型应用于推荐系统的局限性扫码咨询报名
① 数智 · 新汽车论坛
个人介绍:中科大硕士,曾服务于百度腾讯等互联网大厂,在大数据人工智能领域有十多年经验。个人介绍:陈炯,男,博士,清华大学电子工程系本科、博士,现任蔚来汽车技术规划部门技术专家,中国计算机学会智能汽车分会委员,中国汽车工程学会传感器分会委员,复旦大学、合肥工业大学校外研究生导师,曾任伊顿(中国)研究院资深工程师,多年来从事系统设计和前瞻研究相关工作,作为主要技术负责人完成过多项预研项目,并进行产品转化。拥有60+项专利(多项同时在美国PCT申请),在国内外杂志和期刊上发表论文17篇。在伊顿中国研究院工作期间,带领全球团队完成多项产品开发和技术攻关项目。在蔚来汽车工作期间,作为系统架构师,成功开发过蔚来第一代电动汽车充换电站,移动充电车等产品,也是蔚来自动驾驶第二代平台的核心架构师之一,现在主要进行大模型相关的系统架构设计和应用开发工作。入选 2022 年上海市产业菁英高层次人才。个人介绍:复旦大学基础数学硕士,10年以上汽车行业AI从业经验,在大语言模型、运筹优化和机器学习领域有丰富的实战经验。演讲题目:有序多址城市旅行商问题的路径规划策略与优化1 首先会介绍运筹优化场景和有序多址城市旅行商问题 个人介绍:目前负责汽车之家的大模型和基础AI技术。曾任职于雅虎、百度、腾讯、爱奇艺等多家头部互联网公司。有多年的AI产品技术管理经验,曾任腾讯新闻产品技术部算法中心总监,爱奇艺智能分发部高级总监。2007年毕业于中科大-微软联合培养博士项目。曾任SIGKDD, SIGIR, AAAI, WSDM等多个国际会议的程序委员会委员。个人介绍:易慧智能技术VP,中科院软件所硕士,先后任职于微软、阿里、百度等国内外知名互联网公司,有多年的搜索引擎、人工智能相关领域的研发和管理经验。近年来专注于大模型在垂直领域的落地应用,年初联合清华大学自然语言实验室、面壁智能发布大模型驱动的汽车行业群体智能技术白皮书,带领团队研发YiAgent群体智能协作平台。演讲介绍:伴随着大模型(LLM)和智能体(Agent)技术在各行各业的落地应用,基于多智能体的群体智能解决方案更是为企业带来了前所未有的效率提升和价值创新。在本次分享中,我将介绍群体智能解决方案的技术实现,包括行业大模型的训练和优化、智能体的设计和开发、群体智能的协作机制等。同时还有我们在群体智能生态建设和落地应用中的一些思考和实践,以及对群体智能解决方案未来发展的展望,包括技术的进一步优化、应用的更广泛拓展、生态的更深度融合等。我相信,随着大模型技术的不断发展和群体智能解决方案的不断完善,我们将能够在更多的场景中实现智能化的管理和服务,为企业的发展提供更强大的支持。希望通过本次分享,能够帮助大家更深入地理解群体智能解决方案,也希望能够激发大家对于大模型技术和群体智能的研究和应用的兴趣。期待与大家的交流和探讨。1. 群体智能解决方案概览:自底向上依次是行业大模型、单智能体(Agent)、群体智能协作、场景应用2. 群体智能协作平台:详细介绍群体智能相关的技术实现扫码咨询报名
② 数智 · 新生物医药论坛
导语:随着数字化技术的不断发展,生物医药行业正面临前所未有的变革。为了深入探讨大模型时代下数字医疗和数智医药的转型与创新,我们特此举办“数智 · 新生物医药论坛”。本次论坛将汇聚业内专家、学者,共同交流前沿数据智能技术、分享实践经验,推动生物医药行业的数字化转型与创新发展。出品人:李少春 云南白药 数字战略科学家,智慧科技总经理,CIO个人介绍:现任云南白药数字战略科学家、智慧科技业务单元(BU)总经理,CIO。就读长江商学院和北大光华高管学院,荣获北京大学工 学院、E 药经理人等行业专家理事,历任 IBM 大中华区医疗和生命科学行业总经理,前 IBM 大中华区沃森健康(Watson Health)总经理,IBM 中国研究院研究技术创新总监。专注于 医疗行业专业场景和前沿数字化技术的深度融合,在大健康领域拥有深厚行业实践经验。持续专注于 大数据分析、人工智能、云计算、物联网等多个领域前沿研究和创新,推动全球创新合作的战略和执 行,推动 AI 科技和生态系统创新解决方案,助力医疗和生命科学行业企业的完整价值链的数字化重 塑进程,为其提供做出关键医疗、临床、运营和创新决策所需的洞察力,使企业和组织能够利用领先 技术实现可信的数字化智慧医疗平台转型。数字化1.0阶段的效率提升主要依靠将线下的业务行为搬到线上,利用业务数字化工具提升业务运营的效率。数字化2.0阶段聚焦全域业务数据分析带来的效率,实现企业“上帝视野”数据驱动的管理和经营。数字化3.0阶段是超级自动化的效率实现,是把行业和产业链的外部数据和企业的内部数据链接在一起;把过去和现在的数据链接在一起;把企业执行数据和企业经营结果数据链接在一起;把消费者需求数据和产品研发生产数据链接在一起。在AI大模型的时代,企业的决策不再是靠经验和普世的规则,而是依靠全链条的数据洞察、机器学习和AI判断,结合外部的生态链和行业的洞察实现自动化,是企业超级自动化的新效率时代。大模型重新定义了人工智能的新可能,促进AI应用规模化落地,对医疗医药行业领域赋能更深,将促进未来企业管理模式和用户互动模式的进步和改变。AI工具和数字化手段,将作为重要的“工具创新”和“能力建设”途径,为企业推动数字化转型装上强大的增长引擎。个人介绍:现任京东健康智能算法部负责人,负责京东健康在医疗AI领域的技术创新和解决方案研发。IEEE Senior Member,毕业于浙江大学,主要研究方向在大规模语言模型和多模态学习,是医疗大模型京医千询的技术负责人和视频多模态大模型VICTOR的作者。具有10年以上人工智能的研发经历,在创新科技前沿具有丰富的实战经验并引领多项核心技术突破,覆盖大健康、电商、搜索引擎、内容推荐、互联网广告等多领域。3. 引发听众对于跨学科合作、数据隐私保护、算法公平性等问题的思考,促进医学和技术领域的深度合作与交流个人介绍:邓亚峰,毕业于清华大学,二十年人工智能算法及产品研发经验,现任碳硅智慧创始人兼CEO。他曾任360集团副总裁、人工智能研究院院长兼搜索事业部总经理,科创版第一家人工智能上市公司格灵深瞳CTO,北京人工智能产业联盟副理事长等职务,曾获2021年中国人工智能年度十大风云人物称号、教育部技术发明奖二等奖。他带领团队在AIDD、计算机视觉、多模态大模型、机器人、智能搜索等领域做出过创新成果或先进产品,多次在国际国内主流人工智能评测中获得过第一名,累计申请发明专利140余项(已授权98项),发表论文50+篇。演讲题目:基于生成式AI和预训练大模型打造分子设计平台演讲提纲:介绍2021年后生命科学领域结构预测、生成式AI和预训练模型方面的最新技术进展,结合碳硅智慧实践,简介基于生成式AI和预训练模型在对接、成药性预测、分子生成优化等方面的领域前沿技术,以及基于这些技术打造的一站式数据驱动创新药研发平台,以及平台在实际场景中的验证情况。2. 了解AIDD最前沿的工具平台的发展现状和未来趋势;3. 了解基于AIDD平台进行药物设计的最佳实践;王文佳 天士力医药集团 天士力国际基因网络药物创新中心 总经理个人介绍:王文佳女士现任天士力国际基因网络创新中心总经理,负责天士力人工智能大数据药物平台——星斗云开发以及创新药物研发,专注中药等多靶点药物的信息整合挖掘及智能分析,发表论文影响因子150+,最高影响因子25,并拥有十余项专利等知识产权。药物知识图谱等方面获得数个国家级奖项以及多家媒体报道。平台现有创新药物管线进入临床三期。王文佳在上海交通大学毕业后在法国获得生物统计信息博士学位,师从人类基因组学先驱之一Daniel Cohen教授。曾在世界领先的法国AI药物公司Pharnext担任项目负责人,担任AI药物平台开发及市场拓展等职务。演讲题目:星斗云:结合中药研发大模型的一站式中药数智研发平台扫码咨询报名
③ 数智 · 智能运维论坛
出品人:王鹏 复旦大学教授,上海市数据科学重点实验室副主任
个人介绍:王鹏,复旦大学计算机科学技术学院,教授,博导,上海市数据科学重点实验室副主任。主要研究兴趣包括:工业大数据、智能运维等。2012年获得教育部自然科学二等奖(第三完成人)。主持或主要参与科技部重点研发计划、国家青年973、自然科学重点/面上基金、上海市科委、上海市经信委的多个项目,以及微软、IBM、EMC、华为等企业的资助项目。在数据库领域顶级国际期刊与会议SIGMOD、VLDB、ICDE、SIGKDD、TKDE、ICDM等发表论文50多篇。曾担任众多国际顶级与知名学术会议的程序委员会委员,包括SIGKDD、ICDE、DASFAA、WAIM等。国际知名学术期刊VLDB Journal、TKDE、KIS等的审稿人。个人介绍:张博,云智慧CTO、中国通信学会专委会委员。张博先生拥有丰富的人工智能研究及行业领域实践经验;曾就职于微软亚洲研究院(Microsoft Research Asia),从事数据驱动的智能技术研究及算法工程化,其研发的智能算法已经在微软Excel、PowerBI等产品中落地应用;现致力于大模型技术在垂直领域特别是运维领域的商业实践,其带领研发的大模型产品已经在多家头部企业落地。张博先生毕业于清华大学,作为负责人完成工信部“新一代人工智能产业创新重点任务揭榜”项目一项;主导研发了智能运维领域首款算法SDK-Hours; 张博先生拥有国际专利4项,中国专利40余项目,发表多篇AAAI、ICLR等顶会论文。演讲题目:基于多个头部客户案例解析大语言模型在运维领域的落地实践演讲提纲:2024年是大语言模型技术落地元年,行业竞争必将从基础模型攻坚克难走向模型应用百花齐放。对于企业服务赛道,如何避免“拿着锤子找钉子”、避免“懂技术就是懂行业”、真正把技术突破与应用价值创造结合。本次分享嘉宾讲以“研究者”+“领域实践者”的双重身份解析在运维领域实际企业服务落地中如何实践大语言模型。2. 对于大语言模型,除了基座模型,在应用层面有哪些值得研究的方向?徐波 东华大学 计算机科学与技术学院副系主任/副教授个人介绍:徐波博士,2018年毕业于复旦大学计算机科学技术学院,获计算机软件与理论专业博士学位。同年加入东华大学计算机科学与技术学院。研究方向为知识图谱、大语言模型和智能运维。代表性成果是创建了目前最大的中文开放知识图谱之一:CN-DBpedia,累计API调用次数超过16亿次。研究成果发表在IJCAI、ICDE、ICSE、CIKM、COLING、WSDM等顶级国际会议上,曾获中国数据库学术会议(NDBC 2014)优秀论文奖。入选“上海市青年科技英才扬帆计划”。主持及参与国家重点研发计划、国家自然科学基金等国家和省部级科研项目10余项。参与国家级一流本科课程建设。担任全国知识图谱与语义计算大会CCKS 2022领域主席及多个国际会议和期刊的审稿人。曾获CCKS 2020最佳审稿人。演讲提纲:智能运维是人工智能赋能传统产业转型升级的重要应用场景,对我国数字经济发展具有重要意义。代码理解和生成是智能运维的核心任务,但当前技术在准确性和泛化性方面仍面临挑战。生成式大语言模型的兴起为解决上述难题提供了新的途径,但同时也面临着一系列新的挑战,包括领域适配困难、生成幻觉严重和推理成本高昂等。在本次演讲中,我们将探讨这些问题,并分享我们团队在运用大语言模型进行运维代码理解和生成方面的实践经验。扫码咨询报名
④ 数智 · 大数据系统论坛
个人介绍:复旦大学博士后,毕业于复旦大学软件工程专业。主要负责的工作内容:AI4DB(包括NL2SQL以及查询可解释性问题),NLP传统研究任务(包括机器翻译、语义解析等),以及大模型相关技术(包括提示工程、参数高效微调、工具学习、模型量化剪枝等)。发表论文:在国际会议期刊ICDE、KBS、WISE、WWWJ等发表论文7篇。演讲提纲:为数据库提供自然语言的查询方式能够有效地增强传统数据库的可用性。通过此查询方式,用户能够在不熟悉数据库查询语言,以及不了解底层数据存储结构的情况下,直接通过日常使用的自然语言提交查询请求,从而获取数据库中的相关数据信息。近年来,随着机器学习技术的快速发展,尤其在自然语言机器翻译技术上取得的显著进步,越来越多的翻译方法被相继提出。在此基础上,我们从数据库的角度出发,在数据库的自然语言交互方法上也进行了一系列探索。1. 除了通过传统序列到序列的翻译方法解决NL2SQL问题,是否还有其他方法?2. 如何利用更可靠的排序机制,获取更可靠的翻译结果?2. 如何能够指导大模型更好地生成可靠的SQL语句?个人介绍:彭程,毕业于大连理工大学,现任抖音集团电商数据架构师,负责抖音电商数据治理相关工作,在数据治理、数据架构领域有一定涉猎。王宏志 哈尔滨工业大学 教授、计算机科学与工程系系主任个人介绍:王宏志 哈尔滨工业大学计算学部长聘教授、博士生导师、计算机科学与工程系主任、海量数据计算研究中心主任、数据科学与大数据技术专业负责人,美国加州大学欧文分校博士后,微软亚洲研究院铸星计划访问学者,青年龙江学者,黑龙江省教学名师。其研究方向为大数据治理、大数据管理与分析、数据库系统等。在VLDB, SIGMOD等国内外重要会议和期刊发表学术论文300余篇,出版学术专著四本,其论文被SCI收录百余次,他引4000余次,授权发明专利35项。获得微软学者、中国优秀数据库工程师、IBM博士英才等称号,获得黑龙江省自然科学一等奖和教育部高等学校科技进步一等奖各一项,获黑龙江省青年科技奖、宝钢优秀教师奖、CSC-IBM奖教金。先后主持国家自然科学基金重点项目、国家科技支撑计划课题、国家博士后特别资助等10余个项目。中国计算机学会杰出会员,ACM SIGMOD中国秘书长、教育部高等学校计算机类专业教学指导委员会计算机系统专家委员会委员、中国数据库专业委员会常务委员、黑龙江省数据科学与大数据技术专业委员会主任委员、中国大数据专家委员会委员、哈尔滨工业大学计算学部校友会秘书长、ACM数据科学学科标准编写组专家、黑龙江省“头雁团队”成员。曾任哈尔滨工业大学英才学院副院长和中国计算机学会哈尔滨分部主席。个人主页:http://homepage.hit.edu.cn/wang演讲提纲:当前,释放数据要素价值成为数字经济的必由之路,但来自多源异构数据源的大数据价值释放需要确保大数据的高可用性,这对大数据清洗提出了要求,而大数据清洗带来了数据高熵、模态多样、错误共生等难题。本报告将对大数据清洗的概念和挑战进行了介绍,并展示大数据清洗技术方面的探索,最后加以总结,展望未来的工作。扫码咨询报名
⑤ 数智 · 新零售论坛
个人介绍:抖音集团电商数据BP专家,从业大数据行业十余年,曾在腾讯、虎牙等互联网企业工作,在数据仓库,数据架构等方向有丰富经历,多次在行业公开分享。王卓隽 阿里巴巴-1688 AI创新产品及应用负责人个人介绍:1688资深技术专家,现1688AI创新产品与应用负责人,专注在大模型与电商的深度结合领域。曾主导了1688运营数据化和智能化从0到1的平台建设,推动了1688电商内容化的算法及工程架构升级,孵化了平台的第一代终端智能交互技术产品。个人介绍:京东零售数据应用工程师,架构师,北京大学硕士。在大数据处理,分析,应用,架构等有丰富的实战经验。现负责京东零售数据资产的标准制定以及指标中台的建设。演讲提纲:京东零售从2022年开始指标中台的建设,来解决口径有歧义,存算不受控,开发效率低,指标难共享等问题。期间结合京东零售多种运营视角、多种组合计算、多种销售属性等特点,分别在查询层,语义层和加速层进行了创新,这个过程中基于 RBO、HBO 等多级加速引擎、基于代价与场景消费的智能物化策略、基于 One Metric 的异构融合服务、基于 One Logic 语义层的离近在线转换,显著提升业务数字化决策效率。a) 语义层建设-数据知识系统化,使资产放心好用、治理有依据b) 查询层建设-统一查询语言,最佳查询策略、最优查询性能c) 加速层建设-基于数据消费行为、系统内置规则自动加速2. 了解如何基于现状,在有历史包袱的情况下搭建指标中台,以及在建设过程中遇到的问题3. 了解如何如何从海量的数据模型与数据指标中提升检索数据的效率,降低数据存算的成本,提供更可信的数据内容和多种应用模式快速支撑业务的数据决策与分析个人介绍:十多年大数据经验,曾在招行、阿里任职,现任抖音集团电商数据架构师,在数仓建设、数据平台工具等方面经验丰富。个人介绍:抖音电商数据BP血缘项目架构师、火山引擎DataLeap研发工程师。专注大数据开发,致力于通过建设高质量的数据全链路血缘资产,围绕数仓的研发提效、模型质量、运维等场景,为各个业务方(数仓、DA、工程团队、B端客户)赋能。主导了抖音电商从数据源到数据应用的全链路血缘建设,并上线了一系列如代码速读、模型切换、影响面追踪等功能。这部分介绍血缘底座的建设,包括数据生产侧和消费侧血缘数据的采集、存储、分析以及血缘数据的本身的评估方法;此外还介绍宽口径/中口径字段血缘及其适用的场景。基于血缘的应用很多,重点介绍一下如下三个(分别对应质量、提效、运维场景)1. 模型评估:介绍如何基于血缘数据评估数仓的建设质量;在治理过程中,如何高效、可靠地完成大规模的数仓模型切换。(模型优化&模型切换)2. 字段口径探查:介绍如何基于血缘,探查某个字段的加工逻辑,支持穿透到上游ODS模型,能够减少80%的代码阅读量,并且提供一种可视化代码展示方式。(代码逻辑可视化&字段口径探查)3. 影响面评估:① 如何利用字段血缘评估变更的影响面;② 如何及时、准确地将上游变更影响周知到关联方。3. 抖音电商是如何通过数据血缘,帮助用户节省80%的sql阅读量的?4. 抖音电商是如何在高速发展的过程中,快速完成2W+任务切换?个人介绍:企业数智化领域10余年经验,先后就职于美团点评、阿里巴巴、菜鸟等大型互联网公司,对企业数智化转型、数智供应链、供应链金融等领域有深厚的积累沉淀。多次主导企业级数据中台和数智产品的实施,能够很好地将数智技术&产品与业务相结合,针对不同行业不同场景设计落地行之有效的数智化转型方案。目前负责菜鸟物流科技副总经理,带领团队深耕数智供应链领域,帮助企业级客户在数智时代打造领先的供应链能力。2. 产品:基于数据构建供应链控制塔,解决信息流、商流、物流协同问题;3. 业务:基于数据构建供应链金融科技,解决供应链资金流问题。1. 对供应链领域的数据问题和系统解决方案加深认知个人介绍:曾在世界五百强企业担任大数据架构师,数据团队负责人等职务,比较擅长为企业提供数据领域的解决方案。扫码咨询报名
⑥ 数智 · 新金融论坛
个人介绍:于中国科学技术大学,获得计算机科学博士学位。随后加入理光研究院,并在亚利桑那州立大学(ASU)担任博士后研究员。14年回国,加入阿里巴巴,现在蚂蚁集团数字科技事业群任数据智能负责人。个人介绍:2016年武汉大学概率与数理统计专业硕士毕业后入职腾讯金融科技风控与反洗钱部门,7.5年风控与反洗钱经验。主要负责支付合规与反洗钱可疑交易监测模型相关工作。演讲提纲:在移动互联网高速发展下,网络犯罪呈现高发态势,洗钱手法不断更新,且呈现出团伙性、组织性、隐蔽性等愈发明显的特征,财付通提出基于图计算的可疑交易监测方法,以能够识别出具有高价值的可疑线索。本演讲将从客户关系图谱构建、图计算方法应用、实践案例剖析等为大家讲解如何搭建基于图计算的可疑交易监测体系,来全面提升可疑交易监测识别效果。具体内容包括:个人介绍:夏一楠,2018年硕士毕业于清华大学,2020年加入京东科技任算法工程师,负责京东金融产品风控反欺诈建模与应用。主要研究方向包括图算法,自然语言处理,异常检测。1.了解金融风控领域建模问题及当前行业通用解决方案。2.了解NLP技术和大语言模型及其相关技术,在当前通用方案的优化点。3.了解当前京东科技在信贷反欺诈方向,对大模型技术的探索与应用。先后从中山大学与北京大学毕业,拥有计算数学相关专业学位。曾在 SAP 中国研究院从事内存数据库与高性能机器学习算法的研发工作。现负责众安AI、BI相关数据平台的规划和研发。个人介绍:邓伟洪,马上消费金融AI研究院副院长,作为主要研究人员参与 OpenCV等开源项目的研发工作,长期致力于多模态大模型和计算机视觉系统的理论研究和实用化落地,在 CVPR、TPAMI 等顶级会议和期刊上发表100多篇文章,谷歌学术引用15000多次,曾获北京市优秀博士学位论文奖、北京市科技新星项目、国家级青年人才项目,2023年入选斯坦福“全球前2%顶尖科学家”和科睿唯安“全球高被引科学家”榜单。演讲提纲:多模态技术可以将不同类型的数据(如文本、图像/视频、语音等)进行整合,并利用大模型对数据进行理解和生成,在金融场景有广泛的应用。本报告将介绍马上消费金融的“天镜”大模型的关键技术与实践应用,同时展望未来多模态的广阔应用。例如,可以利用图像和语音识别技术对金融场景情况等进行监测和评估,从而提前预警潜在的风险。结合文本分析和情感分析等技术对市场情绪进行预测,帮助投资者做出更准确的决策。利用语音识别和自然语言处理技术对交易的语音通话进行实时监测和分析,从中提取出有用的信息,辅助决策和发现潜在的违规行为。个人介绍:林昊,2014年毕业于电子科技大学,2016年加入招联金融,拥有十年人工智能技术产业落地经验,主要研究方向包括大模型、人机交互等。扫码咨询报名
⑦ 数智 · 新数字娱乐论坛
个人介绍:腾讯IEGG首席数据工程架构师,有超过10年的大数据架构和应用相关的经验,曾负责过QQ数据基础和应用平台从0到1的构建,腾讯公有云大数据产品技术架构的演进,目前负责IEGG数据团队技术架构优化相关工作。成欣 腾讯IEGG Senior Staff Product manager个人介绍:10年游戏海外市场发行及营销。2014年入职于德国慕尼黑上市电视媒体公司ProsiebenSat1游戏发行部门,负责中国区发行选品,分析和建模。2016年入职于德国柏林整合营销机构ComboStrike,负责中国办公室从0到1搭建,整合营销提案及执行。目前在腾讯游戏IEGG,探索海外游戏营销中台服务增长点。1. 文化差异:国内主流freemium和海外pc主机premium的差异:市场,玩家,产品,触媒习惯 2. 欧美游戏市场宣发和数据的运用(已落地实践部分) ① KOL业务为例:基本工作流程,效率提升点,产业结构,探索方向② 游戏标签,内容标签,品牌安全,舆情,后链路 > 数据结构 > 推介算法的探索1. 海外游戏营销的特征:国内免费手游为主,海外买断制pc/主机游戏是怎么推广的?和免费制手游推广有什么区别?2. 腾讯如何探索搭建适合海外二方studio(腾讯投资)的业务?以正在探索的KOL板块为例。个人介绍:多年百度搜索、大数据工作经验,专注于自然语言处理方向,曾获CCKS中文知识图谱大赛第一名。目前于阅文集团担任AIGC负责人职位,负责大模型、多模态、产研落地与知识管理与评估等多个团队工作。3. AI改编-从文字到视频,AI理解的内容到底是什么个人介绍:从事数据一线工作多年,先后在 ebay,携程从事数仓、数据分析、数据产品工作,目前在B站实践 DAMA 数据治理,负责过数据质量、数据成本2个主题 ,参与了B站的数委会、数据治理平台、元数据数仓建设、数据资产归属等一系列数据管理能力提升的项目活动。1. 从一线数据运营视角观察数据治理,理解数据治理、数据管理、数据运营的关系和异同点2. 获得一套已经在应用中的元数据模型,支持数据治理工作开展、评价得失3. 借鉴一次 DAMA 方法的落地应用,在开展其他主题的数据管理工作时有迹可循个人介绍:拥有6年大数据运维经验,加入沐瞳来,一直负责沐瞳大数据运维工作,主要担任沐瞳大数据运维体系建设,在 AWS 云上运维成本优化有显著成果。演讲介绍:介绍沐瞳大数据架构在出海业务上设计和优化,对 AWS 服务使用上的经验分享,对 AWS 云上成本优化和架构设计实践方案分享。3. 基于 S3 存储存储清单和访问日志做存储分析4. 基于存储分析做 S3 分层存储策略优化及成果个人介绍:知乎舰桥平台研发 Leader,知乎舰桥平台是:面向内容运营、用户运营、活动运营、创作者运营、场景运营(热点&热榜&话题&推送等)、生态分析等业务场景搭建的一站式平台。其中包含内容&用户管理和运营平台、内部营销平台(活动引擎&搭建&分析&投放平台)、内部投放和资源管理平台、创作者管理平台、DMP平台、内容池平台、经营分析平台、场景运营平台等等,全方位赋能业务运营和业务发展。数据驱动的时代正在全速向前,如何利用 Data Management Platform(DMP)和 Customer Data Platform(CDP)成为企业竞争力提升的关键。本次分享中,我们将深入探讨这两者在知乎的应用与实践。从其背后的业务逻辑出发,揭示知乎如何运用DMP/CDP驱动用户增长,提升内容定制、广告系统的精准度。同时,我们将揭示架构的设计思路,平台如何有效地落地运作,并分享在这一过程中遇到的技术挑战以及我们是如何解决它们的。最后,将扫描未来的趋势,对企业如何布局数据管理提出前瞻性的见解。无论您是产品还是研发,本次分享都将为您带来独到的洞察力和可行的建议。1. 通过 DMP(CDP)平台,为公司可解决哪些问题?个人介绍:李枭冰,硕士,抖音集团电商数据架构师,专注于实时任务开发、运维、治理流程化工具化平台化自动化体系化改造。2. 基于存储的准实时架构在平台侧、引擎侧的挑战与实践创新3. 直播、短视频业务在基于存储的实时数仓架构的实践2. 通过存储实时数仓架构,简化了开发,降低了资源消耗个人介绍:中国科学技术大学硕士毕业,曾就职于华为,2020年加入 Soul,组建视觉算法团队,主要负责视觉生成,多模态理解,虚拟数字人相关工作。扫码咨询报名