Data+LLM:金融真实场景的技术创新实践
金融数据智能技术大起底!
8月31日,09:00-17:00,DataFun将联合业内多位知名专家举办DataFunSummit2024:数智金融技术峰会,将深度探讨大模型时代金融领域的最新态势,分享各自的研究成果与实践经验,共同推动Data+LLM技术在金融各个领域的深入应用,并产生价值。感兴趣的小伙伴欢迎识别二维码免费报名,收看直播:
扫码免费报名,收看直播
峰会日程
精彩议题
部分议题详细介绍
曾阳 平安银行 金融科技部创新实验团队负责人
个人介绍:平安银行金融科技部创新实验团队负责人,北京邮电大学计算机硕士,从事人工智能、WEB3、国内和国际支付等多个领域产品创新工作。2023年加入平安,现深耕平安银行金融科技创新,致力于通过技术创新和业务创新赋能银行数字化转型。加入平安前,曾任职于中国民生银行、字节跳动等知名企业,也曾作为联合创始人和CTO创立过一家银联全品类备案聚合支付服务商公司,具有丰富的产品创新和市场实战经验。
演讲题目:平安银行 AIGC 应用实践
演讲介绍:随着从互联网到移动互联网、再到大模型时代,传统银行在上一个科技周期的落后已成定局,大模型技术标志着新一轮科技周期的开始,新的产品和模式必将应运而生。平安银行聚焦 AIGC 技术,深耕数字化营销、数字化运营、数字化消保、智能研发等银行创新场景。本次分享将聚焦平安银行 AIGC 应用场景,分享在银行业务场景中的落地成效。
演讲提纲:
1. 金融行业大模型应用的现状与挑战
2. 平安银行 AIGC 应用实践分享
3. 总结与展望
听众收益:
1. 了解如何将 AIGC 技术应用于金融领域,以及其带来的变革
2. 了解金融大模型在银行实地落地要解决的合规性问题
3. 了解银行如何搭建大模型技术架构,如何对大模型效果进行评测和选型
落地挑战和方案重点:
1. 金融大模型的合规性
2. 如何让业务部门感知大模型带来的变革
霍亮宇 度小满 AI算法研究员
个人介绍:7博士毕业于北京航空航天大学,博士期间主要从事深度强化学习、模仿学习研究工作,相关研究成果发表在TPAMI、TCOM、AAAI等国际知名期刊和会议。博士毕业后进入度小满和中科院自动化所联合培养的博士后工作站,主要从事AI算法研发工作。工作期间主要负责轩辕金融大模型的强化对齐工作。构建了完善的RLHF训练框架,重点突破奖励模型存在的问题与难点,通过强化训练改善轩辕大模型的有用性、安全性和金融能力,显著提高与人类价值观的对齐程度。
演讲题目:金融大模型训练与对齐技术探索
演讲介绍:近年来,大语言模型已逐渐成为AI领域的研发热点。通过增加模型尺寸,并使用海量数据进行训练后,模型可获得各项知识并展现出了较强的通用能力,包括知识、理解、逻辑推理等。大语言模型有望为金融行业创造新的价值增量。然而在实践中我们发现目前的通用大语言模型难以胜任金融任务,其仍欠缺专业的金融知识,金融能力也不能满足金融任务的需求。此外通用大语言模型的训练和部署成本极高,这给其在金融领域的应用落地也带来了一系列挑战。为了解决这些问题,我们研发了金融领域的轩辕大模型。通过补充大量的高质量金融数据并采用一系列创新性做法对大模型进行预训练和SFT,显著提升了大模型金融知识和金融能力,同时保证了模型的通用性。在此基础上,我们通过RLHF技术进一步对齐了模型价值观与人类偏好,在保证金融能力的同时,减少潜在的安全性风险,显著提升了模型体验。
我们先后研发并发布了6B、13B和70B的轩辕金融大模型,在一系列测试基准中表现优异,覆盖了不同模型尺寸范围,构建了完整的大模型能力矩阵。本次分享主要介绍轩辕大模型研发过程中采取的相关技术,包括预训练、SFT、偏好奖励训练及RLHF等。此外也会介绍轩辕大模型的开源情况及其在金融业务中的应用落地情况。主要内容包括:
1. 从通用大模型到金融大模型的挑战
2. 度小满轩辕大模型的诞生之路
3. 金融大模型的训练与对齐经验探索
4. 金融大模型的落地与展望
听众收益:
1. 金融大模型训练过程
2. 大模型对齐的方法与经验
3. 金融大模型落地案例
落地挑战和方案重点:
1. 高质量金融数据的收集
2. 应用场景下的稳定性保证
张恺 东方财富 人工智能研究院 技术科研负责人
个人介绍:专注人工智能及大数据领域研究15+年,在东方财富/携程/优刻得等多家知名企业从事相关技术研发与团队管理工作,对大模型预训练及评测,互联网个性化推荐及广告算法服务有深入研究和实践,尤其在金融、旅游、AI领域有多项研究与实践,具备多次从零到一构建数据团队或算法团队的经验。
演讲题目:智能金融稳步前行:构建负责任的可信大模型
演讲介绍:在金融领域,人工智能正迅速成为推动行业创新的关键力量,但同时也伴随着大量的安全风险隐患,这无疑对于金融领域是一条严守的红线。本次演讲将深入探讨大型在金融领域的落地难点,并如何通过可信的方法缓解相应难点和挑战。分享将介绍我们选择的方案及其技术亮点。并通过实际案例,展示我们的解决思路和策略,以及这些策略如何有效应对落地挑战,最终实现业务的显著成效。具体内容包括:
1. 业务背景:
① 金融行业的现状与挑战
② 人工智能在金融领域的应用前景
2. 方案选型:
① 为什么选择大模型
② 大模型的技术优势与业务适配性
3. 落地挑战:模型的可解释性与合规性
4. 解决思路:
① 负责任的 AI 实践
② 模型透明度与伦理考量
5. 解决成效:业务流程优化案例
6. 未来规划:技术迭代与创新方向
7. 总结:
① 负责任的大模型在金融领域的长远影响
② 对行业未来发展的展望
听众收益:
1. 了解如何将人工智能大模型技术应用于金融领域,以及其带来的变革。
2. 掌握在金融领域实施可信 AI 的关键原则和实践方法。
3. 获取关于数据隐私保护、模型可解释性与合规性的实际解决方案和案例分析。
落地挑战和方案重点:
1. 数据隐私与安全:介绍如何通过先进的数据加密技术和访问控制来保护用户数据。
2. 合规性:讨论如何确保 AI 模型遵循金融行业的法规和标准。
李渔 熵简科技 联合创始人兼CTO
个人介绍:熵简科技联合创始人,清华大学电子工程系博士,已在顶级会议及国际期刊发表18篇学术论文,申请专利10项,长期从事自然语言处理及深度学习与金融资管领域的交叉研究和应用探索,让科技赋能产业。目前负责熵简科技NLP技术中台的建设,包括层次化的分层架构、大数据泛采体系、持续部署的后台支持以及前沿算法的领域内落地等,为熵简科技的各大业务线提供底层技术支持和可落地的解决方案。曾获北京市优秀博士毕业生,清华大学优秀博士论文,腾讯云TVP专家等荣誉。
演讲题目:面向金融资管场景的 RAG 体系建设和落地实践
演讲介绍:大语言模型(LLM)在落地到金融资管场景时存在三方面的不足,包括无法提供及时信息、生成内容可能存在幻觉、金融专业深度不够,这大大限制了 LLM 在金融这类高实时性、高准确度场景上的落地效果。在本次演讲中,我们将分享熵简科技如何基于多年的金融数据治理经验和自然语言处理的积累,去构建专门面向金融资管场景的 RAG 体系,用以协同LLM解决上述三类问题。整个 RAG 体系包含识别率高达95%以上的PDF解析引擎、超长文档语义分割引擎、召回效率强于其他向量化模型50%的 FinBERT2模型以及检索效果高出OpenAI embedding 30%的FinSearch 语义检索引擎四大核心组件。整个 RAG 系统能够在 2000万数量级的金融文档上实现 97% 的检索召回率,辅助 LLM 在个股洞察、宏观研究、行业分析等方向接近初中级投研分析师水平,并逐步将LLM的服务能力向机构服务端、财富管理端演进。
演讲提纲:
1. 大语言模型在数智化金融资管系统建设上的典型需求和主要挑战
2. 熵简科技构建的面向金融资管场景的 RAG 体系及落地案例
3. RAG 体系的关键组件:三阶段训练而成的金融专属向量化模型 FinBERT2
4. RAG 体系的关键组件:打造接近人找资料能力的高性能检索系统
听众收益:
1. 了解大语言模型在数智化金融资管系统建设上的典型场景和主要挑战;
2. 了解如何通过领域内海量数据的预训练结合对比学习,构建明显优于当下最好开源向量模型以及闭源向量模型的向量化模型;
3. 了解如何通过构建千万级文档下超高召回率的检索系统;
落地挑战和方案重点:大语言模型(LLM)在落地到金融资管场景时存在三方面的天然不足,一则由于知识存在模型权重中且很难做到高频训练,因此无法提供及时的资讯;二则,当前阶段LLM无法完全抑制幻觉,这无法满足金融资管对于高准确性的要求;三则在金融专业度不够。
马琼旭 网商银行 高级算法专家
个人介绍:负责网商渠道营销智能化建设,先后负责整合营销、端外渠道拓展、全渠道运筹等流量建设项目,打造智能出价、序列投放等底层算法能力。先后主导参与多篇国际学术论文工作,接受CCF-A/B论文8篇,相关专利11篇。
演讲题目:金融流量营销中的算法应用
演讲介绍:介绍金融类产品在流量营销中涉及的主要问题与相关算法解决方案,围绕背景、挑战、算法问题定义与解决方案展开,进行框架式介绍。
演讲提纲:
1. 金融流量营销场景介绍
2. 场景中分别涉及的算法需求&挑战
3. 算法(多目标、因果)解决方案与未来探索方向
听众收益:
1. 了解数智能力在金融产品营销中的实际业务
2. 了解相关业务中涉及的算法应用
落地挑战和方案重点:
1. 数据稀疏与有偏
2. 场景多业务多,算法成本高
徐哲轩 蚂蚁集团 高级算法专家
个人介绍:蚂蚁集团保险营销策略与财产险算法负责人,主导蚂蚁保用户洞察,AIGC,营销定价等能力建设。曾在海外大厂从事推荐和搜索工作。
演讲题目:AIGC 在保险领域的初步探索
郑光煜 蚂蚁集团 高级算法工程师
个人介绍:郑光煜,现任蚂蚁集团财富技术部高级算法工程师,复旦大学硕士,主要研究方向为推荐系统、迁移学习、表示学习、自然语言处理等,曾在 ICLR、EMNLP 等国际顶级会议发表论文。
演讲题目:跨域多目标 Ranking 在金融营销领域的应用
演讲提纲:
1. 解决什么问题
2. 跨域多目标推荐的技术原理
3. 实际案例:结合真实业务场景理解技术应用的细节与挑战
4. 解决思路
听众收益:
1. 跨域多目标推荐模型的发展历程
2. 在金融营销领域对于跨域推荐的技术思考与落地实践
3. 多目标 Ranking 的落地实践
范彬彬 外资行 大数据研发团队负责人/数据专家
个人介绍:范彬彬,目前负责外资行的数据底座平台建设、数据应用(营销、运营,风险)规划与建设、数据治理的工作。7年以上从事银行金融科技开发、管理工作,具备头部股份制银行、外资银行的从业经验。熟悉银行电子渠道、支付、信贷风控贷后管理全流程、银行核心总账、监管报送、开放银行平台等从0到1的完整落地建设经验,丰富的银行应用系统架构规划经验。
演讲题目:中小银行大数据应用实践
演讲介绍:本次演讲重点介绍中小银行大数据探索建设之路,在知中行,在行中知。基于数据质量,数据开放,数据开发等多重痛点之下,可控的成本投入的基础之上,完成数据智能应用建设和推广。
演讲提纲:
1. 建设背景与目标
2. 大数据平台的整体规划与架构
3. 大数据智能应用落地实践的思考
4. 建设效果和战略延续
听众收益:在面对成本和效率等多方因素下,中小银行探索出一套切实可行,经验可复制的大数据平台和应用落地的最佳实践。(仓湖一体、银行数据建模、数据智能化应用)
落地挑战和方案重点:
1. 数据质量管控
2. 数据开放能力
3. 数据开发管理
扫码免费报名,收看直播