11月24-25日,AI+软件研发数字峰会(AiDD)在深圳举办,在由网易副总裁、网易杭州研究院执行院长、网易数帆总经理汪源担任出品人的“领域大模型”论坛上,来自浙江大学、网易数帆、WakeData和招商银行的技术专家们深入讨论了领域大模型的最新实践。其中,网易数帆资深算法工程师李家诚分享了玉言NL2SQL领域大模型的研发及其在数据分析产品有数ChatBI中的落地。
网易杭研受邀参加AiDD,分享玉言NL2SQL领域大模型实践
领域大模型,即利用大规模领域数据和深度学习技术构建的适用于特定领域的高性能大模型。这类模型通过深入理解领域知识和数据特征,能够提供更准确的预测、改善决策和优化系统性能。基于领域大模型,开发者能够加快应用开发速度,更能显著提升该领域的业务能力。
李家诚表示,结合来自网易杭州研究院的“玉言NL2SQL领域大模型”,和网易数帆大数据团队的产品交互设计、工程化能力,ChatBI产品已经支持非专业用户通过自然语言与BI平台进行交互,实现数据查询和分析,开启了数据分析新范式。
玉言NL2SQL领域大模型
玉言NL2SQL领域大模型的任务,是将自然语言问题(NL)转换为可在数据库中执行的结构化查询语言(SQL)。
李家诚介绍:
玉言NL2SQL领域大模型是使用中文互联网开源的表格和SQL代码数据集,以及网易集团内部积累的表格及SQL代码数据集,以提升自然语言生成SQL代码的准确性为训练目标,对玉言大模型基座进行继续预训练和指令微调训练得到的。
网易杭州研究院还构建了一套更贴近业务场景的NL2SQL评测方案,以解决学术界评测方案存在的不足,如实际业务场景下查询语句(query)更偏口语化、模糊意图查询下有多个正确答案、评测指标准确性不够等,从而确保SQL执行结果和SQL逻辑完全符合query的要求。在这一严谨的评估方案下,玉言NL2SQL领域大模型在数据分析场景下整体性能优于GPT-4。
产品工程能力成就可信ChatBI
当然,并不是说NL2SQL面前就是一马平川的大道。从NL2SQL到ChatBI产品落地,仍然存在着业务知识理解不可控、无法保证结果百分百可信、上千张表的长序列输入不支持、推理速度慢、资源成本高等挑战。
01
需求可理解
借助大模型的语言理解能力,先进行需求分析,这样即使是完全不懂BI的使用者也能通过需求分析内容判断系统的取数步骤是否正确。
02
过程可验证
不仅仅生成SQL查询语句,还使用一个查询语句解析引擎将其解析为人类可理解的语言,以确保用户了解模型的执行过程。如果发现错误,用户可以立即识别并不信任结果。
03
用户可干预
允许用户对模型生成的查询进行干预。用户可以更改条件、切换表格等,以纠正错误或调整查询。这提供了用户对结果的额外控制。
04
产品可运营
产品不是一个静态的工具,而是能够随着用户的使用变得更智能。通过收集用户的行为习惯,正例和反例,结合个性化知识配置和不断的运营,模型能够变得越来越智能,越来越适应用户的需求。
通过这些措施,有数ChatBI将大模型生成的复杂SQL转换成易于理解的自然语言描述,能做到查询条件自然语言描述和数据结果完全一致,确保用户的每一次查询都是透明和可验证的。
李家诚说:“虽然大模型会产生幻觉和不稳定,但有数ChatBI的用户能轻松判断取数逻辑是否正确、该数据是否可用,产品的可信赖度100%。”
结 语
目前,ChatBI不仅在网易内部广泛应用,还逐步在行业客户场景下开启了深度试用之旅。ChatBI的成果,验证了知识增强领域大模型特色技术的领先性和可行性。事实上,这一技术还已经用于为网易数帆EasyData、CodeWave、轻舟云原生等核心产品增强智能特性,以及在医疗文献领域为医疗科研工作智能化加速。