国家级法律AI基础设施正式发布!最高法召开“法信法律基座大模型”研发成果新闻发布会
来源:最高人民法院
2024年11月15日,最高人民法院举行新闻发布会,发布“法信法律基座大模型”研发成果,并回答记者提问。人民法院出版社总编辑余茂玉,人民法院出版社副总编辑、人民法院电子音像出版社社长林志农,人民法院出版社总编辑助理、人民法院电子音像出版社常务副总编辑张承兵出席发布会。发布会由最高人民法院新闻局副局长姬忠彪主持。发布会上,人民法院出版社总编辑余茂玉介绍了“法信法律基座大模型”研发建设相关情况。
为深入贯彻习近平法治思想,推动大数据、人工智能等科技创新成果与司法工作深度融合,落实好最高人民法院部署要求,人民法院出版社坚持以习近平新时代中国特色社会主义思想为指导,认真贯彻落实党的二十届三中全会精神,抢抓新一轮科技革命和产业变革的机遇,主动融入数字中国建设整体布局,探索新一代人工智能技术为法律赋能,积极研发法律行业的基座大模型,服务审判执行工作,服务法治中国建设。日前,“法信法律基座大模型”已完成在网信部门的生成式人工智能服务备案,是国家级法律人工智能基础设施,也是法律行业的基座大模型,今天正式向社会发布。
一、研发建设“法信法律基座大模型”的主要背景
党的十八大以来,以习近平同志为核心的党中央高度重视人工智能的发展,多次从国家战略高度强调人工智能对于引领科技革命、推动产业变革的价值和意义。习近平总书记在2019年1月召开的中央政法工作会议上指出“推动大数据、人工智能等科技创新成果同司法工作深度融合。”2023年,中共中央、国务院印发《数字中国建设整体布局规划》,明确要求“强化数字技术创新体系和数字安全屏障‘两大能力’”。党的二十届三中全会审议通过的《中共中央关于进一步全面深化改革、推进中国式现代化的决定》明确作出“完善生成式人工智能发展和管理机制”“建立人工智能安全监管制度”等重要部署。
当前,科技创新、技术迭代正加速推进,大语言模型已成为推动人工智能技术进步的关键动力之一,并广泛影响到社会各个方面,包括法律行业。未来法治建设将更加紧密地与人工智能等先进技术结合,行业也将迎来智能化变革。同时,也带来了一定的安全和风险挑战。人民法院出版社按照最高人民法院部署,通过研发建设自主可控的法律基座大模型,一方面推动现代科技与司法审判工作深度融合,积极探索人工智能技术赋能法律行业的路径,推进科技赋能公正司法,提升应用实效;另一方面促进规范人工智能技术应用,保障技术和数据内容安全可控,守住安全底线。10月23日,最高人民法院院长张军在人民法院出版社调研座谈时指出:“近年来,人民法院出版社一手抓图书出版、一手抓法律基座大模型研发应用,取得了积极成效。”
大模型是利用深度学习技术和大规模参数进行训练的生成式人工智能模型。研发建设“法信法律基座大模型”是在数字时代提高司法效能,充分挖掘、发挥司法大数据资源价值,助力审判工作现代化,更好满足社会各界和人民群众多元司法需求的重要举措。
二、研发建设“法信法律基座大模型”的重要意义
习近平总书记指出,新时代全面深化改革“必须把顶层设计和摸着石头过河结合起来”。最高人民法院在推进现代科技与司法审判工作深度融合的过程中,一方面注重顶层设计和整体谋划,另一方面也积极探索利用科技创新增效赋能的具体方法。研发建设“法信法律基座大模型”,具有多方面的重要作用和意义。
第一,研发建设“法信法律基座大模型”是落实总体国家安全观的具体措施。习近平总书记多次强调要“不断提升人工智能技术的安全性、可靠性、可控性、公平性”。大模型技术在法律行业广泛推广应用,在大幅提升执法、司法、学法、用法智能化辅助水平和效率的同时,不仅要防范大模型技术的一般性应用风险,更需要在大模型应用的专业性、内容安全、数据合规、隐私保护、制度机制保障等方面作出长期不懈的努力。人民法院出版社在研发建设法律基座大模型过程中,一方面始终界定好大模型辅助性、工具性的基本定位;另一方面始终坚持在法律数据安全合规的基础上进行创新应用,在守住安全底线的前提下促进技术应用和效能提升,努力以“法信法律基座大模型”的安全规范促进法律行业大模型广泛应用的整体安全。
第二,研发建设“法信法律基座大模型”是推动法律行业新质生产力发展的创新引擎。习近平总书记强调要“积极培育未来产业,加快形成新质生产力,增强发展新动能”。研发建设“法信法律基座大模型”,一方面,在做好内容安全管控和数据合规利用的基础上,可以积极发挥法律大数据要素投入行业产生的乘数效应,为法治建设工作广泛应用新质生产力提供支持。另一方面,大模型技术提供嵌入业务场景的人工智能解决方案,能够有效赋予法律业务的“新能力”和“智体验”,进而促进产业聚合和技术创新,将会成为法律行业新质生产力的创新引擎。
第三,研发建设“法信法律基座大模型”是助推审判工作现代化的有效路径。基于海量、权威和高质量法律大数据预训练后形成的“法信法律基座大模型”,具备法律语义理解、逻辑推理、融合搜索、内容生成等基础能力,同司法审判工作深度融合,有利于提升法律文书处理质效,保障法律正确统一实施,助力优化提高裁决公正性和准确性,助力加强监督制约和防范执法司法风险,更好地服务人民群众、服务法治建设、服务高质量发展,能够为审判工作现代化提供有力的科技基础支撑。未来法院将实现更高水平的数字化、智能化,审判活动将进一步优化,案件处理的质量和效率将得到极大提升。
三、“法信法律基座大模型”研发进展情况
自2023年起,人民法院出版社开始广泛调研,走访19家科研企业和单位,组织多轮专家论证和研讨。在清华大学科研成果转化的千亿参数通用大模型基座上,投入最高人民法院“法信”等多个法律大数据平台经过高质量专业标注的3.2亿篇共计3.67万亿字的法律文献、裁判、案例、观点等数据语料,融入人民法院电子音像出版社历时十余年搭建的包含18万法律知识体系编码的“法信大纲”,在各级法院、科研机构和科技企业的共同努力下,经过为期数月的预训练、优化训练、监督微调和多轮测评,最终形成研发成果——“法信法律基座大模型”。
根据国家网信办等七部委发布的《生成式人工智能服务管理暂行办法》,“法信法律基座大模型”作为国内法治领域的“行业基座”大模型,已于10月21日完成生成式人工智能服务备案。
“法信法律基座大模型”定位于法律行业基座模型,既是一个为法治领域提供生成式人工智能底层能力的基座模型;也是一套为保障法律人工智能安全发展,配套安全治理机制,提供数据资源、算力资源、评测资源的服务体系。
现介绍两个方面应用成果:一是以“法信法律基座大模型”作为底层支撑的深圳法院人工智能辅助审判系统1.0版上线全面运行后,有力提升了审判工作质效。二是以“法信法律基座大模型”对最高人民法院“法答网”“人民法院案例库”数据预训练而研发的“库网融合”智能检索系统将于近期试点应用,以数字化、智能化手段促进法律适用的统一。
下一步,经过对“法信法律基座大模型”底层能力进行更有针对性、场景性的开发应用后,一批数字化、智能化的“办案助理”“普法助手”“领域找法查案专家”“个人法律知识管家”等将上线应用,成为法律从业者的AI智能助手。
展望未来,法治建设将在人工智能等技术支撑保障下阔步向前。我们将牢牢把握新一轮科技革命和产业变革新机遇,锚定“法信法律基座大模型”作为国家级法律人工智能基础设施这一关键定位,广泛赋能法律行业创新发展。未来法院将积极探索人工智能在审判执行、纠纷化解、法律服务等方面的应用。司法领域发展和法治建设进程将迎来全新的发展机遇,数字化、智能化的未来司法文明正在向我们挥手。习近平法治思想的科学指引,党的领导和我国社会主义制度的优势,必将持续为经济、科技、法治领域发展注入强劲动力,我国社会主义司法文明必将赢得先机。习近平总书记五年前要求“推动大数据、人工智能等科技创新成果同司法工作深度融合。”“法信法律基座大模型”的研发就是落实党中央决策部署的具体行动,是习近平法治思想在人民法院工作中形成的生动实践。我们将始终坚持党的领导、坚持以人民为中心、坚持中国特色社会主义法治道路,持续推动大数据、人工智能等科技创新成果与司法工作深度融合,助力形成更高水平社会主义司法文明,为法治中国建设提供更为坚实的制度保障和技术支撑。
展望未来,“法信法律基座大模型”建设和应用前景广阔。在人工智能等先进技术推动下,中国法院将以更加开放的姿态积极拥抱科技,“法信法律基座大模型”建设将是一个不断探索、长期迭代、优化进步的系统工程。我们深知,只有真正落地应用的技术才是推动行业进步、造福人民群众的科技创新。我们将推进“法信法律基座大模型”融入全国法院“一张网”,更好服务审判执行工作,服务矛盾纠纷源头预防化解。我们将在进一步扩大资源聚集和投入、强化模型训练的基础上,加强实践应用,服务保障好数字法院建设、审判执行工作提质增效,进而助力数字中国建设、法治中国建设。我们将以开放的态度,真诚欢迎各界以不同方式参与到法律基座大模型生态的建设中来,共同推动“法信法律基座大模型”广泛赋能司法审判、行政执法、公共法律服务等法律行业场景,为人民群众提供更好更优的“法治产品”。我们将积极参与人工智能治理机制的建设,推动人工智能安全可信发展,服务公正高效司法,助力以审判工作现代化支撑和服务中国式现代化,把习近平总书记提出的“努力让人民群众在每一个司法案件中感受到公平正义”和“抓前端、治未病”要求落到实处,助力社会主义法治国家建设达到更高水平,助力在法治轨道上全面建设社会主义现代化国家。
法律大模型有何不同?“基座”如何定位?如何应用?相关负责人答记者问
问:刚才介绍中提到“法信法律基座大模型”已通过备案。据媒体报道,全国已有二百多个大模型通过网信部门登记备案,那么请问,法律大模型和其他大模型有什么不同?或者说为什么有了通用大模型,还需要法律大模型?
答:感谢您的提问!目前在国家网信部门备案的大模型中,既有通用大模型,也有行业大模型。大模型是一种利用大量数据和算力,通过深度学习技术训练出来的人工智能模型,它具有理解、生成、处理与规划各种类型数据的能力,它的规模和能力目前已经达到了千亿乃至万亿参数的级别,是一种典型的新质生产力,可以应用于各个领域,为人类提供智能化的服务和解决方案。通用大模型虽然具有广泛的应用能力,但它不一定完全匹配每个行业的专业知识和需求,法律行业的特殊性,使得研发建设法律大模型尤为必要。下面我从以下三个方面进一步说明这个问题。
一是法律行业应用大模型,首先必须深入贯彻落实习近平法治思想,要在中国特色社会主义法治体系之下,既要同中国法治建设实际相结合,也要同中华优秀传统法律文化相结合,要坚持正确的政治导向,弘扬社会主义核心价值观和社会主义法治精神,要确保内容安全。
二是法律行业的专业性、精准性,需要高度标准且及时更新的各种专业法律数据作为训练语料,以提升大模型对法律理解的准确性和适用性。法律思维本身特有的逻辑性、严谨性,也要求大模型具备更为强大的逻辑推理能力和论证能力。
三是法律文本及各种法律文书在应用时有规范性和严肃性的要求,因此它对大模型生成内容的专业合规、安全可信提出了更高的要求。
因此,在通用大模型之外研发建设具有行业专属性的法律大模型十分必要、意义重大。
问:我们注意到“法信法律基座大模型”名称中有“基座”两字,请问如何理解这个“基座”的定位?
答:感谢您的提问!“基座”通常是指建筑的基础底座。“法信法律基座大模型”中“基座”可以从以下三个方面来认识理解。
一是起基础支撑作用。高质量的法律数据预训练是构建法律大模型能力的关键。“法信法律基座大模型”使用最高人民法院“法信”等多个法律大数据平台的全量数据资源,种类全、规模大、来源可信、权威度高,能够源源不断为大模型预训练和机器深度学习提供充足的法律数据语料,所以它被定义为法律行业应用法律人工智能提供基础数据支撑的“基座”。
二是可靠可控。“法信法律基座大模型”在法律行业广泛应用,一方面其研发和预训练需要大量合规的法律数据,另一方面其能力也主要是应用到各种法律业务场景,所以大模型的安全可靠、自主可控特别重要。“法信法律基座大模型”在语料来源合法性、标注规范性、输出合规性、内容安全性上严格遵照监管要求,所以它是法律行业应用人工智能的安全与合规的“基座”。
三是广泛应用。“法信法律基座大模型”通过系统化聚集各类数据并集中化预训练,可以发挥数据资源规模效应、集约效应。也就是通过标准化知识工程、体系性安全评测等等,可以降低行业应用大模型的成本。通过开放能力、共享接口、统筹算力,可以促进大模型在法律行业取得更广泛的应用效果,所以我们说它是体系化支撑法律行业应用人工智能的“基座”。
问:“法信法律基座大模型”完成预训练和备案之后,接下来将主要在哪些方面发挥作用?
答:感谢您的提问!“法信法律基座大模型”经过海量、权威和高质量法律大数据预训练和增强训练之后,形成了很强的法律语言理解能力、法律文本信息抽取能力、法律逻辑推理能力以及根据提示的文本生成能力等。在大模型这一底层能力之上,可以对接、支撑各类法律人工智能产品和服务。除了前面介绍的在智能辅助审判和库网融合检索这两方面的具体应用,还可以在以下方面发挥作用:
一是在司法工作各环节中发挥作用。比如现在在“案多人少”的压力下,即使有案件卷宗电子化的辅助,法官也要耗费大量的时间精力审查阅卷,大模型能够辅助法官从大篇幅的电子卷宗中快速进行信息分析比对,抓取要点、提炼梗概,提高立案审查和阅卷效率。再比如随着目前法律案例的大量汇聚,法官经常要在上亿的文献中查找法条和类案,甄别筛选都要耗费很大精力。大模型不但能够提高法官查法找案的质量效率,而且经过训练开发,可以像一个数字工作助手一样,帮助法官对检索到的信息进行整理、分类、提炼,可以基于法官的任务要求去总结分析相关的司法观点、裁判规则,润色校对、审核纠错法律文书。
二是在行政执法方面发挥作用。比如辅助执法人员对执法案件的信息进行审查核验,监测报警异常情况,匹配推送执法依据和类似案例,检查执法行为是否符合法定程序和规范,确保执法活动的合法性。
三是在公共法律服务方面发挥作用。以往由于法律的高度专业性,公众在进行法律咨询时,通过自然口语所表述的纠纷案情和争议诉求,如果不经过法律工作者的理解转化,很难获得精准、专业的解答。经过专业大数据预训练的法律大模型,不但可以理解公众非专业化的诉求表述,而且本身的回答也能具备相当的专业水平,可以根据具体案情为公众提供和解、调解、应诉等不同策略和建议,可以大大降低公共法律服务的门槛,为公众提供更为便捷、普惠的法律咨询服务。
问:下一步,“法信法律基座大模型”重点发展方向是什么?
答:下一步“法信法律基座大模型”重点发展方向主要有三个方面:
一是强化“法信法律基座大模型”核心技术,全面提升保障能力。持续加强研发投入,密切追踪前沿技术,增强“法信法律基座大模型”的自主创新和可信可控能力,提升对法律数据和内容安全的保障能力。
二是畅通“法信法律基座大模型”数据循环,夯实数字法院建设基础。推动法律数据的畅通循环、整合归集、共享利用,提升“法信法律基座大模型”依托的数据资源规模和质量,服务全国法院“一张网”建设和审判执行工作提质增效,助力公正高效司法。
三是提升“法信法律基座大模型”社会化服务水平,赋能法治中国建设。坚持“抓前端、治未病”理念,服务矛盾纠纷源头化解,推进“法信法律基座大模型”服务资源和能力开放利用,响应执法司法办案服务需求,助推法治数字政务的服务效能和水平,为法治中国和数字中国建设贡献力量。
编辑:平钰骁
重磅福利
关注“法律检索”公众号,后台回复“暑期学校”即可获取首届“大数据与法律检索”暑期学校课程PPT。回复“PPT”即可获得中国大学MOOC《大数据与法律检索》主讲人在深圳律协授课的PPT(六百多页干货)。
深圳律协培训课程《律师法律检索核心技能》B站地址(点击文后阅读原文即可观看)
https://www.bilibili.com/video/BV18y4y137xu/
扫下方海报二维码即可免费学习中国大学MOOC《大数据与法律检索》第八期课程(有重要更新)