一款法律 AI 助手的产品设计思考
前段时间,笔者所在公司发布了「INSSENT AI」,一款法律全领域的 AI 助手。
产品地址:
法律人好奇,如何使用 AI 技术赋能法律行业,带来真正的生产力提升? 投资人好奇,「AI+法律」有哪些不错的投资机会,是不是真的跑得通? 大家都好奇,我们是怎么做的,使用了哪些技术和数据,以及如何训练? 大家都好奇,我们未来的产品方向在哪里,是做领域模型还是垂直应用? ......
每一位律师,都将熟练掌握法律 AI 工具,用以取代重复低效的工作内容,从事更高价值的法律工作; 每一个组织或个体,都将把法律 AI 工具引入日常的工作流或生活中,提升法律服务可产生的经济效益,至少在简单的法律咨询环节,获得成本更低、响应速度更快且质量不错的服务; 中国乃至全球的法律行业,都将通过 AI 得到更好的发展,获得更大的想象空间。
「AI+法律」
在私人助手场景的落地应用
首先,「AI+法律」,就像十年前的“互联网+法律”,以及近年来兴起的“法律科技”概念一样,是一个非常大的范畴,本质上是一个新科技在法律这个垂直领域的落地。而 INSSENT AI,则是 AI 技术在「法律领域」和「私人助手」这个细分场景的应用。
「AI+法律」
使法律服务出现新范式成为可能
传统意义上,当人们想解决一个法律问题,常见的解决方案就是律师或法律咨询机构,但随着互联网的发展,解决方案逐渐多元。
区分人们寻求法律解决方案的方式,我们可以把法律服务的需求方大概分为以下两类:
第一类用户遇到法律问题会先去搜索相关信息,尝试自己解决,解决不了的时候再去找律师或法律咨询机构解决;
第二类用户遇到问题直接找律师解决。
虽然没有具体的数据支撑,但凭直觉判断,现阶段肯定是第二类用户占大多数,第一类用户还比较少,但正在慢慢增多,而这部分用户就是以 80 后、90 后为代表的第一代互联网原住民,再加上普法工作的持续推进和获取信息的门槛持续降低,学习法律知识、在线法律咨询的趋势将会加速。
在这个过程中,人们解决法律问题的需求是不变的,但随着技术的发展,肯定会带来新的解决方案。
那么,这个新的解决方案可能是什么呢?
首先,我们先来分解一下原来的解决方案 —— 律师,到底提供了什么价值?
挖掘、梳理客户需求,即根据律师的所学和过往的经验进行提问、归纳和总结
提供相法律服务,包括简单的法律咨询和文件起草工作,以及更复杂的谈判、出庭等“人”的因素占主要作用的工作
作为“人”与客户之间的信任关系
成本:虽然近年来行业出现一些低价竞争的情况,但总体上律师费还是挺高的。 专业性:律师的专业能力参差不齐,不一定能解决客户的问题,但法律服务缺少好的评判标准,导致专业性的需求被掩盖,但这并不意味着这个需求没有了。当然,有时候专业性也不是最重要的。 信息不对称:由于律师行业缺少科学或合理的律师评价体系,客户在专业能力参差不齐的市场上很难找到适合自己的律师。于是就出现了很多律师没客户,同时客户也找不到合适律师的情况。
打造一款法律 AI 助手的难点
然而,正如 OKR 之父约翰•杜尔所说:“Ideas are easy. Execution is everything.” 想法很简单,执行才是一切。
笔者认为,人类对法律 AI 助手的期待,或者说最期待的获取法律知识的方式,就是像和人一样交流 —— 向专业的人,问专业的事,解决专业的问题。在未来,“专业的人”将会无处不在,也就是智能机器人。
但是,由于法律行业的特殊性,人们对法律服务的专业性天然有很高的要求,就像人们都希望得到资深律师或资深医生服务一样,人们对法律 AI 助手的期待亦是如此。
这就意味着,如果我们想要打造一款法律 AI 私人助手,那么这款产品的专业性和回答的准确度就至关重要了,像 ChatGPT 会出现的“幻觉”是绝对不允许出现的。
所以要想打造一款法律 AI 助手,至少会面临以下几个难题:
第一:法律数据的数量不足。
首先,我们需要对 AI 有一个基础的认知,即 AI 主要由三个基本要素组成:算力、算法、数据,缺一不可。
其中,算力的核心是芯片,全世界都吃紧,操心也没用,算法目前都是基于市面上领先的大模型,以 Transformer 架构为主,而大模型的突破除了架构本身的问题,大数据也起到了很大的作用。
然而,虽然以 ChatGPT 为代表的大模型使用了海量的数据进行预训练,但在垂直领域,比如法律行业,数据仍然非常缺乏。即便是业内公开的数据源 —— 司法裁判文书,已经上网的有 1.4 亿份,但与 GPT-3 及以上的大模型超过 1 万亿的参数量相比,根本就不在一个量级,而且从目前来看,算力的问题也不太可能支持每个领域都有一个基础模型。
所以,法律“大模型”,可能并不成立。
同时还要区分不同场景,每一个场景都需要大量数据进行训练,才能使 AI 在某些场景变得智能,否则如果只是给 ChatGPT 套个壳,并不会带来实质性的提升。
比如「智能合同审查」这个场景,只有用某个领域、足够多、真实的合同,对算法进行训练,才有可能实现所谓的智能合同审查。这就意味着,你必须服务足够多的客户,而且这是现阶段唯一可行的路径。因为客户不可能把机密的合同数据随便开放给你,首先数据权属尚不清晰,其次即便国家出台了相应的法律法规,企业对使用数据的态度转变也需要相当漫长的时间。
因此,如果一家公司压根就没做过几家合同审查的客户,突然推出了一款“智能合同审查产品”,那么大概率就是给类 ChatGPT 产品套个壳,并不是真的智能合同审查。
顺着这个框架去思考,对于很多所谓的“AI+法律”产品是不是真的,其实很容易就能判断清楚了。
第二:法律数据的质量也不高。
由于人们对法律服务专业性的高要求,AI 在法律领域落地所需的法律数据的质量要求,就比训练大模型要高得多的多。
目前市面上领先的大模型 —— GPT-4 的参数量超过 1 万亿,对于大模型来说,数据量级比数据质量更重要,这使得 ChatGPT 更加智能,但也可能是“幻觉”(hallucinating,指 AI 编造事实)问题出现的原因之一。
对于法律行业来说,业内公开的数据源 —— 司法裁判文书,已经上网的有 1.4 亿份,数据量似乎很大,法律问答、文章、期刊文献也很多,但数据质量未必很高。
事实上,人们对「大数据」普遍存在误解,觉得「大数据」就等于数量大,其实不然。大数据至少包含以下四个维度:
数量大
维度多且最好是正交的
完备性
实时性
只有同时具备以上四个维度,才能最大限度地发挥数据的价值,毕竟大数据本质上是个统计学的问题。
司法裁判文书:数量大,但维度有限,不完备也不实时 —— 并不是所有文书都上网了,也不是实时更新的,文书依据的法律可能被修改或废止,但文书不会自动修正,而且我国统一法律适用也不成熟。 法律问答、文章、期刊文献等:从本质上看,绝大多数的法律问答、文章、期刊文献都没有太大的价值,因为法律服务市场理论上存在最好的服务,由各个领域的头部法律服务机构提供。就像合同模板库这个概念一样,每个业务领域理论上只存在一份最完善的合同模板,覆盖几乎所有场景,而且这份模板只能是服务足够多客户的机构推出的,因为这个机构见过足够多的问题,因此绝大多数律师提供的模板都没有太大的价值。只是国内的法律服务市场还很初级,很多律师提供的文本看起来也很有价值,但未来必然会面临整合。
与目前主流的 AI 应用场景 —— AIGC(即 AI 生产内容)不同的是,易参设计 INSSENT AI 的总体思路是: 打造一个能给出靠谱法律意见的助手,每一条输出后面,都可以明确地指向某一个法律法规的条文或者案例,让你知道来源是靠谱的,而不是一本正经地胡说八道。
AI 发展的几个不同范式
具体到技术实现路径上,也还没有共识。
直接训练不同垂直领域的 foundation model(基础模型) 对大语言模型(LLM)进行“微调”(fine-tuning) 通过 Hugging-GPT、Auto-GPT、ChatGPT-Plugin 等“代理”(agent)应用,以大模型为大脑,调用各种专家模型(比如法律)来解决问题
大多数法律 AI 产品都还很初级
但整个行业的天花板会不断提高
一直以来新技术都是博取眼球的噱头。可以预见的是,炒作法律 AI 概念的产品未来会越来越多,很多人会因此感到焦虑。
注:FOMO,Fear of Missing Out,中文可以叫:错失恐惧症,也称为社群恐慌症。指的是人们害怕错过任何有趣或重要的事情,以至于经常感到焦虑和不安。在这个社交媒体和数字化时代,FOMO 现象变得是如此普遍,因为人们通过社交媒体可以看到其他人的生活和活动,并且会担心自己可能会错过一些与之相关的体验或事件。同时,FOMO 也被定义为一种对后悔的恐惧,而这种恐惧使得你情不自禁地陷入到对错失结交社会关系、获取新奇经历、投资机遇或是其它事情的忧虑中。
正如过去几次科技革命一样,数字化浪潮滚滚向前,无可阻挡,各行各业终将被技术或多或少地改造,市场天花板也会不断提高。
-FIN-