惊艳!新一代法律文书审核机器人的试用感受| 律新社观察
律新社特约撰稿人 | 吴皓(云南八谦律师事务所)
吴皓律师
前言·致推轮子的人
人工智能法律服务产品,听起来美好,做过的人才知道里面有多少天坑。有前辈曾总结,“人工智能”的主力仍是“人工”,有多少“人工”才有多少“智能”。每个微小产品功能,都少不了法律服务从业者对专业知识、对实务经验、对法规案例数据不舍昼夜的总结、提炼、转化。这些人面对的不再是对方律师或对方客户,他们选择了站在行业技术变革最前沿,前面屹立着驱动下一个时代的巨大齿轮。前仆后继的努力在外界看来或许并未让齿轮发生多少改变,这种无力的绝望多少都曾困扰每位先驱的内心。但他们深知自己走下的每一步,都在突破想象。
01 合同机器人
那天律新社Susan问我:牛法网在做一个合同机器人,你注意到了吗?当时我的第一反应是:又一跟风的。因为“法律文书机器人”这类工具,在法律技术领域实在不是新鲜概念。
我了解比较早的就有“米律”,初期主打为创业者提供免费定制合同文书,现在迭代到2.0版本,部分业务功能开始收费,合同种类更加齐全;“法斗士”官网首页也挂了一个名为“合同生成器”的菜单,提供劳动合同、知识产权与竞业限制协议的在线生成;最近看到的“简法帮”,定位更加清晰,专门为公司进行天使融资、股权激励、股权架构提供配套法律文书的在线生成服务,瞄准了互联网公司。
而牛法网新推出“合同机器人”,听名字并未脱出前人藩篱。所以当我打开“合同机器人”页面的时候,我原本以为画面会是这样的:
但是我看到的画面却是这样的:
居然要求上传整个合同!我隐约感觉到,这个“合同机器人”将与我所知道的“法律文书机器人”完全不同。上传了一个自己用过的租房合同,结果是这样的:
左侧是我所上传的合同原文(彼时还未从业,条款粗陋),右侧是“合同机器人”的审查结果。点击每项审查结果,左侧的合同文书会跳转到对应位置。它识别出我在合同中“未写明租赁房屋的用途”,并做了进一步风险提示。
右下角的“下载修订版”按钮,点击后得到word文档如下。
没错,就是律师日常帮客户用“修订模式”审合同后保存的那种版本。正文蓝色字体部分,是“合同机器人”增加的可选用条款;右侧修订栏名为“Qcloud”的,是“合同机器人”添加的批注。
到这里我知道,牛法网开启了“法律文书机器人”的第二种形态。
02 第二种形态
法律文书的“审”、“拟”,是律师工作两大板块,而所谓“法律文书机器人”,则是辅助或代替律师处理此类工作的法律技术。前文提到“米律”、“法斗士”、“简法帮”这些网站所提供的“在线法律文书生成”服务,其实都在解决“拟合同”的问题,可以归为“法律文书机器人”的“第一种形态”;而能够提供“审合同”服务的,归为“第二种形态”,此前从未出现。
两种形态,对应着两个技术层级。
“第一种形态”背后,用到的技术并不复杂,主要就是根据用户提供的信息进行文本拼装;功能完善一些的,会通过分支条件的选择,进行一些板块增减;总体而言是一个输入对应输出的操作,做的是“填空题”。
到了“第二种形态”,则会面临两项技术挑战:其一,是对用户上传合同文本的理解,如何断句、如何分析、如何识别;其二,是建立一个庞大的、按照一定规则架构的数据库,其中的数据经过符合法律实务逻辑的标记、分类,能够与第一步分析结果相对应,从而对合同文本进行补充完善、并批注出潜在风险。两项技术结合起来,做的是“回答题”。
从“填空题”到“回答题”,意味着从一对一对的机械回应,到了能够处理没有唯一确定答案的问题——这是智能的迹象。当然,“合同机器人”在作者测试中表现出来的智能还未能做到对文本前后语义的综合理解,审查结果存在识别错误、或者未能识别的要点,与“第一种形态”尚未拉开太大差距——但形态的分化已经出现。
“合同机器人”目前处于内测阶段,作者猜测其后台支撑的数据库可能还没有建立完成,能够“胜任”的合同类型、条款内容有限,经过对测试期间用户上传文档的学习,其智能还有大块提升空间;另外在截图的“检查详情”中,可以看到还有未显示的“参考条款”部分,估计后续还会有进一步的功能完善。
03 规则市场与数据壁垒
“合同机器人”所呈现出来的审查报告,很像是一个杀毒软件的扫描结果。作者猜测其后台也有一个类似于杀毒软件病毒库的“规则库”,作为查找合同中BUG的规则。“合同机器人”先对用户上传的文本进行断句、分词处理,然后通过“规则库”中的风险点进行核对。
其实在律师的脑海中也有一个抽象的“规则库”,律师在审核合同的时候,会调用这个“规则库”对合同条款进行排查,换言之就是律师的“经验”。这些“经验”,一方面来自律师对法律条文的理解,另一方面来自诉讼实践的风险预判;当然律师还会加上对行业、对交易背景的理解。
“合同机器人”的“规则库”,同样遵循这一路径:通过对大量法律法规、法院判决文书数据的学习,积累“经验”,从而能够审核、批注合同文本;至于结合具体行业、交易背景的理解,对机器学习而言缺乏明显边界,研发团队人力难以覆盖。
如果“合同机器人”后台如作者猜测是采用“规则库”的机制来审查合同,那官方可以考虑向用户开放“规则”定制的功能,让用户参与“规则库”的研发、贡献。业内“法天使”的合同数据库就是一个值得学习的模型:官方提供普遍适用的标准格式合同,而由用户贡献个性化的、具有行业背景的合同文书;网页数据采集器“八爪鱼”则是一个更好的范例:提供一个可视化的客户端工具,智能引导用户自定义数据抓取规则,并提供交易规则的市场。
“合同机器人”完全可以借鉴二者的思路:用户上传合同文本后,如果系统有审核不准确、或者审核遗漏的地方(其实就可能是因为后台“规则”对应错误或缺少“规则”),允许用户手动对文本进行增删、批注,并由系统记录这些动作,形成规则文件供用户编辑;如果是系统还未支持的合同类型,则提供一个可视化的界面,帮助用户针对某类具体的业务合同定义一套规则,形成律师个人的“规则库”;结合系统已有的导出修订稿功能,简直就是非诉律师审核业务合同的利器。
同时官方可以建立“规则”交易市场,鼓励用户之间分享规则;当某类个人“规则”的数据大量增加,官方可以通过后台监测,高频使用、交易的“规则”,进一步标准化,并入到官方后台的“规则”数据库中,拓展“合同机器人”的业务覆盖面——这一过程,其实就是在促成律师将专业“经验”形成标准数据。
未来法律技术公司的竞争,更多在于数据。
单纯的互联网技术发展迅速,早晚会超出法律行业的需求,每个思路、每个方案都会有足够的、现成的技术去实现。法律行业从来不缺少数据,但一直缺少符合特定标准、以一定结构组织的数据,这类数据才能够被机器理解、使用,从而完成“法律”与“技术”的融合。所以谁投入更多资源去积累这样标准化、结构化的数据,将来就更有可能形成令对手难以逾越的竞争沟壑。
04 定位与维度
要说法律产品形态,其实不存在高下之分,为了满足不同的场景需求,自然会演化出不同形态;问题的关键在于找到特定场景的需求,并真正去加以解决。
此前“第一种形态”的“法律文书机器人”所提供的“在线法律文书生成”服务在使用场景上,其实存在矛盾的地方,即究竟面向哪类用户?专业律师,更需要的是一个成型文书模版,在模版基础上,进行条款增减、内容表述定制,这个需求“法天使”给出了很好的解决方案;而对于普通用户,在线生成标准版本的文书,无法针对一些个性化的情况,关键条款还是需要依赖律师修改。理论上这类产品,可以面向普通客户,也可以面向律师,但并未最高程度的匹配两者的使用需求。
“合同机器人”则在Slogan中开宗明义:帮助法律人揭示风险、提高效率。产品呈现上,“风险提示”、“参考条款”这些字眼,以及其中的内容描述,都采用了明显专业术语,十分清晰的面向律师端,并将自己放在了辅助者的位置,这也与牛法网本身的市场定位(聚合高端律师,服务高端企业)相呼应。虽说“合同机器人”目前的功能还不尽人意,但是在精准的定位下,更有可能促成法律与技术叠加的聚变反应。
近两年,随着法律行业与互联网技术高密度的碰撞、聚合,有影响力的互联网技术法律产品层出不穷。有的面向基础法律服务需求,让普通人能够以更合理的价格获得更为优质的法律服务;有的则倾向于为律师提供辅助服务,解放律师时间,推动业务升级。它们形成的合力,促使法律服务市场逐渐开始维度分化。
基础法律服务中存在大量可以标准化的业务,人工服务的可替代性极大,是低维度市场,最容易受到法律技术的侵袭;随着法律技术革新,将会有越来越多的法律服务被降到低维度市场,其中的人工服务则难免被更具速度、准度、价格优势的法律技术产品挤压、淘汰。
而懂得利用新技术、拥抱新技术的法律服务从业者,则能够借助这些辅助“机器人”来节省自己机械劳动的时间,将更多精力投入到研发定制化、专业化的法律服务产品,提升专项服务的客户体验、服务质量,进入高端法律服务市场,上升到更高维度,获得更广阔生存空间。
“合同机器人”,无疑是法律服务市场维度分化的又一位推波助澜者。
本文为律新社特约稿件,转载请联系授权。
制图:李瑶 编辑:路小艺
吴皓头条名片