选粹|王志成:智慧司法中算法公开的尝试
来源
《法理》杂志2020年第6卷第2辑
王志成
山东大学(威海)法学院2018级法学理论硕士研究生。
#
摘要
随着智慧司法建设的推进,算法黑箱问题引发众多关注,公开算法的呼声也日益强烈。其原因在于一方面算法所能发挥的核心作用,另一方面是算法不明或使司法公正蒙上阴影。基于智慧司法的应用与建设现状,算法公开应当考虑到算法成本、产权限制、可读性等因素,这些因素也是检验公开方案的标准。在众多可能的公开对象中,法院或许是相对于政府而言更佳的选择。而公开方式的选择则需要根据智能审判设备在裁判中所扮演的角色而定,低智能类的程序的算法处于成本与效率的考虑,可以进行事后定期的测试;司法设备越智能化则越需要进行事前的审批,固定交付时的算法方案,与欲检测时的算法比对,以此来查验算法。
自人工智能(Artificial Intelligence)的理念与技术被提出以来,虽历经不足百年,沉浮不断,却引发了社会的深刻发展与变革。从最初的图灵测试到现今的类人、类脑功能,人工智能已经部分地从计算机场景中脱离,依托互联网、大数据实现独立运行。无论是简单的人机互动聊天,如Siri、天猫精灵,还是专业性的辅助机器、机器人,如AI医生、AI法官,人工智能已经使各行各业由浅入深的享受着技术红利。人工智能与法学联姻的时间较晚,一开始也只是利用智能技术实现类案的检索与量刑的辅助,但因智能技术类人思维功能的部分实现,催生出了智能法官。我国智慧司法的建设虽起步较晚,但技术在司法领域的应用深度和广度却已经居于全球首位,这可从搜狗公司研发的智能法官、北京法院的“睿法官”、上海法院的“206系统”、杭州的互联网法院等中窥见一斑。
我国学者对于人工智能的研究从20世纪末开始,在数量上,在近三年论文数量上远远超过之前论文总数,这与“智慧法院”成为国家发展战略有关。在内容上,目前学界对于人工智能的研究的大多从部门法的视角出发,研究人工智能法律地位、犯罪问题、作品归属问题等,也有学者跳脱部门法关注其现实应用、其伦理规制等。这些研究都是对具体问题的关切,却缺乏对于该技术内部法律问题——算法的法律规制的探讨。人工智能之所以取得如此辉煌成就,核心之处在于算法的开发与推演(本文语境下的算法,仅为智慧司法机器或设备中运行的算法,非任何领域内的算法)。其作用与研究形成巨大反差。本文将立足于人工智能在现今司法领域内应用的现状与现有认识,在论述算法公开的重要性的基础上,分析可能存在的算法公开中需要考量的因素,尝试提出通过公开算法的可行方案。
一、 缘何执迷于算法公开
正如雅各布·布克哈特指出,“在科学领域内,我们只能精通有限的范围”。由于存在计算机领域的专业性壁垒,法学人很少具备该领域的专业素养,因而也就出现了人工智能理解上的许多难题。但这却丝毫并未减轻法学人对于人工智能问题研究的热情。在论及人工智能在司法领域内所带来的种种便利与效率的同时,大多论文都不忘提出对于算法黑箱的隐忧,但这些论述往往一带而过,鲜有专门论述。为何法学人在不懂算法的情况下,依然会执迷于探头探脑地试图进入计算机领域的“虎穴”,表达通过算法公开破除算法黑箱的强烈愿望?
对这一问题的关切,根源于算法在智慧司法中所发挥的重要功能的认识。法学的思维亦是以概念为基础的思维,始于概念。算法,即“在有限的步骤内求解某一问题的一组规划……它运用公式或代数/逻辑步骤计算或解决一个已知的作业”。“在程序设计中,一个算法包含处理目的、输入输出数据的格式说明、变量的意义及设定、程序的处理过程等。算法兼有文字说明的功能及程序演绎过程”。通俗来说,算法就是一系列指令,例如,如果头疼可由疾病或过度劳累造成,那么我们就应该吃药,可以用下图表示。由于所要处理的问题或对象的不同,算法分为不同的种类,莫衷一是,认知上开放,技术上也在不断发展出新的算法。具体到智慧司法领域,对于智能的工具而言,算法意味着得出结果的过程,不同智能层级的机器或设备搭载运行的算法也并不相同。这些算法本身的特性或处理的对象的不同,决定了其在裁判过程中所扮演的角色不同,因而也在一定程度上影响着最终的公开算法的设计。
有学者指出,智能司法软件中的算法相当于或就是法律。这其实是一种误解。算法并非代码,也并非是程序,用计算机领域的行话来说,算法是解决问题的步骤,而程序是对算法的具体的演绎,在这意义上说,算法是程序的灵魂,程序=算法+程序结构。从某种角度上讲,法律无疑具有算法的属性,这是源于法律的规则的属性。两者虽具有很多的相似之处,但两者的区别是根本性的。从运行过程来看,经当事人口述,输入案件事实,AI法官或智能软件运行自身的算法,得出判决,输出结果,算法在这一过程中本质上是得出结果的过程,即如下图所运行的步骤,难以得出智能设备中内置的算法就是法律这一结论。因而归根结底两者不可简单地画上等号。对智慧司法所应用的技术而言,算法承载着法律,是智慧司法的过程或程序,“法律上有罪或无罪、有罪或无罪归结的效力在于符合了正确的程序。程序的目标是确定真实”。“算法是人工智能的核心”,对于得出最后的司法答案来说,算法对于智慧司法建设的地位不言而喻。
图1 生病吃药简易算法
对通过公开算法而破解算法黑箱的热衷的另一个原因,在于对算法黑箱“黑”的隐忧。黑,相对于“白”,亦即“无法明了”,在实践中表现为:深度学习时大家都知道怎么用,用了之后效果会提升,但无法知晓其原理。在智慧司法机器或软件中,体现为一种不透明,对于结果得出的无从知晓。对这一问题解决的殷切希望是人们对于司法公开、公正的追求在人工智能设备上的反映。黑箱的存在,或会成为污垢存纳之处。一般认为,算法问题会表现为算法歧视、杀熟等不公正对待。算法歧视,通常具有三种来源:(1)算法设计、开发者;(2)数据;(3)深度学习。这里的算法设计、开发者的理解,应当采广义,既包括算法的设计、开发的程序员,也包含算法的设计、开发的商业公司。人本身所具有的不公正的认识与看法,会被带入算法之中,比如性别、财富等方面的偏见。这在国外已经出现了实例。企业所具有的对于经济理性的追求,极有可能在算法中预设于己有利的代码片段,当本公司涉诉时,会予以偏宥。在财富收入、地域等方面,或许会出现一些不公正评判,比如倾向性保护本地域的企业、产业、个人,倾向性保护对于本地经济发展作出重大贡献的纳税大户等等。此外,由于数据喂养的不全面,也可能会出现不公。目前司法领域的智慧设备的深入学习的能力依然较弱,至今未出现具体实例,但随着其学习能力的提高,或许会产生一种机器或技术本身自生的偏见,从而对某些、某类当事人误判。对法院或智能设备来说,案件可能只是今天的业务量或一次算法运行,但对当事人来说,却是权利的维护或减损,正因如此,美国最杰出、最有声望的法官之一伦尼特·汉德才会说“恐惧诉讼甚于死亡和纳税”。拉姆也曾表示,“一份裁定对一个人影响的程度之深是多么可怕啊!他可能宣布一个人是正常人或者是疯子;它可能确认某些特征,或者是将某些特征抹去;它可能让一名囚犯获得自由,或者是将自由变成奴役;它可能延续一名犯人的生涯,或者是结束他的生命。”鉴于司法裁判对于人民权利影响的深刻,加之智慧司法建设的不断推进,以后智能设备将更多的应用于司法审判,因而,对于算法公开的呼声日益高涨,也不难理解。
二、算法公开应当考量的因素
出于算法在智慧司法裁判中所发挥重要作用以及对公正追求的考虑,算法黑箱被法学界备受关注具有合理性。然而,尽管呼声不断,算法公开问题依然未得到实质性解决,不禁令人怀疑,算法公开的实现到底是法学人的职责还是计算机人的使命,这是否只是法学人异想天开的一厢情愿,算法公开是否具有现实的可行性。算法实现由“黑”转“白”,唯一的方式就在于公开并审查所研制的算法。而在现今的产权保护模式、技术发展状况以及社会发展阶段等情形下,实现算法公开,应当将以下因素纳入考量范围。
(一)成本
由于专业性的限制,法院所使用的智能设备,皆来自商业公司。市场经济下的公司,具有追逐经济利益的直接理性,服务的根本目的在于获取经济利益。计算机领域内的商业公司,盈利的能力取决于自身的研发能力。算法公开的成本,不仅包括算法起初研发、维护的成本,还包括公开算法后失去的市场、先发市场优势等可得利益,更重要的或许是专业市场内技术话语权的丧失。如果公开的对象、公开方式不当,将使得技术公司这些成本沉没。
一个运行良好的程序,其研发过程可分为设计、编码以及测试,核心就在于算法的编写。算法是由代码组成的,算法的实现依赖于代码的创造性组合。现代生活的日益复杂,增加了代码编写的难度,编写代码就相当于将行为数字化、序列化、编码化,储存在芯片中,当下达相应的指令时,内部算法运行,从而完成相应的操作。而这一看似简单的对应的过程,需要耗费程序员巨大的心血。今年上半年报道出来的程序员“996ICU”工作时间制度,着实让人惊叹程序员工作的艰辛,也可以看出如BAT类互联网公司取得巨大成功的背后是程序员的努力。据不完全统计,华为公司源代码竟达1000多亿行;这数量庞大的代码也耗费了公司巨大的成本。算法的基本要求之一就是运行确切、可行,因而商业公司在算法上的投入不仅包括编写算法的成本,还保护算法维护的成本。像华为拥有如此海量的算法库,内部的监管就是一个很大的问题。尽管现今有相应的软件开发以及辅助设计软件,但总有一些算法出现的问题仍然是这些软件检测不出来的,那时的维护则需要投入许多人力、物力。这也是当今是世界尽管技术发展已经十分迅捷的情况下,手机、电脑的操作系统的数量寥寥无几的原因。
如果直接要求商业公司公开自己历经数十年、耗费公司巨大投入编写的算法,则意味着其他公司可以在不需要任何投入的情况下获得运行良好的算法,这不仅有违市场经济的精神,而且无疑是对原初研发公司的巨大打击,同时也是对创新的抑制。我国现有的产权制度无法很好的提供保护公开算法的公司的方式,即使是专门保护创新的专利制度,也还是需要在公示期内予以公示,仍会导致泄露。因而商业公司大多会采取商业秘密的方式寻求保护。而且可以通过此种方式,获取授权使用费,维护自己在市场中的优势地位,同时取得在此基础上进一步开发更高级别设备的优势。
因而,大多商业研发公司出于上述考量,总会决定不公开自己编写的算法,除非商业公司遭到被逼迫。拥有算法产权的商业公司的拒绝或缺乏公开的意愿,就使得算法黑箱的破除变成了法学者的一厢情愿,这种不愿算法公开的态度,是公开算法必须解决的难题之一。
(二)产权
智慧司法中算法公开所涉及的产权因素,较为复杂,内在的牵涉着算法的真正产权者、产权者的公开意愿等问题。算法本身所具有的专业性质、符号形式、非实体性,使得算法的产权界定、侵权界定存在一定的困难,冲击着现今我国的知识产权保护体系。
虽然目前智能司法软件或设备所应用的算法,大多来源于计算机领域,并不具有全新的司法原创性,例如实现马尔科夫链、NLP的算法,但是这并不影响目前专利法对于智能司法软件公司算法的保护。根据目前我国的专利法的规定,在不存在抵触申请的情况下,符合自然科学规律的、对原有内容创新的以及可重复推演的技术性方案即可申请专利。因而,尽管依赖较多的普遍的计算机领域或统计学、数学中的算法,但专门为解决司法裁判活动所设计的创新性技术方案依然可以申请专利或作为商业秘密。
商业公司对于算法公开的冷淡,是出于其对于商业利益的考虑,而司法的公正、公开的价值则不在商业公司考量的范围。既然商业公司不愿公开,是否可以依赖法院公开自己所拥有的智能机器、软件的算法?寄希望于法院公开“睿法官”、“206系统”等的算法,需要首先考察法院是否有公开的决定权,这就取决于法院对于这些智能司法设备产权的拥有限度。
如上所述,法院拥有的是对于法学领域的人才,缺乏计算机领域的专才,同时法院的公利属性以及预算的限制,这也就决定了法院现今所拥有的智能司法裁判类的软件与机器都是采取委托商业公司开发或与商业公司合作开发的形式。根据相应的法律规定,法院能否公开自己的司法软件或设备的算法,取决于双方委托协议中的对于算法产权的规定。如若双方立有约定,则按双方约定划分算法产权归属。如若双方没有这方面的权属规定,则需要根据双方合作的形式——委托开发或合作开发——而定权属。
如果法院与商业公司协议约定了算法的产权归属,则按双方的协议内容,有算法权属的一方则有权决定是否公开。此时若算法的权属归法院,则法院有权公开。反之,法院无权决定公开与否。
如果双方的协议内容缺乏算法权属的的约定,情形则需分别讨论。假如双方采取委托开发的方式,法院委托商业公司开发设计AI法官或智能系统,法院拥有的只是使用权,算法的产权理当归属商业公司。如果双方采取的合作开发的方式,情形则较为复杂,一般表现为商业公司与法院合作,商业公司提供技术支撑,法院提供法律人才、法律案例以及司法技术等等。产权的归属应当按照归属原则,如果权属可以分离,则各取所应得,无争议,此时算法依旧属于商业公司。而如果不可分离,则为两者共有。公开属于对于共有物的使用,法院如欲公开,也必须取得对方的同意。
智慧司法的关键之处在于智能的辅助,这种辅助是建基于计算机科学、数学、统计学之上,依托海量司法数据,这也就决定了智慧司法离不开大量的计算机、数学和统计学的支持,典型的表现就在于算法。算法的产权保护模式,取决于商业公司所选择的是专利还是商业秘密模式。对其侵权的界定,需要依据权利要求书来判断。但算法本身的特性以及原初保护方案决定了其侵权判断的复杂。例如,A公司在权利要求书中限定的算法为S=Mx+Ny,B公司采用S=Mx,这就不构成侵权,但是如果权利要求书中只写用上述算法,未限定参数,则对方可能侵权。且存在一些基础算法步骤时,很难厘清是否侵权,在多大程度上侵权。
综上,法院在协议约定算法产权时拥有完全的公开决定权,在共同开发的情形下拥有半决定权(不完整的决定权),其他情形下,法院只是拥有智能司法设备中的算法的使用权,故依赖法院公开算法有些不切实际。退一步讲,假如法院为了实现司法公正,不惜花重金购买算法的产权,能否实现算法的公开?这要取决于商业公司是否愿意出售以及法院是否拥有此项预算。对于商业公司而言,这无异于杀鸡取卵,对于家徒四壁的法院来说则有些心有余力不足。
影响商业公司公开算法的原因多种多样。或许有对于自家算法的先进性的考量,也有部分公司觉得自家智能司法软件或设备所搭载运行的算法在专业技术领域并不高深,是大家心知肚明的秘密。
产权因素是影响算法最终能否公开的一个重要因素,但基于现今的智慧程度、智能化水平现实下,不得不看到目前有些智能软件开发公司不愿意公开智慧司法的算法的原因,并非由于其本身的算法方案技术的优越性而带来的产权考虑,而是反而认为其算法方案本身的“简单”,大多是计算机领域类专业算法在司法领域内的“简单”套用。对其而言,这些算法不值得公开,因为圈内人皆知晓。无疑,这是一部分现实。现今的智慧司法处于智能的低端层次,更多的却是人工的辅助,无法实现高层次的智能替代。然而,计算机领域的发展不可小觑,计算能力的提升,智能程度的加强,司法的深层驱动,这些因素都会导致智能司法的算法在未来更成为一种司法专业的“创新性编排”,更进入到产权规制的行列。因而,技术的进展及其与司法耦合的程度的提升将迫使智能公司更多的考虑产权因素。
(三)可读性
算法公开应当考虑算法的可读性,而算法的可读性更多的涉及算法的反编译(De-compile或De-compilation)。编译与反编译是正、逆过程。编译的本质是人的语言转化为机器语言,让机器识别;反编译的本质则正好相反,是让机器语言被人所能读懂,其工作原理可用下图表示。
图2 反编译过程
智慧司法过程中的反编译可能面临着区分代码和数据、处理间接跳转和间接调用指令、自修改代码以及编译器和链接器包含的子过程等难题。智慧司法软件的精准性更多地依靠海量数据的喂养,因而区分数据与代码可能是反向编译的一大难题。受冯·诺依曼结构的制约,大部分的计算机使用的数据和代码是存储在同一段内存空间之中。间接跳转和间接调用的分析所面对的问题是目标地址的确定。自修改代码是程序在运行的过程中改变指令的程序代码,其编写十分困难。在智能司法软件的编写过程中,不得不链接进来很多其他过程指令,这也对反向编译带来困难。这些都是在反向编译的过程中不得不面对的技术上的难题,但这并非是无法解决的。利用相关的技术可以在一定程度上解决或缓解这些难题,但要想完全实现算法黑箱的破解,现今的技术与认知程度仍然无法达到。
上述的反向编译的技术外的难题,一方面体现为算法读取上的困难。一般而言,算法是机器或设备运行的核心元素,所以一般商业公司会将算法予以隐藏,这既有商业利益的考虑,也有对于不当公开的担忧,算法加密也不新鲜。例如,实践中应用的智能司法机器人,其本身的智能算法既有云端的终端操作端,也有设备本身的芯片上的内置方案,既可联网使用,也可脱线存储信息。而此类设备上的算法即使拆解机器,得到的也只是沉寂的芯片,无法破解器本身物理或逻辑加密的方案。因而,其算法的公开,只能依赖商业公司的配合。
另一方面,算法可读性也表现在专业技术上的壁垒。司法领域内的算法,既有计算机算法的专业限制,也有法学上修辞的阻碍。算法,究其本质不过是代码的运行过程,是对杂乱代码的编译。借助于逻辑语句“IF”、“AND/OR”、“COMMAND”命令符、“0”、“1”等,融洽的得出唯一的答案,可读性便因此而下降。加之,法律上的术语的抽象性,使得本来就已经繁复的算法语句难上加难。
三、智慧司法的算法公开方案设计
通过上述的分析可以发现,算法公开并非是法学人的“多管闲事”,其实现本质上是如何设计算法公开方案的问题,属于法学探讨的范围。无论是成本难题还是产权的难题,亦或是诸如专业壁垒的障碍,都是在设计公开方案时不得不考虑、解决的问题,这也是检验所设计出的方案的标准。
公开算法的方案,这一设计包括公开对象以及公开方式这两个主要方面,核心在于解决好公开对象的问题。在现今法律法规缺乏明确规定的情况下,设计出这一解决方案必须能够保护好研发公司的商业利益,服从现有产权制度下,考虑法院的预算,实现司法公正。
(一)公开对象
确定适当的公开对象是解决上述难题的关键,因为只有这样,才能让算法公开的范围限于有效监管的范围,这样达到监管的目的同时不致于泄露商业公司的机密,保护其产权的。正如上所述,按照我国目前的产权保护规定,无论智能司法软件或设备所运行的算法多么高深或多么基础,都是解决司法领域内问题的创新性技术方案,值得保护。确定公开的对象,本质就在于将算法控制在应当知晓的对象中。这样做的核心目的在于监管,同时也可以保护商业公司的技术秘密,维护其利益或“自尊”。根据司法所涉及的对象,可能存在以下几种公开的对象。
方案1:向社会公开
亦即所有人都可以查看该公司的算法,并进行监督。这种公开是最大程度上的公开。这样做无异于在现今的情况下直接让算法公司对外公布其算法,却没有任何对其补偿或产权保护措施,类似于欧盟现今逼迫谷歌公司公布其搜索排名算法。
要求谷歌公布算法的新闻发生在2015年,至今谷歌公司依旧未公开其排名算法。对于谷歌来说,公布其排名算法,无异于向全世界宣布其如何实现先进技术的方式,这将给其他公司赶超谷歌公司的提供了一个方法,因为,其他公司完全可以在不需要任何成本投入的前提下复制这一算法库,并在此基础上开发出更佳的算法,超越谷歌公司。这也是谷歌公司5年以来均未予回应欧盟这一要求的考量。谷歌公司宁愿放弃其在欧盟的市场,也不愿交出自己的制胜法宝。
这一方案最大的优点在于可以最大限度实现司法公正,使得所有人都可以监督智慧司法过程中所使用的设备,从而实现公正。但弊端之一就在于这样规定,无异于在劝退所有的智能司法软件或机器,或者起码使司法领域的智能技术停滞不前。如上所述,编写代码、维护代码的良性运行,对于商业公司来说,不仅涉及其以往巨大的成本投入,而且将涉及其未来所有可能依赖算法所得收益,直接命令其公布,是对其利益的剥夺,也是对现今产权制度的推翻,这无异于强盗。这样的规定是不符合法治精神的。此外,根据“禁止溯及既往”的原则,这样的规定约束的只能是未来的公司,现今研发出智能司法软件的公司便可幸免于难,这将使得以后没有公司愿意研发智能司法软件,劝退所有的潜在研发公司或正在研发的公司。这无异于用法律为其开辟出一条垄断的合法道路。
退一步讲,即使得到了商业公司的同意,这一最大化的公开方式的弊端之二就在于这种公开,无疑将引发各种破解版智能司法软件或设备,这并非杞人忧天。现实的例子就是手机系统中的安卓系统。安卓系统开发完成之后,安卓系统的创始公司就将其源代码向全社会予以开放。开放的后果就是各种破解版软件、垃圾信息、病毒蜂拥而至,对用户形成巨大的困扰。如果AI法官的算法开放,那么肯定会出现AI法官破解版软件或系统,一方面这将降低司法的权威性,用户随时随地都可以戏弄。这还是次要的。最大的危害将在于如果利用这种软件或技术实现犯罪的引导,搜索可能的规避司法的途径,成为犯罪者的“圣经”。例如,经常可见安卓系统中的QQ音乐破解版、爱奇艺破解版等软件,实现不付费便能收听、观看会员资源。
向全社会公开算法的另一个弊端就在于此种公开缺乏相应的价值与意义。因为算法因其本身所具有的专业性,并非所有人都可以看得懂,尤其在我国多样的文化背景构成国家中。而且司法领域的算法,又加上了司法中的相应符号、信息,使得智能司法设备中的算法更令人难以明晰其涵义。就连法学人都无法审查算法,普通人根本就看不懂,更别提对其进行监管了。例如,如果不是专攻编程、设计程序的人,即使很久之前安卓系统就已经开源,我们根本就不会去看安卓系统的代码,即使我们每天都在使用手机。这样的公开便不具有实质意义,其本质上是对专业人士开源。
综上,这种最大的向全社会公布算法的方案,不具有可行性。
方案2:向同行公布
向同行公布,是将范围限缩在同一行业领域内的人士。值得追问的是此时的同行是那一领域的人士?司法领域内的智能设备中运行的算法,同行业的人士应当为计算机领域人士,因为法学所能给予这些设备的只是法律法规、案例数据,这些都是起到数据的功用,对算法无实质影响,法律法规早已公布,计算机领域的人士也可以方便的查阅法律法规,并将其内置于算法,而且如上所述,算法的产权基本在于算法公司。法学人也看不懂算法,无异于方案1中的群众。因而,此处的同行的适当涵义是计算机领域。
这一方案其实与方案1类似,本质上相同,只是公布的范围予以适当的缩减。因而,可能具有的优势、弊端并无不同,只是程度上的强弱而已,不再赘述。
方案3:向政府公开
向政府公开,亦即将算法提交给政府相关部门审查。这一方案目前得到的支持比较多。这一方案认为,政府是有效监管算法滥用、算法歧视的主体,只有政府才是保护市场和权利的可靠主体。
政府审查算法的优势在于,政府有财力的支撑,可以招募专业人士,居中对科技公司所使用的算法进行审查,其审查不具有上述两种方案的弊端,却可以具备上述两种方案的优势。如休谟所提出的“节俭原则”,我们具有遵从既定权威的天然的惰性,政府在审查方面的优势增添了其具有的安全感与权威感。但笔者认为,政府并不是最佳的公开的对象。
第一,对政府公开,政府如欲审查这些智能司法领域的算法,必须招募专业人才,此时政府必须购买计算机领域、法学领域的人才资源。两类人才的招募,对政府来说,也是一笔巨大的财政支出,如若有更好的公开方案设计,则这种方案是对纳税人的一种不负责任。
第二,在未来智慧司法逐渐登上司法舞台的情形下,由政府审查算法意味着政府接管司法,这与权力预设的结构不相符合。行政权与司法权是并行不悖的两项权力,从分权理论提出以来,裁判权与行政权就处于分离的状态。从我国宪法规定的现行组织架构来看,行政权也是与司法权分庭抗礼,如果由行政机关审查智能司法的算法规则,从某种意义上讲,是对现有架构的违反,违背了司法独立的原则。
第三,政府的自利性使得政府是否就是最佳的监管主体是值得怀疑的。从人类历史中看,人类对于政府的建设与依赖,经历了大政府(全能型政府)到小政府(有限政府)的转变历程,这其中夹杂着对于行政权力的畏惧与忧虑。不仅政府具有“自利性”,而且政府中工作的人员也具有一定的自利性。正如孟德斯鸠指出,“每个有权力的人都趋于滥用权力,而且还趋于把权力用至极限,这是一条万古不易的经验”。在利益的驱动下,难以保证商业公司通过种种方式向政府内人员寻租。卢梭也指出,“在行政官身上,我们发现有三种本质不同的意志。首先是他个人固有的意志;这种意志倾向于维护他个人的利益”,这种个别的意志居于其它意志首位。此外,如果选择算法向政府公开,公开的不仅仅是算法,政府审查的时候,必然会涉及算法运行中的数据库、数据资料,一方面,政府将掌握大量的关于个人、企业等的相关信息,信息就是资源与财富,政府可以利用这些信息,成为现代的“利维坦”。另一方面,政府在从事民事行为时或者行政行为时,也会成为诉讼主体,由政府审查这些规则,在未来AI法官裁判下,政府成为了最后裁判规则的评判者,这对于另一方诉讼主体来说不公正。对政府审查算法的不信任,本质上是对行政权力的不信任。
方案四:向法院公开
向法院公开,意味着法院可以获取其在智慧司法建设过程中所购买或所应用的智能机器人、软件、系统的算法。这一方案虽然鲜有人提出,但却是所有方案中最为可行、安全、最能保护科技公司利益以及实现司法公正的一种方案。原因在于:
第一,法院是法律制度的卫护者,是公正的化身。将算法交由法院,法院既不会复制其代码,模仿创造出其同类竞争产品、设备,侵犯其知识产权;也不会因为寻租泄露其代码,损害其经济利益。相反,法院还可以尽最大程度保护这些公司。如果所有智慧司法软件的算法都交由法院,这也可以避免一些恶性竞争的出现,因为法院是裁判者,对于知识产权制度非常熟悉,这对那些想抄袭的公司来说是一个警示。而且,法院是司法的裁判者,不会如政府般过多地涉入诉讼活动中,成为被诉主体。这也就决定了裁判结果的公正性。此外,交由法院审查,也不会破坏现有的组织架构,不会打破司法权与行政权并行的格局。
第二,法院有专业的法学人才,这是政府所不具备的内在优势。这一方案可能存在的质疑正如上所述,法学人不懂科技。法院审查算法确实存在这一劣势,但这一劣势却是相对于方案3来说的优势。因为在向政府公开算法的情形下,政府想要审查,必须求助计算机领域的精专人才和法学专家,而向法院公开的方案下,法院审查只需要另外聘用计算机专家即可,这样也可以节省预算。不将公开、审查权交由计算机同行第三方,原因在于相较于法院,第三方公司毕竟也是公司,其公正程度、保密度皆不如法院。
第三,无论是将算法向政府公开还是向法院公开,两者都缺乏专业技术人才的支持。因而,既然可以由政府购买人才支持,也可以将这种购买服务交给法院。法院本身对于技术上的贫乏,既不会艳羡技术公司的高新科技,也不会鄙夷那些虽在同行眼中基础而无新意的算法。
综上所述,这四种方案皆是对于公开算法的一种尝试,各有千秋。但利用上述的衡量标准,可以发现,在所有这些方案中,法院可能是最好的公开审查的主体,这是基于法院本身的司法主体地位决定的。向政府公开,由其审查并不是不具优势或不可行,但相较而言,其优势并不突出,所以尽管存在对政府的信任偏向,也应在种种利弊衡量下舍弃此种方案。
(二)公开方式
在算法公开的尝试方案中,最为关键的在于确定公开的对象,在其确定了之后,便可以根据这一主体选择何种公开的方式。在知识背景的束缚下,尽管没有最佳的算法算法公开的主体,但妥协折中下的更佳的监管主体为法院。公开方式的确定,则需要首先进一步明确哪些司法领域的算法需要向法院公开。是否所有的智慧司法应用的软件或机器设备的算法皆需公开?其实不然。根据智慧司法应用的智能化程度,可以发现司法实践中所应用的软件或设备有:(1)物理辅助类,如智能输入、语音识别、证据上传取证软件;(2)低级智能软件或设备,如量刑辅助设备、法律服务咨询程序;(3)高级智能裁判软件或设备,如AI法官。由于第一类物理辅助与能力延伸类的软件或设备,在司法过程中所能发挥的功用对于整个司法活动过程与结果的公正意义无大,加之其算法基本都是技术领域的通用算法,而且对其检测可以直接通过程序的运行,便可得出结论。因而将其公开的意义不大,也就无需在继续探讨其公开方式,故将其排除以下讨论行列。对于第二、第三类的算法的公开,则需要分别考察。
由于智慧司法的提倡,智能设备无时无刻都在运转,因而也是法院每运转一次智能设备进行辅助审判,实际上就是在检验算法的准确性。因而,无论是第二类还是第三类软件或设备,算法检验的最好的方式就是运行算法。法官可以通过比对智慧审判下设备运转的结果与自己裁判的结果的符合度,实现结果偏理性的检验。此时的检验方式是不需要调用算法库的,通过程序本身的运行实现外部检验。但这也是一种结果检验的方式,通常对于算法来说作用不大,因为算法的属性之一就在于其运行结果的准确性、唯一性,无论经过多长时间,只要算法没有发生变化,吞吐记忆的数据库增大,结果的准确性就会提升。因而有必要要求商业公司以一种专门的方式公开其算法。
公开的方式,根据交付法院使用的时间节点,可以分为事前和事后公开两种方案。两种方案的选择应当根据智能司法设备在法院审判时所发挥的功用而区别对待。如果该智能设备为上述的第二类软件或设备,仅仅作为智能咨询类、量刑辅助类设备使用,则因其所发挥的功用相对较小,而可以选择事后择一时间公开的方式。具体公开的时间则视法院发现智能机器设备出现问题或者设置一固定时间要求技术公司公开。
而对于诸如智能化程度较高的综合的案件审理类的设备,即上述第三类,如上海的“206”系统、重庆法院的智能审判平台、AI法官,因其可能直接决定案件的结果,在审判过程中发挥的功用较大,则需要在交付法院使用的时候同时向法院提交其算法方案。此时,法院就应当对技术公司所公布的方案进行审查、固定,如无问题可以使用。然而,即使是这类设备,也不需要耗费法院巨大财力随时审查,因为一方面设备经常在使用中,已经是对设备的检验,故也无需耗费投入进行算法的检验和审查。
此外,仍应注意的是,由于算法所具有的高度的技术性与专业性,商业公司一方面既会因算法日常代码的维护,另一方面也因故障的检测与系统升级的需要,而即使是在交付法院使用之后,依然拥有着进入算法库的无限后台权。因而,这就带来了算法的可变动性。算法公司拥有此类无限进入权,随时都可以修改算法,而且可以利用专业技术隐藏修改的足迹,即使随时随地向法院公开,法院也防不胜防。此外,由于算法本身的自修改性,也会自行产生新的运行指令,导致其算法本身就是处于变动之中。因而,无论是在智慧司法中发挥辅助作用的咨询、文书审阅类的功用较小的软件,还是高度智能的智能审判应用,都需要进行交付法院使用时的算法库或算法方案的固定,也即每一次发生重大变动,如系统升级,就需要进行一次相应的算法固定。当发现或出现问题时,法院只需要截取固定期限或发现问题时欲审查时的算法方案,比对其与使用之前固定的算法方案不同之处,重点审查两份方案有无不当修改之处,即可确保其公正,这可最大化的节省法院审查的难度、精力,也可充分照顾技术公司的相应权益。
一套智慧司法设备或软件,所运行的算法不止一个。通俗的说,平时手机所安装的微信软件,尽管我们在手机应用商店中看到的只是个总的安装包,但是其内部却有着很多实现不同功能的算法方案,司法领域的设备或软件亦如此。因而,这不禁让人追问,是否所有的智能司法软件中的所有的算法都需要公开,因为有时有的算法的改变有时连程序员都无法解释其变动的缘由,甚或是对于一些算法其本身所具有的相关性、因果性等无法准确衡量?例如,现今智慧司法软件或设备所共用的所使用神经网络的算法,其算法的可解释性较弱。笔者的建议是所有的算法都予以公开,无论其由于本身的技术特征多么专业以致于最后公开时依然可读性较低,或者公开的价值并不高。因为一方面,其可读性虽然影响其审查的可能性,进而致使其公开的价值不大,但只有公开才有可能进行审查,或者也可以起到一定的威慑作用,或者起到可以让法院、当事人放心使用的作用。另一方面,虽然对于那些不可解释的算法,目前尚不具备审查的条件,但随着技术的发展、认知的进步,算法的可理解性无疑将逐步提升,届时,即使是对于此类算法,其审查也会具有一定的现实性与可行性。“司法眼里容不得半点沙子”,也不应该有半点沙子。“解决人工智能系统的不可理解性(intelligibility)的一种方案是增加系统的技术透明(technical transparency)。比如将人工智能系统的源代码开放”。英国政府也提出,“对于人工智能问题的一个解决方案就是增强可理解性”,这需要“人工智能代码或算法的可访问”。此外,换个角度思考,在合理完善的公开制度下,商业公司向法院公布自己的算法,尽管这些算法现今的技术上的解释性较低,但公司本身并无任何的损失,而法院才可以在技术可能性的前提下在某一时间审查这些算法,这本身至少对任何一方来说都没有损失。
四、结语:回到算法
在智慧司法建设过程中,算法是一颗闪闪发光的螺丝钉,其在智能司法裁判中所将发挥的价值,令我们不得不重新考虑回归智能裁判本身,思考AI审判时的对于算法的法律规制。人工智能与部门法结合中产生的问题,已经引起了学者的大量探讨,但智慧司法本身的算法问题,却问津稀少,这是与其在智慧司法建设中所扮演的角色不相匹配的,有必要进一步探讨与研究智慧司法中算法的现实规制。无论是算法的公开透明,还是最终意义上的打开智能的“黑匣子”,所需要的不单单是技术上的发展与突破,或许更多的是司法与技术的联姻,多管齐下、多方治理下的协同防治。算法规制的起点,也是规制过程中的重要一环,就是如何选择公开方案的问题,而最后方案的设计不仅需要立基于现今智慧司法所应用的智能软件或设备的现实,也要具备一些超前性,不能仅仅因为现在技术上的困难或无法实现,而失去对其构思的勇气。
本文的相对局限性在于更多的出于审查算法的目的,仅选取的是算法的公开这一形式性的要求,并未过多涉足算法领域的解释与算法歧视等等问题。解释与审查只有在公开方案确定之后才可以继续进行。通过聘用相关相应领域的高端人才,按照公平公正的原则以及相应的计算机领域的技术标准进行排查,可以在一定程度上反向解码算法。
算法并不是一个简单的问题。认真对待智慧司法中的算法,需要的不仅仅是监管,更多的是在考虑商业公司利益的前提下,通过与商业公司的商谈,以及对于程序员的伦理教导与约束,实现司法过程中的多向“共赢”。
▼ 法理杂志往期选粹 ▼
R E V I E W
《法理——法哲学、法学方法论与人工智能》杂志最新稿约
选粹 |《法理》2021年第7卷第2辑精彩抢先看!
选粹 |《法理》2021年第7卷第1辑精彩抢先看!
选粹 |《法理》2020年第6卷第2辑精彩抢先看!
选粹 |《法理》2020年第6卷第1辑精彩抢先看!
选粹 | 第五卷1.2辑文章集锦(拉至阮文底部)
选粹 | 劳拉•纳德 著 王伟臣 译:法律的人类学研究
选粹 | 游进发:人格权之民法结构
李晓辉 译:人格权的比较法概观
高天书 译 刘沫茹 校:作为范畴的人格
选粹 | 孙子豪:从非占有的自由走向具体的平等
选粹 | 姜兴智:人工智能时代部门法哲学研究的“形”与“魂”
选粹 | 赵鑫 译:向上定价压力评注——假阳性的可能性
选粹 | 张苏平:指导性案例适用范围的目的性限缩
选粹 | 孙嘉奇:如何解决影响型难办案件
选粹 | 蒋毅 季红明 译:方法论基础II:法律实践、解释方法、法律的情境
选粹 | 徐舒浩 译 张峰铭 校:哈特的表达主义与他的边沁工程
选粹 | 陈航:行政性垄断中经营者损失的赔偿问题研究
选粹 | 王鹏翔、张永健:经济分析与法学方法(上)
选粹 | 王鹏翔、张永健:经济分析与法学方法(中)
选粹 | 王鹏翔、张永健:经济分析与法学方法(下)
选粹 | 安东尼•吉登斯 著 肖瑛 译:风险与责任
选粹 | 尼基尔 克里斯托夫 著 王婧 译:责任、秩序伦理和集体能动性
选粹 | 杨海舟:社会主义中国语境下的专政与紧急状态
选粹|托马斯·奥莱科夫斯基 著、吴国邦 译:凯尔森与梅克尔著作中的法律位阶理论
选粹|斯坦利·L. 鲍尔森 著 孙嘉奇 译:纯粹性命题
选粹|亨利·帕肯 著 朱赫夫 译:人工智能与法律、逻辑和论证型式
欢迎关注法理杂志
选粹|思享|域外|写作|学界
赐稿邮箱|ratiojuriswechat@126.com
☜法理杂志官方“有赞”书籍商铺 | 扫码选好书
文字编辑 | 林淑萍 吴少华