张西恒|生成式人工智能对在线异步审理困境的疏解及限度
一、问题的提出
在线纠纷解决打破了诉讼的时空限制,既解决了当事人因客观原因而无法出庭的困难,又缩短了案件的审理周期。2018年杭州互联网法院发布《涉网案件异步审理规程(试行)》,进一步推动了在线纠纷解决向在线异步审理的跨越,时空对诉讼活动的限制与束缚再次得以突破。但与此同时,异步审理也在实践中暴露了其不足之处,包括:第一,打破了审判中心主义的诉讼模式,造成审判的碎片化和离散化;第二,削弱了审判人员对案件的亲历性,使得法官不能基于直接言词原则审理案件;第三,诉讼参与主体所表达的内容和情绪无法被法官准确获得等。
究其原因,异步审理打破了围绕庭审中心主义所建构的诉讼秩序,但这是实务界基于现实所做出的无奈取舍。在案多人少的窘境下基层法院及其法官团队已左支右绌,当事人也因工作而疲于应付诉讼。加之自然灾害、交通不便或身体健康等原因,过分强调当事人到场同步参与审判着实是强人所难。理论界分析了异步审理的局限性并尝试进行规则建构,典型者如从法社会学的角度论证异步审理的正当性,并以此提出传统的诉讼理论存在进一步完善的空间,同时强调要深化审判与互联网技术的融合;或提出“融合式”异步审理模式,将异步审理作为同步审理的补充和例外,并重点适用于审前准备阶段;或认为应从规则构建入手,通过限制程序的适用范围、明确法官的主导地位、保障当事人的程序选择权以及强化审判公开等方式调和矛盾。
相关研究偏重规则的构建,并未充分重视藉由技术手段改善异步审理的可行性。事实上,生成式人工智能因其可使用自然语言进行沟通、无需人工标注即可自行分析素材、即时生成反馈结果等特点,具有嵌入在线纠纷解决场景的天然优势。不过,令人遗憾的是,目前对生成式人工智能与司法相结合的研究,主要聚焦于其所生成的证据材料的属性、智慧司法建设以及类案裁判普遍化等领域,该技术与具体司法程序相融合的特殊问题尚未得到应有的重视。有鉴于此,本文试图厘清生成式人工智能嵌入异步审理的可行性,揭示二者之间的内在耦合,但同时也指出可能的张力,避免因技术错用导致的巨大风险。
二、在线异步审理的实践困境及其成因
以杭州互联网法院为例,其发布的《涉网案件异步审理规程(试行)》规定,异步审判是法官和诉讼参与主体分别在规定时间内自行登录网络平台以非同步的方式完成诉讼的审判程序。具体程序为“24+24+48+24”模式,即当事人在24小时内互相发问,在该阶段结束后的24小时内,当事人只能回答不能发问,但法官不受该限制且法官认为无需再发问的,可决定直接进入辩论环节。当事人可在48小时内进行辩论,辩论结束后的24小时内,当事人各自完成最后陈述。
与在线同步审理相比,在线异步审理的实质是延长当事人表达和回应的时间。法官和当事人不处于同一虚拟空间,各方通过在线平台以传输文字、图片和视频的方式完成交互。异步审理的非同步化和书面化审理模式与传统诉讼法坚持的直接言词原则相悖,这造成了异步审理在实践上面临的困境。
(一)庭审离散化和碎片化
异步审理与直接言词原则的冲突造成了庭审离散化与碎片化的困境。换言之,庭审中心主义的核心是实现集中审理,其要求当事人集中于特定环境中并当场即时完成陈述和辩论,法官则基于法庭辩论和证据调查形成的心证进行裁判。异步审理既不要求各方处于同一空间内,也不要求当事人即时回应,而且审判程序的各环节之间有较长的时间间隔。因此,异步审理可能导致诉讼的过度拖沓,从而妨碍案件集中审理,导致庭审的离散化和碎片化。具体表现为以下方面:
1.在诉讼环节内允许诉讼活动存在滞后性例如,在法庭调查环节,一方当事人在发问后,对方当事人只需要在规定时间内做出应答即可,无须即时回应。这使得在异步审理的法庭调查环节中,当事人的答复具有滞后性。在实践中,有法官认为异步审理设置了过长的回应时间,这可能引发当事人在审理期间更倾向于采取策略性行动,诸如当事人获得了更充分的时间以准备其措辞和诉讼策略,在刑事案件中甚至可能采取毁灭证据或干扰证人的方式以减轻自身刑事责任,影响裁判的公正性。
2.审判程序的各个环节时间间隔过长在同步审理中,无论线下或是线上,自开庭至退庭的各个环节之间紧密相连。一般一次线下同步庭审平均用时为1—2小时,线上同步庭审平均用时为30分钟。线上异步审理的设计初衷就是考虑到当事人可能无法同步参与诉讼,因而放弃了各环节一气呵成的设计,让当事人可以利用碎片化的时间参与诉讼。以杭州互联网法院为例,其设置的异步审理各环节之间存在24小时至48小时的时间间隔,当事人至多需要4天的时间完成全部审理程序。
(二)审判者对案件亲历性的削弱
司法亲历性包括直接性与在场性两个方面,直接性要求法官全程参与案件的审理流程并亲自查阅案卷,在场性则要求法官当面听取诉讼参与主体的口头陈述、质证、辩论等。法官亲历全部审理流程以形成心证,从而对案件进行裁判。但是,异步审理导致庭审离散化和碎片化后,削弱了法官对案件的在场性。换言之,异步审理虽未改变法官亲自获取诉讼资料的构造,但是其使庭审离散化和碎片化的特征,使法官无法在获取资料的过程中感知当事人的神态、语气、动作和微表情的变化。换言之,在线异步审理削弱了直接言词原则对法官亲历性的保障作用,对诉讼程序的公正性产生了负面影响。
1.一审由开庭审理变为书面审理在线异步审理采取“交互式对话框”的方式,法官和双方当事人通过输入文字、上传图片和视频等形式完成非同步交流。这不同于在线同步审理以摄像头进行远程面对面交流,这种文字、图片和视频的书面交流形式,使一审案件的审理变为了书面审理。司法亲历性要求法官当面听取当事人及其他诉讼参与人的口头陈述。当然,法庭辩论环节可以由法官根据案件的复杂程度决定是否必须进行口头辩论,由于异步审理根据规定仅限于案情简单、标的额小以及当事人数量少的案件,因而该环节通过文本交互的形式进行并不必然降低法官的亲历性。但是,质证环节依据法律规定必须通过口头辩论完成的环节,而在线异步审理对此同样采用了文本交互的方式,这使得一审案件完全变成了书面审理,违反了直接言词原则对法官亲历性的要求,存在不合理性。
2.证人亲自出庭变为提供书面证言由于异步审理全程采用“交互式对话框”的方式进行书面交流,一方当事人申请证人出庭并提供证人证言,证人实际上也是通过对话框提供书面形式的证人证言。然而,我国诉讼法明确规定了证人应当亲自出庭,原则上排除书面证言,而且为了保证证人证言的中立性与客观性,最高人民法院先后在2015年和2019年出台司法解释,规定并细化了证人的具结制度,司法解释强调了证人亲自出庭并当庭接受法官的询问和当事人的对质的义务。因此,证人参加异步审理并以文字、音频或视频的方式陈述证言的,其所做出的证言难以让法官形成心证。
3.法官的诉讼参与感缺失法官被赋予对庭审活动的指挥权的意义在于,一方面,使法官可以主动积极地推动庭审,从而使诉讼程序能被更好地执行,最终实现庭审实质化的目标;另一方面,法官通过指挥诉讼的进程,从而循序渐进地引导当事人就争议焦点着重进行阐释,并且更好地陈述己方意见,促进双方当事人开展高效的法庭辩论。此外,法官的指挥权还体现在其对法庭秩序的维护和对违反法庭秩序的人员施以惩戒,以保障庭审的有序推进。
然而,在异步审理中,由于法官与当事人各自的在线时间并不同步,这致使法官的庭审指挥权实际上很难发挥作用。无论是对当事人的陈述进行释明或纠正,还是对庭审程序的指挥和法庭秩序的维护都存在一定的难度。这也导致法官难以完全进入裁判者的角色,而且庭审在规定时限内不断被开启和打断所导致的庭审碎片化,使法官对案件的参与感大打折扣。
(三)诉讼参与主体的表达失真
在实践中,当事人由微信进入“微法院”小程序,法院在庭审开始前通过“身份信息核校三保险”的方式确认“登录人”身份,即以人脸识别、签字和上传视频的方式校验当事人信息,确保当事人本人出庭应诉。该校验方式可以保证进入庭审“登录人”具有本案当事人的身份,但是在完成登录并进入庭审后,仍然很可能存在下列问题:第一,非当事人本人进行陈述、提问、回答和辩论等;第二,将庭审内容通过截图的方式与案外人进行讨论后,再返回庭审进行发言;第三,当事人在庭审未结束前自行离开,经过一段时间后再次返回。
前述问题的症结在于异步审理因其去仪式性的性质,使诉讼参与主体心理上倾向于自由散漫,而非慑服于法庭庄严肃穆的氛围。这种心态消解了当事人对庭审的重视程度。同时,法官只能通过系统时间戳来判断当事人是否在场,以及进出庭审的时间。至于当事人在屏幕之外实际所处的环境,以及环境对当事人的影响,法官则是一无所知。这就使得外部环境对当事人陈述真实性的扭曲变强且难以得到规制。此外,异步审理中证人作证时是否受到胁迫而做出不实陈述也同样难以被察觉。因此,如证人证言、当事人陈述等言词证据的真实性在异步审理中将受极大的影响。
三、生成式人工智能对在线异步审理困境的疏解
前述问题的根本成因在于在线异步审理突破了庭审对共时性的要求,导致了其自身与直接言词原则在一定程度上相冲突,进而在司法实践中表现为庭审离散化和碎片化、法官亲历性被削弱以及诉讼参与主体表达失真的问题。因而,困境疏解的关键在于如何填补和匡正异步审理突破庭审共时性后产生的制度裂隙。在不改变现有制度的前提下,通过互联网科技手段使异步审理可以在尽可能少的时间内解决当事人之间的纠纷是一个可行的路径。
随着智慧法院建设的不断推进,人工智能、区块链、大数据等互联网前沿技术被越来越多地应用在司法实践中。在此背景下,智慧司法嵌入生成式人工智能只是时间问题,而该技术对司法的介入程度在未来也将逐步深入。在此背景下,探讨生成式人工智能在异步审理中的应用前景实为必要之举。从技术原理角度出发,生成式人工智能将在异步审理中具有广阔的应用前景,其底层逻辑代码的特性使其可兼容和搭载不同的功能模块,以满足异步审理中多元化的现实需求。诸如更直观的证据可视化、更高效的法律文书生成以及更便捷的裁判建议,都将深刻地影响和改变异步审理。
(一)增强司法的可及性
异步审理突破了传统诉讼程序在空间和时间上的限制,其在提升诉讼效率的同时降低了诉讼的成本。在此基础上,异步审理为当事人创造更多的接近司法的机会,从而使当事人的实体权利和诉权更好地为法律所保障。也因此,异步审理是未来司法改革中司法便民的改革方向。将生成式人工智能与异步审理结合以增强其为当事人增加接近正义上的机会是一个可行路径。
1.提供即时便民的专业法律服务生成式人工智能的优势在于其通过自然语言与使用者进行交互,面对使用者所提出的问题均能够通过大数据学习的方式进行回答。以ChatGPT为例,经过深度学习其可针对法律问题给出不亚于专业法律从业人员的回答。这可以满足当事人对价格低廉、及时高效的法律咨询服务的需求。不仅如此,其可以搭载语言翻译模块以满足多语种交流的需要并且其还可以搭载语音输入模块,满足输入文字有困难的使用者的需求,例如文盲、残障人士和阅读障碍症患者等社会弱势群体。此外,基于异步审理足不出户就可进行庭审的特征,可在进行异步审理前,通过ChatGPT的文书生成功能,为有需要的当事人生成并递交法律援助申请。并且,通过ChatGPT的多语种沟通功能,让使用者与在线法律援助律师免除跨语言沟通的障碍。有理由相信,ChatGPT可以让法律服务变得更优质、更高效、更便捷。
2.司法服务智慧化目前,智慧法院已经在全国范围内得到普及。2019年相关调查表明,我国过半数以上的法院支持线上庭审,超过六成的法院支持线上证据交换。案件当事人通过中国执行信息公开网联系法官共超过七万次,法官及时回复率为85.2%。通过技术赋能司法实践,智慧法院实现了为人民群众提供全方位、全天候、零距离、无障碍诉讼服务的目标。在司法服务智慧化的大背景下,将生成式人工智能与异步审理相结合可进一步增强司法服务的便民化,具体为以下方面:首先,应答快速,即生成式人工智能可以即时对当事人所提出的法律问题提供解答,并且为当事人当场提供各类法律文书的模板,由此节省当事人自行在线上诉讼平台查找和下载文书模板的时间和精力;其次,信息完整,即生成式人工智能将碎片化的检索结果进行整理,形成对使用者的提问具有针对性的前后连贯且内容完整的回答;最后,沟通高效,以ChatGPT为例,用户可使用自然语言与生成式人工智能进行交流,通过问答的形式不断将问题明确化和具体化。
(二)提升审理效率
我国智慧司法的建设目标之一是实现裁判的高效化,各地基于此陆续开展人工智能嵌入智慧司法平台的试点工作,例如移动微法院和移动微法庭等。这在一定程度上提升了当事人的使用体验和司法人员的办案效率。目前,各地广泛采用的是判别式人工智能,其优势是对案件数据可进行高效分析,但是无法对个案的裁判提出建议。在异步审理中,其所审理案件具有案件情况清晰、当事人数量少、标的额小以及当事人非同步参与诉讼的特点,需要法官合理利用碎片化时间整理案件证据材料并撰写裁判文书,这为法官带来了大量的重复性文书工作,而生成式人工智能可以在分析数据的基础上,进一步就个案提供个性化建议,并且在异步审理中实时为各方当事人以及法官提供法律建议,极大地简化案件的审理工作,并且提升案件审理效率。
1.更高效的法律文书生成目前,辅助裁判文书撰写的人工智能工具属于判别式人工智能,即需要事先对数据进行标记并归入预设的分类之中,然后通过机器学习输出对已有数据的高精度和高准确性分析结果。目前的技术逻辑及技术路径,如自然语言处理(NLP)、HAN模型以及深度金字塔卷积模型(DPC-NN),能够满足输出符合此种要求的分析结果的任务需求。例如,成立于2014年的LawGeex,其主营业务是人工智能法律文书审阅系统,该系统由美国律师Noory Bechor和人工智能专家Ilan Admon合作开发。2018年成立的上海秘塔网络科技有限公司,其向中文互联网用户提供中英文文本交互的人工智能文书写作辅助服务,该公司的创始人之一也是从业多年的律师。此外,司法实务部门也相当重视AI在提升审判效率上的潜力,不仅欧盟早已开始尝试将人工智能作为撰写裁判文书的辅助工具,而且我国的智慧司法建设中诉讼文书的智能辅助系统也已开始试点。例如2018年北京市高级人民法院推出的“睿法官”系统,其搭载了裁判文书自动生成功能,将提升85%的裁判文书撰写效率,并且将实现90%以上的裁量要素覆盖率。
但是,生成式人工智能是概率式人工智能,即通过对输入数据的学习和训练形成一个概率分布模型,该模型能够对构建模型之后的输入的数据的逻辑结构进行分析,并形成性质相同而内容相异的新数据。两种人工智能工具的差别在于前者只能分析现有数据并生成与基于输入数据的结果,而后者则是可以将输入数据与其学习的数据相结合,产生新的结果。
因此,生成式人工智能可以依据现行有效的法律法规、已生效的裁判文书以及当前审理案件的证据材料,生成相应的裁判文书,具体表现为以下两个方面:第一,完善类案标准和类案推送机制,人工智能通过大数据深度学习,向异步审理的诉讼参与主体推送类案判决和类案标准,辅助律师和当事人根据类案调整诉讼请求和诉讼策略,协助司法人员高效完成诉讼文书的撰写。第二,学习裁判文书的自然语言结构,生成式人工智能可以直接生成裁判文书模板并协助法官完成案件卷宗的整理工作,从而减轻法官在重复性文书上的工作压力。
2.更高效的审判在异步审理之中,各方非同步参与诉讼致使诉讼呈现离散化和碎片化,造成诉讼程序的拖沓和无序,而生成式人工智能实时更新和总结案件审理的进度,通过定时发布当前案件审理的焦点、整理各方提供的证据材料、类案的推送等信息,让各方可以不用来回翻阅庭审记录,节省诉讼参与主体的时间和精力,使每一次发言和辩论都可以高效。并且,辅助法官在庭审结束后整理卷宗材料,为法官提供可行的裁判结果预测信息。法官也可以通过自然语言与生成式人工智能进行对话,以高效收集用以完成裁判的类案信息,最后由生成式人工智能为法官提供制备完成的裁判文书模板,由法官填入关键案件信息并审阅文书内容。例如,2023年1月美国密苏里州哥伦比亚特区的一宗自闭症儿童医疗保险费用支付的案件中,法官使用ChatGPT撰写了案件的判决书。本案中,法官在形成心证后使用ChatGPT生成裁判建议,之后法官在判决书中引用了人工智能生成的意见。此外,印度旁遮普邦和哈里亚纳邦也有法官通过ChatGPT生成了相应的法律建议并作出裁判。
(三)优化诉讼参与主体表述的准确性
诉讼参与主体的表述因为异步审理的离散化和碎片化而易于失真,为保证案件当事人、证人陈述的完整性和真实性,可以通过生成式人工智能推进更直观的证据可视化。证据可视化是指为了使诉讼参与主体更加直观地了解案情或证据材料,通过视频、图像、模型等方式将材料立体呈现在法庭之上。在英美法系,以可视化方式展示的证据被称为“示意证据”或“展示性证据”,其在司法实践中被普遍用于对案件事实的辅助性证明,例如在美国的瑟奇案中,控方通过电脑生成动画(computer-Generated Animation)向法官和陪审团展示案发现场的各类细节。在我国的司法实践中,已有法院更进一步地使用了“出庭示证可视化系统”,即通过VR技术演示被告人作案经过。VR技术区别于传统的视频、模型或幻灯片等方式,使用者通过头戴式播放设备能更直观和更全面地认知相关材料,而生成式人工智能将在VR技术的基础上强化这一体验。生成式人工智能对证据可视化的作用体现于以下方面:
(1)文本生成,即生成式人工智能通过对现有证据材料进行分析,将材料整合为特定格式的文字材料。该功能属于生成式人工智能的初级水准,其可编辑的素材不仅包括当事人上传的文本、图片、视频和音频等,而且对当事人在庭审前和庭审中所进行的陈述和辩论都可作为素材,便于法官了解案情并作出裁判。
(2)图形生成,即通过大数据的训练,生成式人工智能可模仿并生成特定风格的艺术作品,通过输入特定类型的图片材料,如纪实类的摄影作品、写实风格的绘画或者医学类的扫描图片等素材,生成式人工智能快速将庭审中当事人提交的书证、物证、证言等证据材料转化为更加直观立体的可视化素材,并高效生成数据可视化图表,提升证据的证明效果。不仅如此,生成式人工智能低廉的价格可以使绝大多数案件的当事人能够负担相应的费用。
(3)音频、视频生成,即生成式人工智能可搭载智能语音系统,将当事人的口头表述转录为文字并将转录内容与当事人上传的素材结合,通过AI配音或使用当事人原声以生成视频文件,便于诉讼参与主体和司法人员理解证据被用于证明的事实。例如前文提及的瑟奇案中检方所制作动画的工作完全可以交给生成式人工智能完成,并且该段视频不仅可以展示案件发生经过,而且在动画演示的过程中使用AI依事前准备的配音稿对视频进行配音,再结合VR技术可全方位提升证据可视化的体验。
(4)模型生成,即当事人或司法人员可通过生成式人工智能制作出特定的数据模型,以便在庭审中更加直观地让各方了解证据的性质和内容。例如,前文中北京一中院的案例中,公诉方使用VR技术展示的案发现场可以通过生成式人工智能搭配制图模块进行3D建模和渲染。目前,Spline AI、Masterpieces Studio和Mochi等科技企业已经开始提供基于文本的3D场景建模服务。人工智能通过对文本内容的理解绘制图片并生成模型,而且允许用户通过自然语言而非二进制代码来描述所需要构建的模型。
四、生成式人工智能疏解功能的限度
在异步审理中,适用生成式人工智能可消除各方因语言不通、信息不对称以及理解能力差异等因素而产生的不便,以此提升审理的效率、消弭当事人表达失真并增强司法可及性。但是,生成式人工智能并非“万金油”,其在异步审理中的运用也会对司法人员和当事人造成负面影响。首先,生成式人工智能对司法人员的技术奴役,将使司法人员庸化并丧失主体性。其次,技术自身的算法伦理风险也有可能使司法丧失公信力。最后,在异步审理中使用生成式人工智能输入和输出数据的数据安全风险也威胁着当事人的合法权益和国家的数据安全。
因此,在发掘生成式人工智能技术提升异步审理正当性和有效性潜力的同时,应避免陷入“AI浪漫主义”中,谨防将人工智能上升为全知全能的工具的片面认识和盲目崇拜。美国学者Ray Campbella认为:“AI不是一种魔法,它是一种技术,具有所有技术所固有的能力和局限性。”利用生成式人工智能可以矫正异步审理自身问题的同时,也应注意到其存在诸多风险。
(一)技术奴役风险
尽管所有人在一开始都将生成式人工智能视为提升工作效率的新工具,并且否认其将完全替代人的思考活动进而否定人的主体性的可能性,但是,当我们逐渐习惯于某一工具带来的便利性时,技术奴役风险便始终是一个无法回避的问题。目前,生成式人工智能进行决策和判断时依然受制于已输入的数据和语料,换言之,生成式人工智能无法像人类一样进行跳跃性思考,即跳脱出固有的知识范畴进行发散性思考。在面对其所未进行训练的领域时,生成式人工智能仅能提供在逻辑上过得去,但实际上是“一本正经但胡说八道”的答案。然而,当我们的司法人员习惯于生成式人工智能使案件审理的结果变得唾手可得时,习惯的惯性和思维的惰性将使我们越来越难以离开人工智能。这将导致司法人员的思考能力和语言组织能力面临全面衰退的风险,最终彻底扼杀司法人员的创造力,导致人不可避免走向固化或僵化。
如有学者所说:“最优先要问的问题,并不在于AI是否能够产生高度接近,甚至完全相同于人类心灵的能力,或者是否能产制出与人类几乎一模一样的机器人(人造人);而在于人类社会的运作,是否越来越可以透过算法,甚至依赖算法来进行?也就是那些透过算法所无法达致的心灵能力,在人类社会的运作中,是否有可能会越来越不重要?”如果这一担忧变成了现实,那么人进行思考的逻辑将彻底让位于机器的算法运算和概率分析,人的主体性也将彻底消散,最终“人”将彻底迷失和消失在算法之中。
在法律领域,法律从业人员更容易因为使用生成式人工智能而导致思维固化,究其原因,趋利避害是人的天性,当事人希望自己主张得到支持、律师希望自己能够胜诉、败诉方希望减少损失、法官希望降低案件上诉率等现实的需求导致了主体更希望采取稳妥的方式尽最大可能达成目的。因此,基于对风险的厌恶,主体必将采取规避风险的决策。
如前文所述,生成式人工智能可持续不断地学习海量司法实践案例和法学理论研究成果,从而极大地推动并实现类案识别和类案标准的统一,使法官能够做到同案同判、类案类判,使司法具有可预期性和稳定性,满足社会公众对司法正义的期待。但是,同案同判和类案类判只是法官在司法审判中所必须遵守的最低要求,面对终身责任制的压力,法官基于趋利避害的生物本能必然选择与指导性案例保持高度一致。当发生没有“先例”为法官提供指引并需要法官发挥主观能动性时,法官将选择遵循相近的案例进行裁判,因为这是更加稳妥的方式。因此,生成式人工智能将使同案同判变为对法官的绝对强制,即使这一要求没有被明文规定。具体而言,生成式人工智能对司法的影响未来将表现为以下方面:
1.裁判权的让渡一般而言,法官独占并独立行使司法裁判权,但是,生成式人工智能在司法领域的嵌入改变了这一状态。正如前文所述的美国与印度的案例,法官通过与ChatGPT对话来形成对案件的判断并得出裁判意见甚至是最终的裁判结论,这实际上是法官将自己的裁判权部分让渡于人工智能或者说是开发人工智能的企业。虽然生成式人工智能的发展尚未突破技术奇点并获得自我意识,人工智能取代人类法官的场景在短期内也不可能出现,但是人类法官已经开始了将裁判权让渡于生成式人工智能的尝试和实践,其背后的动因是法官面对愈加复杂化的案件以及案件量的急速增加,无论是法官人数还是法官自身素质面对现实压力已经疲于应付。基于提升审判效率以及裁判结果精确化的目的,法官使用生成式人工智能辅助裁判的情况将必然普遍化。
2.裁判逻辑的异化传统上,法官通过司法三段论推出案件的审理结果。在生成式人工智能嵌入司法后,裁判方式转变为法官与人工智能通过自然语言对话协同完成案件裁判。这种以大数据深度学习为基础、对话驱动的人机互动式案件裁判模式,对原有的裁判模式造成了冲击,降低了司法三段论在司法中的作用并且降低了法官的主体作用和主观能动性。
3.裁判依据和说理方式的变化裁判文书说理的合理性、清晰性和充分性对裁判的可接受度有极大的影响。法官在裁判文书中必须对其所作的裁判进行详细的说理,列明所作裁判的法律依据和证据,以证明其裁判结果的正当性与合法性。但是,生成式人工智能嵌入司法之后改变了这一模式,如前文所述的美国和印度的案例中法官引用其与ChatGPT的对话内容作为裁判的直接依据。虽然ChatGPT所提供建议是其通过大数据学习而生成的结果,但是直接引用人工智能的建议作为说理方式,其对于案件当事人和社会公众的可接受度以及对司法权威的保障性,尚需要进一步通过实践进行验证。
(二)算法伦理风险威胁司法公信力
生成式人工智能虽然可在人机之间进行自然语言沟通并展示出其拟人化的特性,但是其本质上仍然是由程序员所编写的代码而构成的程序。换言之,生成式人工智能不可避免地受到其程序设计者和程序员的主观价值影响。如果程序的设计者和程序员将带有偏见的算法内容隐蔽地嵌入至整套算法之中,并使算法所导出的结果自动偏向特定的人群,这将对司法的公信力造成毁灭性的打击。
1.输出虚假内容虽然生成式人工智能以计算机运算生成结果,但是其所生成的结果可能因恶意诱导而输出虚假内容。在异步审理中,这使得当事人可能恶意利用生成式人工智能的漏洞以获取有利于己方的虚假内容,从而妨害司法公正。以ChatGPT为例,自该程序上线以来,就有研究者通过提示注射(Prompt Injection)的方式对ChatGPT进行诱导攻击,使其输出虚假结果。并且,已有黑客成功通过DNA破解方式突破了ChatGPT的反歧视和反仇恨政策,使ChatGPT输出带有种族歧视的结果。这说明对人工智能所设置的伦理规范存在被人为恶意突破的可能性。随着ChatGPT为代表的生成式人工智能在国内外的数量快速增长,而针对生成式人工智能的黑客攻击也将变得普遍和频繁。因此,别有用心者在使用生成式人工智能时就会尝试诱导其输出偏向于自身或诋毁对方的内容,加之司法人员并非全部都是计算机领域的专业人才,这就使得当事人或其代理人采取诱导性策略时难以被发现。最终,生成式人工智能所生成的虚假陈述将对司法的公正性和权威性产生冲击。
2.伦理和价值取向单一OpenAI通过人类反馈对ChatGPT进行训练,力图使生成式人工智能输出的内容能够更加符合人类的价值观。具体而言,通过分组标记的方式将输出内容进行分类,对更加符合人类价值观的内容标记更高的分数,并且设置奖励模型,使人工智能输出符合人类价值观的正向结果。但是,这一操作的问题在于,对于道德、伦理、人性方面的话题人类自身就不能给出能够使所有人都信服的统一标准。人工智能的开发者将自己的道德标准作为人工智能判断所有问题的道德标准,人工智能则将人类的道德标准视为静态的,那么面对动态的社会现实和不断变化的道德标准,生成式人工智能就无法给出具有说服力的论证。在司法实践中,每个案件中当事人对审理结果是否达到了公平正义有着不同的理解标准。生成式人工智能无法理解人类的语言,其只能通过计算语句的概率而生成结果,司法人员过于依赖生成式人工智能的结果就是丧失了对人类朴素感情的感知能力。
3.训练数据存在偏差如前文所述,生成式人工智能可被恶意利用而生成虚假结果,但是,如果用于训练人工智能的数据本身就存在偏差和谬误,那么生成式人工智能就必然导出虚假结果。在异步审理中,假使生成式人工智能用以训练的裁判文书及其他数据本身就存在错判、漏判和误判的情形,那么这就与人工智能辅助司法人员和当事人达成司法的程序正义和实质正义的愿景背道而驰了。
以ChatGPT为例,其使用的训练数据来源于在线数据库,例如网页、电子书籍、维基百科和Github的代码仓库。通过深度学习前述数据,ChatGPT才能够了解各领域的知识,并模仿特定风格的文章进行写作。但问题在于,前述数据的源头并非完全可靠,基于不可靠的数据所训练的人工智能必然会在生成结果时发生错漏。例如,维基百科是由维基媒体基金会运营的一个多语言的线上百科全书,编辑者协作完成词条编写,网站配备巡查员以保障词条内容的严谨性。但是,维基百科的词条的可信度,尤其是非英语的词条的可信度,因存在编辑者胡编乱造而未被网站巡查员发现的情况而受到不少影响。此外,ChatGPT的母公司OpenAI为美国公司,在选择训练的素材时,英语素材往往被优先选择,英语素材在素材库的占比约为46%,其他语种如俄、德、日以及汉语素材的占比均在5%左右浮动。因此,ChatGPT通过英语交互的表现远超于使用其他语言进行交互。语言选择上的偏好就使得生成式人工智能在学习和生成结果时,其结论无法在非高占比或非高数据量的语言领域生成具有说服力的结果。
(三)数据泄露威胁国家数据安全
2023年3月30日,有媒体报道某公司的员工在使用ChatGPT时,输入了公司内部资料,导致资料进入ChatGPT数据库中,造成了严重的数据泄漏。生成式人工智能需要海量数据作为其学习的素材库,但是素材的数据安全风险自始至终都存在于数据运用的全流程之中。在生成式人工智能嵌入司法之后,在异步审理的过程中,司法人员及当事人必然需要通过输入素材以获取人工智能的计算结果,那么在使用过程中所输入的数据必然涉及当事人隐私以及法院内部重要数据,一旦数据发生泄漏,就将造成不可挽回的损失,从而威胁到人民群众的合法权益以及国家机关的数据安全。
1.非法获取数据生成式人工智能可通过主动和被动两种方式构建及更新素材库。其中,被动方式是指人工智能自动将用户输入的信息存入素材库,主动方式是人工智能利用爬虫技术在互联网上主动抓取素材并将素材存入素材库。实际上,两种数据获取方式均存在非法获取数据的问题。
在异步审理中,如果使用生成式人工智能辅助案件审理,那么必然需要上传大量的数据,而涉及当事人个人隐私和法院内部信息的数据为敏感信息,应严格限制甚至禁止人工智能对其收集和存储。如果这些数据被人工智能获取并储存,那么应赋予主体数据删除权。以ChatGPT为例,在其用户协议中写明了对用户数据的收集范围以及用户的数据删除权,但是在用户协议中并未载明行使删除权的具体方法,这就导致了ChatGPT依然可能使用用户的敏感信息进行训练。
此外,在异步审理中,为了保证生成式人工智能生成结果的准确性,需要持续不断地更新和扩充人工智能的素材库,而主动获取数据的方式是最为高效的。但是,非法获取数据的行为将严重威胁国家安全。这是因为人工智能不具备人类的伦理和道德观念,这导致其在不受限制的情况下将无所顾忌地使用爬虫程序,主动获取涉及我国公民个人隐私和国家秘密的数据并将数据传输出境。意大利个人数据保护局(DPA)就因OpenAI非法使用爬虫程序获取用户隐私信息而禁止使用ChatGPT。在我国,数据安全法也对生成式人工智能主动获取数据进行了限制。生成式人工智能通过爬虫程序在我国境内获取数据的,应当遵守我国法律规定,如果通过爬虫程序获取未公开数据或出于非法目的获取数据用于生成式人工智能训练的,构成非法获取数据。因此,生成式人工智能在异步审理中如不受限制地主动或被动收集当事人个人隐私数据和法院内部信息数据,就将对国家的数据安全造成严重的威胁。
2.数据泄露风险虽然目前异步审理的适用案件被限制于标的额小、案件事实清楚的案件,但是该类案件在司法实践中的数量巨大。在未来随着适用异步审理处理案件的数量不断增加,使用生成式人工智能处理案件而生成的数据量也将越来越庞大,而案件数据的存储安全也就愈加重要。以ChatGPT为例,相较于2.0版本的15亿参数量、3.0版本的1750亿参数量,3.5版本的其参数量在迭代至4.0版本后超过100000亿。庞大的数据体量决定了,一旦发生数据泄露事件将造成灾难性的损害后果。但是,训练生成式人工智能必须使用海量数据,这使得生成式人工智能的数据存储安全面临极高的数据泄露风险。
目前,生成式人工智能发生数据泄露的情形主要有隐蔽泄露和系统漏洞泄露两个方面。隐蔽泄露是指chatGPT将其用于训练的数据植入生成结果中并被使用者或被使用者之外的第三人所获悉。例如,在异步审理中,将本案当事人的个人信息、银行账户及密码、证据材料等数据输出至其他正在进行异步审理的案件之中。此外,也存在生成式人工智能将用于训练的卷宗材料,在生成结果中予以呈现。系统漏洞泄露是指生成式人工智能本身可能存在未知的安全漏洞,黑客通过利用系统漏洞对生成式人工智能实施攻击导致数据泄露,例如修改生成结果、删除或修改训练数据以及窃取数据和参数等。
因此,异步审理适用生成式人工智能有可能存在使当事人个人隐私数据、知识产权等被泄露后其合法权益受损,使企业的商业秘密和内部信息被泄露而导致不正当竞争,以及政府数据被泄露后国家的数据安全受到侵害等诸多风险。
结语
在智慧司法的背景下,在线异步审理为诉讼脱离空间和时间的限制提供了具体可行的路径,但是在其诞生之后,也因为与直接言词原则的冲突,在实践中产生了困境。生成式人工智能因与法律行业高度适配的特性,成为解决前述困境的有力工具。将生成式人工智能运用于异步审理会极大地影响公民的实体权利和诉讼权利的实现,以及司法正义在形式和实质上的统一,以ChatGPT为例,其展现了在异步审理场景下辅助司法人员和当事人提升诉讼效率的巨大潜力。然而,生成式人工智能自身的技术风险也对司法正义的实现构成潜在威胁。因此,必须辩证地看待生成式人工智能在异步审理场景的应用,避免为消除问题而制造新的问题的悲剧。我国司法机关应重视生成式人工智能为我国司法所带来的革命性影响,将生成式人工智能纳入智慧司法,采取渐进式的利用路径,可以将其在异步审理中进行试点以验证其有效性,最终逐步推广,以推动我国司法智慧化实现跨越式发展。
往期精彩回顾
李佳 王斌|网络知识产权犯罪刑附民的必要性与正当性——以被害人的损失填补为视角郭轩扬|物格与权利束双重视角下的基因权利保护研究袁秀挺 梁勋|植物新品种权保护范围的界定与扩张——兼评最高人民法院指导案例160号
赵拥军|论数据资源持有权的刑法面相
时明涛|作为新型财产权客体的数据及其法律保护
邵永乐|区块链赋能视角下有追索权保理的法律构造
上海市法学会官网
http://www.sls.org.cn