人工智能时代来了,法官不再重要?恰恰相反【斑斓 · AI】
作者 | 李则立(上海高院法官,文章仅代表个人观点)
人工智能火了,这把火烧进了法律圈。有人惊呼法官就将不重要了,也有人付之一笑,不过是好大喜功的噱头,又一次法律“自动售货机”的幻觉。
对于人工智能来说,2016年可能属狗,有一只“狗”横空出世,阿尔法狗。阿尔法狗三度出击,一次战胜欧洲围棋冠军,二次战胜李世石,人类围棋冠军,三次出击更加凶猛,化名master“血洗”几乎所有人类围棋冠军,60:0,中日韩无一幸免,阿尔法狗成了名副其实的大师狗。大师狗让“人工智能”前所未有地深入人心。人类竞相感慨,未来已来。虽然柯洁还将代表人类最后出征,但结果怕是没太多悬念,唯能寄望的只剩下“上帝之手”。
文科生聚集的法院大院里,对法律科技的关注恐怕前所未有。法律科技市场更加热烈,一款产品,倘若不绑定“人工智能”,几乎就成了落后生产力。“人工智能”从“爆红”到快要“烂大街”了。人工智能指日可待?人,真的不再重要了?
1. 机器代替法官?为时过早!
我们自然不能对第四次科技革命浪潮视而不见。如今的机器比之过去,厉害之处在于“深度学习”。深度学习基于神经网络算法,模拟人脑的神经突触网络。就好像一个孩子学习认知“杯子”,你给他看大量杯子和不是杯子的物件,一开始他可能只是瞎猜,但每次你都告诉他正确答案,时间长了他就越来越准确。你可能并没有告诉他“杯子”的经典定义,但他就是知道,那个就是杯子。
倘若真的开发出法律机器人,那么机器的“深度学习”就是通过这个原理,你只要告诉它足够多的经过标识的例子,然后告诉机器这次对了,系统的“神经突触”就会增强,这回错了,就减弱。大数据“喂”给机器,机器自己就学会判断了。比如大师狗基于谷歌多重深度学习算法,但这些算法如何构建出通向胜利的棋局,却是大师狗自己的事,怎么做到的?程序员也不知道。
但是,科学家认为,这也可能是神经网络系统目前存在的问题,知道“该怎么”,不知道“是什么”和“为什么”,机器没有理解能力,没有理解能力很难产生新的认知。有人将人工智能分为强人工智能和弱人工智能。在综合认知的强人工智能领域,机器目前还很弱。而在规则封闭的弱人工智能领域,机器很强。围棋虽然被认为是最复杂的人类游戏,但仍然属于封闭系统,规则固定。
万维纲在“得到”开设的“精英日课”专栏中分析说,柯洁跟大师狗比赛,倘若将围棋棋盘从19×19改为21×21,让我们看看谁厉害。机器只知道“该怎么”,而人类能把“该怎么”、“是什么”、“为什么”通盘考虑。法律恰恰是个带有开放性的社会科学领域,特别是在社会转型,产生新的价值冲突时,价值判断、复杂决策问题就需要人类从三个维度来综合考虑。
因此,至少在很长一段时期内机器代替法官是不可能的事。至于将来如何?谁也不知道。也可能如尤瓦尔·赫拉利在《未来简史》所说,生物不过也是个算法而已,算法以硅基的人还是以碳基的机器来表现并没有什么差别。硅谷著名未来学家雷·库兹韦尔则预言,2030年人工智能将超越人脑,2045年奇点出现。但也许并没有那么容易。至少目前来看,那属于值得仰望的“星辰大海”,不是现下的“脚踏实地”。即使乐观如雷·库兹韦尔,也至少还要几十年吧。这个时候就大谈人工智能指日可待,那可能连乐观也谈不上,基本属于妄语了。号称机器人即将代替法官的,只能用两个字来评价:扯淡!
何况雷·库兹韦尔谈的是大势,人工智能可能在各个行业逐个突破,各个行业之间的情况也大有不同。特别对于法律业来说,“大航海之路”才刚刚启航。比如谷歌的无人车之所以能够上路,是以谷歌街景项目的数据积累为基础的,全球谷歌街景“扫过街”的道路上,目标大小、颜色,道路宽窄、交通状况已经有了非常详细的数据积累,这样无人车只要加入实时路况的数据就能做到安全驾驶。倘若无人车的设计像以往那样按照人开车“眼观六路、耳听八方”的方式从头开始,根本不可能实现。而对于法律业来讲,基础的数据积累都没有完成,目前最大的数据可能就是公开的判决书了,审判流程数据的采集尚在进展中,律师段的数据与法院也没有打通,离开发出“人工智能”的机器人,还差的远呢!
2. 机器的角色定位在于“智能辅助”
但同时,我们也必须承认,这是机器人崛起的时代。如今的机器已经截然不同于几十年前计算机刚刚兴起时的机器了。语音识别、机器翻译、机器自动撰写文本、无人车等相继突破,蓬勃发展。第四次科技革命的影响必然渗透到社会方方面面。机器已经如此厉害,定不会在法律业的发展中无所作为。如果非说法律领域可以任尔东西南北风,我自岿然不动,那只能沦为“鸵鸟”了。
法律毕竟是规则之治,特别是在如道路交通、劳动法等规则相对封闭的领域里,机器可以大有作为。比如部分受到IBM认知计算机Watson支撑的法律检索AI产品ROSS等已经引起了广泛的关注。
既不能全靠机器,又不能缺了机器。机器的角色其实很清楚——智能辅助。
机器的定位意味着什么?意味着未来的发展之路,得与机器一起走。
首先,对法院来说,这可能是中国司法“弯道超车”的机会,英国、荷兰等发达国家近年来的司法改革都瞄准了法律互联网的发展,从公开的资料看,中国法院在硬件设施、数据采集等方面在这波浪潮之中并不落后,反而在很多方面已经探出一个身位。
法律大数据和人工智能必然是中国司法“弯道超车”实现跨越式发展的重要变量。而且,机器崛起的进程也可能很快。雷·库兹韦尔总结人类社会加速发展规律,称之为加速回报定律(law of Accelerating Returns),意思是说人类的历史发展速度不是线性,而是指数性的,类似于摩尔定律,如果按照这个速度,他说整个20世纪100年的进步,2000年之后只需要14年就可以达成,那么2014年之后只需要7年就又相当于过了100年。
当然,这样的说法没有精确的科学测算,但与我们对变化感受相当契合,想想10年前苹果手机刚刚出现,而我们还普遍用着诺基亚和摩托罗拉。科技日新月异,时代急速狂奔。窗口期或许并不长,不紧紧抓住,可能错失良机。
其次,对于法院内的个体而言,只有与机器合作,才能解放自己,跟上时代。正如财新主编王烁在他《机器人崛起时代的生存策略》的文章里所说,“没有什么能保证机器不会最终获得意识,但那一天还早得很,先不管它。机器崛起带来的主要问题不是人与机器的竞争,而是人与人通过机器的竞争。”竞争的差异可能不是会不会被机器替代的问题,而在于是不是带着机器一块“玩”的问题,人机配合与人的差距将可能是巨大的,还可能越拉越大。
3. 机器智能的发展数据是关键,而数据由人创造
但是,特别在这个时候,我们最不能忽略的恰恰是人。
“人工智能”,没有“人工”,何来“智能”?人工智能的实现取决于三大要素:数据、算法、计算力。三大要素当中,数据重要?还是计算力重要?还是算法重要?从实现人工智能的结果来说,都重要。没有算法,人工智能无从谈起,而没有大数据和计算力的大幅提升,人工智能也只能在“无人车”走几百米,机器翻译不过拼凑单词意思这样的低水平。但是对于某个行业来说,分析要素可以帮助我们抓住重点。
——计算力属于“客观因素”。计算机硬件技术至今按照摩尔定律迅猛发展。云技术、量子计算等还在不断取得新的突破,但这项因素主要取决于计算机领域的科技发展,基本属于“硬件”,我们无法左右。
——算法不是关键一票。其实神经网络理论早就提出,现今的深度学习算法脱胎于1980年代的神经网络,当然,也取得了进步,但人工智能的发展并不是因为算法的突破。
吴军在《智能时代》里分析,“机器学习并不是什么新鲜事,今天广泛使用的机器学习算法,比如人工神经网络算法、最大墒模型、逻辑自回归等,早在40年前就已经成熟了。”“人工智能的核心算法几十年来基本上没有变过。”,“AlphaGo在具体的算法上和深蓝略有差异,但是它们的博弈的原理是相同的”。“人们从直觉上一般会认为不断改进的方法才是好的,应该采用的,但是在工程上却不然,像Google大脑这样试图解决各种问题的大数据机器学习工具,实现起来工作量巨大,一旦实现,就希望能够使用很长时间,因此算法需要稳定,不能三天两头改。”
更何况,算法是开源的,未来算法的壁垒会越来越低。那么,我们可以得出一个大致的结论,其实目前很难指望通过算法的突飞猛进来实现法律人工智能,如果有人说自己算法特别牛,能通过算法解决智能问题,那他至少使用了夸张的修辞。
——数据为王。三大要素之中,数据可能是某个行业机器智能突破的决定性变量。吴军在《智能时代》里指出,人工智能的发展主要因为大数据的发展,变智能问题为数据问题。但所谓“大数据”,并不是“大”就好,这个“大”,英文里是“big”,不是“large”,也不是“huge”。“big”,是抽象概念,相对于可能出现黑天鹅的“小”数据而言,不是指规模和体量。一堆杂乱无章的数据是毫无用处的。有用的数据有什么特点?规整,有特征,专业化、标准化程度比较高。围棋就是如此,属于封闭系统,数据比较规整。凡是能做到这些的领域,人工智能就能获得巨大突破。
4. 法律大数据和人工智能绕不开人的专业化、职业化
法律大数据的规整、标准化取决于创造数据的人类,专业化水平越高,数据质量越高。目前为止,法院是矛盾纠纷的终端,法官是裁判的创造者,法院的管理水平、信息化水平、法官的专业水平、辅助人员的协作水平决定了法律大数据的“成色”。当然,做法律大数据的朋友告诉我,法律大数据和人工智能的发展还需要全行业的共同努力。
真正有用的数据是“海量的、准确的、标注过的数据”,特别是标注数据,其实是个工程浩大的基础工作。比如裁判文书,机器没有自然语言理解能力,需要专业法律人对文书进行解构,以便让机器能够识别其中的专业术语。但至少应该清楚一点,这些数据可都是人创造的!
假若设计一个虚拟实验:A地区和B地区比拼AI下围棋,都使用最先进的云计算技术,算法也一样,唯一的不同是屏蔽信息流通,也就是说A地区只能使用A地区的围棋数据,不能使用B地区和其他地区的数据。然后各通过机器深度学习训练出一只A狗和一只B狗,两狗对战谁会赢?这显然取决于A地区和B地区的数据,而这些数据来自两地区的棋手产生的数据质量,倘若A地区里都是“臭棋篓子”,B地区则正好大师聚居,这样训练出来的AI棋手哪个更厉害?不言而喻。跟“臭棋篓子”玩还是“臭棋篓子”,人工智能站在人类智慧的肩膀之上,没有人的智能,不会产生机器“智能”。
法律大数据不也是如此么?倘若没有“高手”训练机器,没有好数据“喂”机器,机器如何成长出“智能”?可以这么说,倘若全国法院来个机器智能比赛,哪里的法院管理水平高,法官专业化水平高,辅助人员协同水平高,机器的智能化水平就高。
挖掘数据正如“淘金”,沙子越多,含金量越低,挖出金子越不容易。倘若我们的判决书全是什么“人生如梦……”,“一别两宽,各生欢喜”,机器算是瞎了。数据中的沙子太多,用专业术语来说就是“噪声”太大,信噪比(Signal Noise Ratio)低,真正有用的信息就会淹没在噪声当中,降噪成本将变得很高。那时还能指望机器来判案么?
因此,人的专业化、职业化是实现“智慧法院”不可超越的一个阶段。在法律人工智能星辰大海的航道上,人的作用相当重要,他们除了是数据的创造者,还是数据的处理者、翻译者,与机器的连接者。
正如首席大法官周强所言,司法改革和信息化建设是车之两轮,鸟之两翼!
倘若法律人工智能真的有一天实现,那么它更可能是循着专业的法官生产更好的数据,法律科技用更好的数据挖掘更有用的信息,创造出更好的智能辅助产品,人机配合,产生更加专业的法官,并生产出更高水准的司法产品,也就是更好的数据。如此循环往复,螺旋上升。
可见,要赶上智能时代这趟列车,我们需要从数据入手,而数据的创造者、翻译者、连接者才是可以依靠的对象,因此,“智能辅助”的开发应当以法官的需求为导向,让法官深度参与,为法官提供真正的帮助。
因此,我们愿意相信智能时代来了,但毛主席的话还没有过时,至少在法院,人还是最可宝贵的。
感谢您阅读“法影斑斓”,希望它能兼顾新知与审美。如果您觉得图文有点儿意思,请点击右上角按钮,选择“查看公共号”,再点击关注即可。也可搜索微信号:funnylaw1978。如果想阅读过往文章,可点击“查看历史消息”。
何 帆 出品