查看原文
其他

储江:《算法霸权》之自动化决策的结果对个体的行为产生影响

日前,《周泰 · 书声》第九期之《算法霸权》品读会在北京周泰律师事务所举办,现场邀请了中国政法大学数据法治研究院教授张凌寒、中国人民大学法学院副教授郭锐、北京大学法学院长聘副教授戴昕、北京大学法学院副教授胡凌、中国人民公安大学法学院副教授苏宇、北京航空航天大学法学院助理教授赵精武、北京周泰律师事务所高级律师储江、北京大学法学院副教授江溯共同探讨、解读这本《算法霸权》!

本文整理自品读会上品读人储江律师的发言内容,供读者参考。

全文共: 3424字   预计阅读时间: 9分钟 

储江

北京周泰律师事务所高级律师

谢谢江老师,非常容幸能够跟今天在座的所有老师一起分享对于《算法霸权》这本书读后的一点感想。事实上不仅仅是对于学界来说,五年前这本《算法霸权》出版的时候,对于整个产业界来说也是一个比较大的颠覆性的影响。可以看到国内的一些互联网企业其实在这本书出来之后,也尝试在算法公开方面做出一些努力,而且目前国内法规中对于算法可解释性的要求,透明度要求等等一系列的思想来源,都可以认为从这本书出版之后开始的,因此相对来说这本书在行业内业界的影响也是非常大的。

借由本次品读的机会,我也是对这本书做了一个深入的研究,它给我体现出来的第一个感觉就是用丰富的实例,丰富了我对于算法可解释性或者说透明度归置迫切性的认识。因为在过去我个人对于算法可解释性理解还是更多停留在隐私保护,即用户往往不知道自己什么样的一个使用痕迹被算法利用起来进行决策,可能伤害到一些自主决定的权利。但是本书凯西通过各种各样丰富的案例告诉我,其实很多情况下,一些本身带有价值歧视的问题算法模型的存在,往往会导致自动化决策的结果对每一个个体的行为产生影响。在这个基础之上,我个人感觉自动化决策的算法实际带来了第三个层面的不利影响,即它可能会在潜移默化当中重塑每个人的使用行为,而且这种重塑的过程往往是难以察觉到的。

刚才苏宇老师给大家做分享的时候讲到游戏的例子,其实在游戏领域有一个比较典型的自动化决策模型叫ELO排位机制。坦白来讲所有的游戏公司推出这个算法模型,标榜的是为玩家提供了一个公平的环境,玩家基于丰富的游戏技巧的积累,可以在游戏排位当中获得一个比较高的排名。但是事实上,我们在研究游戏公司披露的关于匹配机制算法模型专利的时候,发现其实他们这些算法模型本身的目的并不是为了给玩家创造一个公平的环境,而是为了引诱玩家花更多的时间在游戏上。

很多玩家抱着他是一个公平模型的基础之上去投入大量的时间玩游戏,但是实际这个导致的结果,往往是游戏公司想要的,让玩家更多沉迷在一个游戏当中,所以这个就是我想讲到的,其实算法模型一个有预先的价值设置,往往会重塑消费者,或者重塑网民,重塑用户最终的行为,其实用户理解的使用这项互联网信息服务的目的跟算法模型最终带给他的效果是不一致的,而这种不一致会在潜移默化当中发生,所以在这个意义上去理解《算法霸权》,可能它对于我们整个的消费者结构或者用户的使用行为会有一个更广泛或者说更恶劣的影响,这个我想是我在读完这本书的基础之上有一个整体的感悟。

在凯西的这本书当中,虽然没有直接举这样的例子,但是在一些例子的基础之上做一些广泛的推理也能得出这样的结论,比如说凯西举到了美国职业棒球联赛通过跟踪数据观察每一个选手在每一个阶段更有可能打出什么样的球,来决定或者说预测这个比赛的选项或者说预测观看比赛的球迷在过程当中的消费行为,凯西总结这个模型本身是一个正当的模型,但是如果说放在我们今天整个职业化体育的场域下,如果这样的计算模型被用来预测用户博彩投注的行为,会不会这个模型最后成为助长体育博彩或者赌博等等类似涉嫌违法行为的一个助长呢?所以对于算法模型重塑用户行为的影响,我觉得可能是未来我们在围绕《算法霸权》讨论话题上,可能会逐渐增多的一个话题。

接下来回归到计算模型的本身,其实在过去跟产业界的一些朋友,因为我本身也是有一些开发的背景,所以和一些计算机开发行业朋友的交流,其实往往会讨论到一些关于模型的正义性的问题,一些朋友在交流当中给我一个非常让我震惊的结论,他说其实没有什么问题不是一个算法模型不能解决的,如果他没有解决,那应该就是因为这个模型本身还不够出色,这个在当时给我的震撼是比较大的,但是在当时讨论的环境下我也并没有想出更好的去反驳他的观念的理由,其实这个观点我认为在现在的开发业界是普遍存在的,他们认为数字或者说数学,或者说经济学模型能够解决一切我们面临到的需求,或者说疑问,但是这个问题我在后来做了一些思考的时候,发现其实本身还是存在一些问题。

我就拿最火的人工智能模型来举例,我们知道在四五年前人工智能的模型就已经攻克了围棋,可能当时我们觉得人工智能终结了,至少终结了围棋的玩法,但是可能大家并不知道这个团队在解决了围棋的问题之后,他们下一步去干什么了,其实可以跟大家分享一下,在他们攻克了所有围棋问题之后,他们把目标转向到了第二个,其实刚才苏宇老师分享当中也提到了,对于这种即时战略游戏公关过程当中,但是很遗憾地跟大家分享,经过过去五六年的实践,不管他们在算法迭代,算法模型上做得多优秀,他们计算出来的人工智能算法的模型,仍然不能去击败一个有经验的人类玩家。

所以在这个基础理解之上,刚才苏宇老师提到是因为一个局部信息不对称等导致算法决策模型的缺陷,在我个人的总结来看,我觉得更直观的结论是因为算法模型其实在很多场景下,没有办法去替代人类的经验理性。为什么我会得出这个结论呢?其实我还有另外一个经历,我在为某个客户决策从他们的专利池当中选择一些专利出来针对竞争对手发起诉讼的时候,我们的项目团队律师会自然而然提出一个评分模型,对客户手上持有的所有专利进行一个评估,最后通过这个评分的模型来得出一个结论,选出我们认为最适宜维权的专利。

其实这就是一个把数学模型应用到决策当中一个很简单的例子,只不过我们不是通过自动化算法来实现的,那在这个项目一开始的初衷,我本人也是觉得这样的方式没有问题,但是在后续我们去做专利筛查的过程当中,其实我们发现很多我们想要去评判的因素,是没有办法被量化,或者说没有办法被数学给完美表达的,比如说这个专利能够被证明侵权简易的程度,在某些场景下,它的影响性或者影响因子、数据复制的评分不会那么高,但是在其他一些关联情形下,如果当这个问题和管辖、取证相关联的时候,这个影响因子在这个单独的个例当中又会被拔得特别高。

其实这个项目最后带给我的感受,就是并非所有的东西都能够通过数字化或者说数学模型的方式去统一表达。这也促使我在阅读这本书的过程当中反思我们通过数学模型来解决一些问题,这个方法本身是不是还是存在一定可以协调,或者说重新构思的空间。

回到最后一个部分,就是我们今天大家所有的讨论,最后会落到的落点之上,当然我们面对《算法霸权》时,我们最后的解决之道在哪里,刚才苏宇老师的研究提出一个非常详细的理论模型,其他的老师也提到了在利用算法自动决策的过程当中,基于消费者的选择权,,我也认同这样的观点。我觉得在未来国内企业的算法治理的实践当中,需要做到的两点:

一个是继续遵循当前的算法科技和透明度的道路要求,尽管在大多数场景之下,他们会基于商业秘密保护的要求继续公开算法的全部内容,但其实从我个人的研究来说,因为之前我们研究过一些大长的CDN分发算法,也即自动分发算法专利公开的情况,其实结合一些专利文本的公开,以及企业的自主说明,关于他们所谓的算法模型当中,所有的影响因子、决策因素,可以作为一个在保护商业秘密范围之内的有限公开,我个人认为在实践层面的难度并不是特别大。

第二点就是所谓基于消费者个体的选择权,我觉得当然包括两个层面的因素,第一个层面就是确保消费者能够明知我的哪些数据或者说哪些使用行为被采集到用于提供给模型进行算法决策,第二个就是当我在得知我的这些信息或者说使用行为被记录的情况之下,我有权选择拒绝算法模型给我提供服务,转而由企业提供一种可能更人性化、更人工化的一种服务,当然这个无疑会增加企业提供的成本,毕竟所有的数学模型被利用或者说设计出来的初衷就是为了去提高服务的效率,但是我想在我们现在关于算法进行反思,可能已经到了一定比较深层次阶段的情况之下,考虑到一些替代性的选择,或许是未来整个产业发展的方向。

以上就是我今天的分享。

直播回看方式

微信长按识别上方二维码

回复【算法霸权】即可回看本次精彩直播

欢迎关注周泰,欢迎点“”和“在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存