查看原文
其他

张凌寒:新书前言|算法:从数学到黑箱

数字法治 数字法治 2022-12-01

新书速递

张凌寒 著

上海人民出版社2021年版


作者简介

张凌寒

法学博士,北京科技大学副教授,康奈尔大学访问学者。本硕博均毕业于吉林大学法学院,北京航空航天大学法学院博士后。中国法学会互联网与信息法学会理事,中国婚姻法学会理事。主持国家社科基金、教育部、司法部、中国法学会等多项科研项目,在算法治理领域发表多篇法学核心期刊论文,并多次被《人大报刊复印资料》全文转载。


前言

算法:从数学到黑箱


究竟何为算法?这是算法规制理论研究的起点。从数学意义上说,算法是通过各种步骤得到计算成果的方程式;从生产意义上说,算法是收集处理数据、挖掘数据价值的生产工具,也是人工智能时代平台的架构和运行方式;从社会意义上说,算法成为了支配数据流动的权力。而由于算法的不透明性,算法被作为决策的“黑箱”而受到诟病。


一、数学意义上的算法

Algorithm (算法)一词源于阿拉伯数学家al-Khwarizmi 的名字。从数学的角度来定义算法,是通过一系列步骤,用输入的数据得到输出的结果。现代算法的应用以计算机为载体,以二进制为运算机制,发展出了排序算法、傅立叶算法、哈希算法等,被广泛应用于排序、匹配、加密等多种途径。算法看似是艰深的数学概念,实际上在计算机科学家看来,通过一系列步骤,用输入的数据得到输出的结果就是算法的本质。从这个意义上来说,一份祖传的食谱,一项招生政策,甚至人早上起床后决定穿什么出门的思维过程,都是具备了输入、输出、明确性、有限性和有效性要素的算法。


算法主宰了数据的收集、处理和输出的全生命周期。因此,算法的相关法律制度在立法中常以“数据处理活动”存在,如有立法文件中将数据“处理”定义为“从数据生成和提取到实际数据的存储和转换的整个动作序列”。数据处理方法都遵循IPO (输入,处理,输出)模型——数据作为输入进入系统,进行处理,然后将其保留为输出。处理过程是将一个过程指定为一系列不同的处理步骤的操作处理序列,目的是通过对数据输入的连续转换来获得所需的结果。换句话说,IPO 系统中的任何数据处理都基于某种算法。为了通过处理数据来解决特定的问题,不仅必须正确地实现算法,而且还必须有效地使用该算法。算法的运算结果与算法设计、算法部署及应用有关。实际上,“算法”经常被与专家系统、代码、软件程序等词同义混用。无论如何评价“算法”一词在现代计算机科学中的重要性都不为过。


二、生产意义上的算法

数字经济背景下,数据作为生产要素参与分配,算法就是收集处理数据,挖掘数据价值的生产工具。算法变得重要的根本原因是数据成为了社会生产要素,而算法决定了数据的价值。


平台类型的演进实质是算法技术的演进。无论何种类型的平台,掌握的算法越先进,就越能在数字经济的时代取得和巩固竞争优势。例如,2006 年美国视频平台Netflix 推出了百万美元大奖,奖励打败原有个性化推荐算法的队伍,后因此取得长足发展。这使得算法是平台“竞争必备工具”的理念深入人心。同时算法也可以维护平台巨头企业的商业优势。例如谷歌新闻以算法自动化推荐代替人工编辑,由于新闻领域舆情更新频率极高,要求算法不断累计数据重建架构,谷歌为此投入了大量基础设施,价值高达数十亿美元,使得其他平台企业无力与之抗争。字节跳动公司的崛起也普遍被认为是头条和抖音的推荐算法取得了竞争的成功。


平台是数字经济时代最重要的社会生产组织,而算法深入到平台业态的技术逻辑层面。除了平台提供的底层计算力量、云计算服务等底层技术服务,以及支付、物流等有较多的硬件设施和人类工作参与的服务(实际上依靠算法进行资源分配与计算),其他多个技术层次本质上都是算法这一生产工具不同的应用形式。具体包括以下几种:


第一,平台的架构是算法。算法作为平台自动化运行默认基础架构也可被称作“商业模式”,其本质上是平台通过算法架构设定的,链接资源的方式。早在莱斯格的《代码2.0 》一书和桑斯坦的《助推》一书中就指出,代码(算法)搭建了网络空间架构,建构和引导了用户行为。在数据经济的时代,大规模、自动化地从数据主体身上提取数据流的平台架构与算法,发挥着生产资料加工厂的作用。通过用户画像和用户行为预测,自动化处理从人身上提取的数据流。平台发挥着信息时代精炼厂的作用,将这些数据流转化为最适合工业规模开发的形式。淘宝、脸书、美团等智能互联网时代的平台,均通过算法搭建的架构形成调配社会经济资源的多边市场。用户通过知情同意进入到平台系统,平台由此获得了算法自动运行的合法性。


第二,应用程序也是算法,被模块化组装到平台上,并用技术来塑造用户习惯与价值观。这些以应用模块为形态的算法可表现为平台新闻推荐算法、用户信用评分机制等多种形式,可被随时搭载于平台,也可被随时卸载。以脸书与抖音等社交媒体为例,其可通过算法根据网络信息的兴趣标签、质量标签等以及用户的阅读习惯、浏览记录等,抽象出标签化的文章模型和用户模型,并经过排序、分类、关联和过滤,自动筛选出有效信息,进行长期、短期等多种模式的用户画像。微信即以小程序的方式搭载第三方多种算法应用程序。


第三,平台的规则和纠纷解决机制也是算法。平台内部规约、对用户的评分机制,以及对商家与用户的纠纷解决机制的流程,都是算法。尤其值得注意的是,用户在维权的时候经常被告知这是算法的自动运行的结果,而没有更改的权利。平台算法控制力因素往往被用户的自主选择或知情同意修辞所遮蔽,同时用户一旦进入智能平台的服务架构,就放弃了自己对于自身数据、隐私和虚拟物品的真正控制力,成为了被平台算法计算和分配的资源。


第四,意识形态是算法对网络信息内容推送的结果。算法推荐的基础价值在于海量信息的甄选,核心价值在于内容的精准分发,关键价值在于观点的洞悉反馈,终极价值在于意识形态的强化和引导。算法集合用户的数据为用户画像,为用户贴上高度精炼的标签。算法将筛选过的信息精准推送至用户,满足个性化需求,使得“千人千面”的信息传递模式成为现实。同时,算法收集用户接收定制信息后的行为数据,勾勒出用户媒介消费行为的图谱,对用户进行更为系统、全面的参数分析,重组已有知识架构以优化自身性能。无论社会共识是否达成,公众都在潜移默化的过程中参与了议题讨论、重塑了社会认知。算法成为了塑造意识形态的新路径、新手段,并更为直接、便捷、高效。


三、社会意义上的算法

算法通过对数据的占有、处理与结果输出,演化为资源、商品、财产、中介甚至社会建构力量。在人工智能时代,数据同时具有自然属性和社会属性,这表现为数据既是算法计算和运行的对象,又是社会利益的载体。有学者将数据承载的信息视为社会权力的基础,认为一方主体通过占有信息并控制另一方主体获取信息的渠道和程度,同样可以构成前者的权力来源。算法已经嵌入了社会运行的诸多层次,在新闻议程、金融、司法审判、行政部门等领域发挥广泛作用。


算法决定新闻可见性,主导了网络上的新闻议程。社交媒体庞大的用户基数和高度的用户黏性,使得其通过算法治理平台成为一种必然选择。算法通过选取新闻、把关新闻、定向推送新闻等控制了社交媒体的新闻生态。正如有学者指出:“用户生成的平台上的内容规模和与人类节制相关的成本是算法流程吸引平台的原因。然而,考虑到这些平台所发挥的关键功能,算法还会带来新的复杂性。”算法的滥用可能导致用户权利和公共利益受到严重损害,甚至成为谋利的工具。


算法应用于司法审判部门,开始主宰人的自由权利,并引导司法权力的行使。2016 年,美国的“卢米斯诉威斯康星州”(Wisconsin v. Loomis )案引发了广泛关注,卢米斯认为法院使用的COMPAS 量刑算法对其进行了种族歧视。从20 世纪90 年代起,算法即已逐步开始应用于域外的司法实践。算法技术对司法实践的作用可分为三个层次:支持、取代和颠覆。就算法在司法实践中的应用而言,算法技术正在逐步超越提供技术支持的影响,开始取代法官判案等司法活动,甚至以独特的方式对司法活动产生更深的影响。


算法嵌入行政活动,不仅大大提高了行政效率,更通过预测型算法来决定行政资源的配置。自20 世纪50 年代起,自动化决策即开始被应用于政府的公共行政。数字政府的兴起依赖算法自动化决策的技术,开展行政检查、行政裁量、甚至行政处罚活动,以预测调配资源的方式,嵌入了政府的行政治理中。自动化决策带来了效率优化、流程简化等实益,却给传统行政活动带来改变与风险。传统的决策约束程序如通知、公告、评论、参与、回避、异议、救济等旨在避免决策武断和恣意、保证决策可信和正当的制度架构,在算法决策面前均显失灵。治理层面尚未探索出一套行之有效的机制,建立治理层面的技术信任。


算法主要通过两个步骤层次对社会和个人产生影响:第一层是算法设计,指设计者编写算法决策代码,并输入数据使算法自主学习,优化决策流程的行为;第二层是算法部署应用,指网络平台等企业在其平台之上部署应用算法的行为。这两个层次可能合而为一,也可能分离。例如,电商平台既设计算法也部署和应用算法,通过个性化推荐算法为用户推荐商品,两个层次合而为一。又如,科技企业设计算法(如门诊系统),医院部署应用算法,通过两个分离的步骤层次提高医院门诊的效率。第一层的设计者和第二层的部署应用者对算法都具有较高的控制力,能够预测算法决策结果并作出算法决策的解释。相应地,法律对于算法造成的不利法律后果,评价对象为人在算法的开发或部署行为中是否存在过错,以确定算法开发者或部署者的法律责任。


当今的智能算法已经从单纯的技术化“工具”逐步升级为不透明的复杂自主性体系,并通过嵌入社会权力结构发挥作用。因此,算法的合理规制必然要求对智能算法的地位与本质予以深入理解,并警惕算法被滥用造成的风险,以应对算法对公民权利、政治权力体系等造成的冲击。


目录

序一 

序二 

前言  算法:从数学到黑箱 


第一章  算法规制的溯源与演进 

  • 第一节  互联网1.0 时代将算法作为普通技术  

  • 第二节  互联网2.0 时代将算法作为中立的技术

  • 第三节  平台时代算法工具化规制下的平台责任扩张


第二章  算法权力的兴起与异化

  • 第一节  人工智能时代算法的演进 

  • 第二节  算法权力的兴起与基础 

  • 第三节  算法权力的异化风险 


第三章  算法权力治理的制度框架

  • 第一节  算法权力规制的基本思路

  • 第二节  算法权力的规制框架

  • 第三节  算法权力的流程监管 


第四章  搜索引擎自动补足算法的损害及规制

  • 第一节  搜索引擎算法损害责任的认定路径

  • 第二节  不同的法律地位理论与政策利益权衡

  • 第三节  搜索引擎作为基于算法的信息发布者

  • 第四节  规制的进路:责任的框架与考量的因素


第五章  社交媒体内容的算法治理

  • 第一节  现有社交媒体的算法监管

  • 第二节  社交媒体治理的价值取向转向与角色转化

  • 第三节  公共利益原则下社交媒体治理的制度设计与调整

  • 第四节  公共利益原则下的社交媒体算法治理


第六章  算法嵌入行政活动的正当程序控制

  • 第一节  算法治理嵌入行政活动的双重效应

  • 第二节  算法自动化决策与行政正当程序的冲突 

  • 第三节  基于行政信息公开原则增强算法透明度

  • 第四节  基于公众参与原则进行算法影响评估

  • 第五节  基于说明理由规则创设算法解释权


第七章  司法活动中的算法应用规制

  • 第一节  算法在域外司法实践中的应用现状

  • 第二节  算法在司法实践中存在的问题

  • 第三节  域外司法实践中算法应用的启示


第八章  平台监管的算法问责制

  • 第一节  主观过错认定机制缺失下的平台监管困境

  • 第二节  平台问责原理:主客观相一致的算法责任

  • 第三节  平台算法问责路径:平台的主观过错认定机制


第九章  《电子商务法》中的算法责任及其完善

  • 第一节  《电子商务法》中的平台算法责任条款

  • 第二节  《电子商务法》平台算法责任的进步与局限

  • 第三节  平台算法责任的改进与适用完善


第十章  算法解释权制度

  • 第一节  算法规制既有法律资源之不敷

  • 第二节  算法解释权的确立及其理论正当性

  • 第三节  算法解释权的制度设计

  • 第四节  算法解释权的制度功能定位

  • 第五节  作为政府监管工具的算法解释制度


第十一章  算法决策与人的主体性

  • 第一节  不受算法决策自由的法理意蕴

  • 第二节  不受算法决策自由的制度样本剖析

  • 第三节  不受算法决策自由的制度构建

  • 第四节  人工智能时代的人


第十二章  域外算法规制的制度与实践

  • 第一节  欧美的算法规制研究概述

  • 第二节  算法规制的具体制度

  • 第三节  算法规制的世界趋势展望


 相关阅读 ·


1.张凌寒:平台算法问责制及其完善

2.张凌寒:数据生产论下的平台数据安全保障义务

微信号 : DigitalLaw_ECUPL

探寻数字法治逻辑

展望数字正义图景

数字法治战略合作伙伴:理财魔方

北京市竞天公诚律师事务所上海分所


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存