观点 | 陈玲 孙晋 薛澜:算法公平与算法治理的国际经验与中国探索
观
点
“算法公平与算法治理在中国呈现“1+N+1”政策体系这一现实格局”。
近日,清华大学文科资深教授、公管学院学术委员会主任、苏世民书院院长、CIDEG学术委员会联席主席薛澜,清华大学公共管理学院副教授、CIDEG主任陈玲,瑞士日内瓦国际关系及发展高等学院全球治理中心助理研究员、CIDEG特邀观察员孙晋在财新《中国改革》 2022年第3期上发表文章,“清华大学CIDEG”特将全文转载如下,以飨读者。
文章全文
中国正进入全场景人工智能算法时代。人工智能算法既被广泛应用于线上消费场景,也被大规模用于日常生活的方方面面。在日常生活方面,在私人部门,每天人工智能算法形成了超过2600万单出行推荐;在公共部门,人工智能算法广泛参与交通信号、地铁班次、路灯照明和交通系统运维管理。
但与此同时,大规模应用的出行商旅领域,也成为较早暴发算法应用争议的“重灾区”,引发了“算法公平”的社会大讨论,进而对算法治理秩序的完善提上日程。
时代需要算法公平
围绕着“算法公平”的代表性争议案例,是出行商旅领域“大数据杀熟”。《人民法院报》2021年7月13日公开的中国“大数据杀熟”第一案中,携程平台有违公平,将挂牌价1377.63元的商旅商品以2889元高价出售给享受8.5折优惠价的钻石贵宾客户。最终,法院判决携程赔付差价,支付3倍差价作为赔偿金,并要求携程修改“服务协议”和“隐私政策”,去除对用户非必要信息采集和使用的相关内容,修订版本需经法院审定同意。
这一司法案例典型体现了互联网平台基于用户数据,对于同样的产品或服务,部分老用户看到的价格反而比新用户价格或线下零售价格高出许多的“价格歧视”行为。以“大数据杀熟”为代表的算法不公平,核心在于算法平台可根据消费者的消费记录和消费偏好,推算出具体消费者在具体时间场景下的价格敏感程度,进而按照平台收益最大化,刻意漠视甚至有意侵犯消费者的福利,滥用算法推荐,向消费者推送更贵的选择。
作为这种“算法不公平”的反义词,算法公平从一开始就有了自然法的公平意味。制定以算法公平为基础的人工智能算法治理基础性原则,就迅速被提上各级立法议程。
不同部门对算法公平有三种不同的理解:第一种将算法公平视为算法推荐商从事服务活动的过程公平;第二种将算法公平视为算法推荐使用者不得侵害消费者公平权益的结果公平;第三种将算法公平视为对个人信息或个人数据的延伸保护而赋予个人可以拒绝信息数据处理者的起点公平。对算法公平的不同理解大致对应了《互联网信息服务算法推荐管理规定》(下称《算法推荐管理规定》)、《在线旅游经营服务管理暂行规定》和《深圳经济特区数据条例》第二十九条,以及《个人信息保护法》第二十四条。
可见,对算法公平三种不同的立法思路和定义反映了中国不同部门对全球三大主要算法治理方式的取舍、妥协和杂糅。
全球算法治理的三个场域
那么,什么是算法治理?当前全球算法治理的主要场域是什么?
算法治理是指对全场景人工智能算法大规模商业应用市场秩序的全面规范和调节整顿,其实质是规范政府与市场以及不同市场主体之间的市场秩序,确立算法平台、平台商家、个人消费者与数字市场不同监管部门之间的法律关系、治理关系和社会关系。其目的是通过建立算法公平治理准则,努力维护在互联网时代数字消费市场的公平秩序。
对算法公平定义的不同理解与全球三大主要算法治理场域之间呈现了对应的全球法律秩序关系。具体而言,第一种将算法公平视为算法推荐商从事服务活动的过程公平,在全球治理中对应的是社交媒体算法治理场域,主要涉事算法平台主体是社交媒体脸书和推特。
第二种将算法公平视为算法推荐使用者不得侵犯消费者公平权益的结果公平,在全球算法治理中对应的是购物平台算法治理场域,主要涉事算法平台主体是亚马逊。
第三种将算法公平视为对个人信息或个人数据的延伸保护而赋予个人可以拒绝信息数据处理者的起点公平,在全球治理中对应的是广告平台算法治理场域,主要涉事算法平台主体是谷歌。
具体来看:1.社交媒体算法治理突显规范算法推荐者的需要。美国总统大选争议引发了公众对社交媒体算法治理的广泛关注。普遍认为,在2016年美国总统大选中,特朗普的意外当选正是受益于他的人工智能算法团队对选民意愿的精准操纵。特朗普授权顾问班农,付费聘请大数据分析公司剑桥分析,通过操纵社交媒体算法,辅助总统大选。
为了让特朗普这个大客户赢得大选,剑桥分析的第一步是捕捉用户的大数据,首先在脸书上进行了一次抽奖人格测试,成功吸引了27万名美国选民。在点击链接的那一刻,这些人送出了自己和自己朋友关系网的相关数据,为剑桥分析创造了5000万基础个人信息数据库。如此,大量的用户个人信息,包括姓名、年龄、地理位置、发布的动态、点赞,就成了剑桥分析数据库里的基础数据。
第二步是剑桥分析根据这些数据建立了选民的“政治心理模型”,预测用户的政治倾向,找出没有确定政治倾向的中间选民。其中一个关键点是剑桥分析滥用了美国选民登记信息,使用撞库手段和其他数据算法,精确识别了摇摆选民和不愿意投票选民的个人社交账号。
第三步是通过虚假社交媒体账号、虚假新闻和攻击性煽动,对不同心理特征的选民推送定制化的煽动信息,最终影响这些摇摆州中间选民的投票行为。而这一步得以实现的原因在于,在人工智能算法驱动的社交媒体时代,公众个人很容易限于“信息茧房”,他们获取社会新闻资讯高度依赖社交媒体的算法推荐,“信息茧房”可能强化了公众个人的社会偏见或政治立场,强化了虚假社交媒体账户、虚假新闻或诱导性信息的传播,却未必促进社会公平和真实信息传播。社交媒体由此高度重视算法治理工作,为此多次大幅修改算法推荐规则。
2.购物平台算法治理意在保护消费者公平权益。2000年,亚马逊已成立6年,拥有2300万注册用户。为了从用户身上获得更多利润,亚马逊以“价格实验”为名,利用Cookie跟踪用户的浏览痕迹,对DVD进行差别定价:他们让可能会和线下商店或其他电商平台进行比价的新用户看到的价格是22.74美元,而被认为有强烈购买意愿进而对价格相对不敏感的老用户看到的价格是26.24美元,高了将近4美元。亚马逊因此将销售毛利率大幅提高了15.4%。
这个在今天来看还比较稚嫩的歧视性定价策略,在不到一个月时间里就被消费者识破,并遭到社会舆论的广泛声讨。随后,亚马逊创始人贝索斯亲自致歉,辩称这只是一次技术测试,并同意把多收的钱返还给消费者。此后,以算法为基础的价格歧视从未消失,而是以更隐蔽的方法改头换面。包括美国办公用品连锁巨头史泰博,他们基于地理信息的新一代人工智能算法歧视,对部分用户定价更高;也包括亚马逊内部的一支算法团队A9团队,通过算法提高自家品牌产品在搜索结果中出现的频率,从而提升亚马逊自有品牌的销售额和市场份额。这些算法推荐一旦曝光,就可能让购物平台巨头陷入巨大的社会争议,因此,购物平台开始高度重视算法治理工作,并为此一再修改算法规则,力图避免背负侵害消费者权益的骂名。
3.广告平台算法治理旨在赋权个人信息数据权。在广告位端,数字广告平台可利用算法工具,压低广告位所有者的广告收益分成。例如,2021年6月,法国竞争事务监管机构认定,谷歌滥用在网络广告市场业务算法的支配地位,对谷歌开出2.2亿欧元的罚单。
法国发起调查的原因是英国新闻集团、法国费加罗报报社和比利时罗塞尔集团投诉,谷歌使用广告算法从事不正当竞争,令它们在出售旗下网站和手机应用程序广告位时蒙受损失。
在个人客户端,传统的广告模式是广而告之的模式,所有用户看到的是同一个电视报纸广告,而数字广告正朝着个性化广告的方向发展,投放广告是千人千面,因此,广告平台算法治理核心是赋权个人信息数据权,从根本上赋予个人有权拒绝广告平台通过精准数据算法对其正当权益的侵害。
数字广告平台利用用户画像人工智能分析工具,刻画在数字世界具体用户的个人形象,用户性别、年龄、行业、收入、婚姻状态、教育程度、兴趣爱好、IP地址和地理信息等个人信息均可能被收集和标记。随后,通过用户的浏览偏好、购买行为等用户行为定向分析,掌握用户需求,从而精准投放广告,从购物导流中最大化其自身分成。
为此,欧盟在《通用数据保护条例》中明确规定,网站经营者必须事先向客户说明会自动记录客户的搜索和购物记录,并获得用户的同意,否则按“未告知记录用户行为”作违法处理,任何数字平台运营商不能再使用模糊、难以理解的语言或冗长的隐私政策来从用户处获取数据使用许可。鉴于《通用数据保护条例》明确赋予了个人用户拒绝广告平台使用个人信息数据,美国学者Goldberg等人的最新研究显示,用户拒绝提供个人信息对页面访问量的影响约7%,对电商平台收入的影响约29%。
算法公平与算法治理在中国的理论与现实问题
中国算法治理秩序也与全球算法治理三大场域之间呈现了对应的跨国法律秩序关系。在中国,不同行政部门或立法部门在具体负责的行政法规或部门法立法过程中,选取借鉴了其中某些治理思路,力图通过算法治理在中国构建数字时代的市场公平,确立它们在数字市场领域的市场监管主导权。这表现为算法公平与算法治理在中国呈现“1+N+1”政策体系这一现实格局。
具体而言,其一,围绕算法推荐服务商形成了以国家互联网信息办公室为主导的政策法规和治理体系,《算法推荐管理规定》和《关于加强互联网信息服务算法综合治理的指导意见》分别是其牵头政策法规和治理意见的代表;
其二,围绕消费者公平权益形成了各部门各地方对相关行业主体的管理办法和暂行规定,这主要体现为文化旅游部下发《在线旅游经营服务管理暂行规定》,科技部要求强化科技伦理意识完善科技伦理审查等共同完善算法安全治理,也具体体现为《数据安全法》和《网络安全法》在国家层面、各部门(包括工业、电信、自然资源、卫生健康、教育、国防科技工业、金融业等行业主管部门、公安机关、国安机关以及国家网信部门)层面和各地区层面的分工配合;
其三,围绕个人信息保护形成了以工信部为主导的法律法规和治理体系,这包括已经立法通过的《个人信息保护法》和即将出台《工信领域数据安全管理办法》《移动互联网应用程序个人信息保护管理规定》等法律法规,涵盖收集使用个人信息、车联网、人工智能等重要领域的数据安全标准。
在“1+N+1”的政策体系格局下,现阶段算法公平与算法治理在中国主要存在三方面的理论与现实问题:
第一,当前算法治理体系呈现以行政监管为主导的监管色彩,尚未兼顾算法社会治理的综合治理体系。以《算法推荐管理规定》为例,第二十五条规定由网信部门负责接收和审查算法备案材料,第二十八条规定网信部门会同电信、公安、市场监管等有关部门开展算法安全评估和监督检查工作,这均呈现浓厚的行政监管色彩。而在类似领域,国内外通常采取兼顾综合治理的社会治理体系。例如,在中国科技伦理审查领域,《关于加强科技伦理治理的意见》指出,“从事生命科学、医学、人工智能等科技活动的单位,研究内容涉及科技伦理敏感领域的,应设立科技伦理(审查)委员会”,“推动设立中国科技伦理学会,健全科技伦理治理社会组织体系”。
在欧盟,根据《数字服务法(草案)》和《数字市场法(草案)》,欧盟将成立欧洲数字服务委员会,广泛听取专家和专业团体意见,形成兼顾行政监管和社会治理的综合治理体系。
第二,当前算法治理体系呈现以行政法律法规为主体的行政法色彩,尚未兼顾算法社会治理的配套指引性治理文件体系。以《算法推荐管理规定》《个人信息保护法》等为例,目前各部委主要通过完善部门行政法体系,推动落实算法治理。在欧盟,在《通用数据保护条例》之外,还配套形成了若干治理性规范。这些规范不具有强制性的法律约束力,但能帮助社会更好地完善算法公平与算法治理的配套体系,这是因为算法公平与算法治理需要调节的不仅仅是政府部门与市场主体之间的公法关系,还需要规范算法平台、平台商家与个人用户或消费者之间的私法关系和社会关系。在欧盟,这包括2018年发布的《欧盟人工智能报告》和自愿性准则《虚假信息行为准则》,这一准则的目前签署方包括脸书、谷歌、推特、TikTok和Mozilla等跨国数字公司。这也包括2019年发布的《可信人工智能伦理指南》和《算法责任与透明治理框架》两份指引性治理文件。
目前,欧盟计划将于今年出台网上政治广告透明化规则,加强各类主体对《虚假信息行为准则》和《通用数据保护条例》的落实力度。在中国,这具体表现为《算法推荐管理规定》第十四条的潜在问题。该法第十四条规定了“算法推荐服务提供者应当以显著方式告知用户其提供算法推荐服务的情况,并以适当方式公示算法推荐服务的基本原理、目的意图、运行机制等”。
但从法律实践来看,个人用户或中小企业商家即便是在专业律师帮助的情况下,也很难向算法推荐服务商查询自身所处的算法不公平待遇具体情况。即便在携程案中,算法推荐服务提供者始终未向个人用户披露算法歧视、算法滥用和算法垄断的实际具体情况,当事人只能通过线上线下价格比较这一间接证据,证明算法歧视导致了个人权益被算法推荐平台侵害,而无从知情或证明其“算法黑箱”内部算法侵害具体过程。这说明,在中国仍有必要委托行业专家共同参与起草《可信人工智能算法伦理指南》和《算法责任与透明治理框架》。
第三,算法公平与算法治理在底层涉及算法有关的数据财产权问题。
以联合国贸发会议2021年年报观点为例,在数据产权问题上,通常认为,美国倾向于主张社交媒体等脱敏数据归私人公司所有,欧盟倾向于认为这些数据是个人数字资产,而中国的现状是大部分大数据为政府或国有企业主体所掌握。
《民法典》在编纂过程中,由于技术性原因,并没有单独的知识产权编。在此背景下,一方面,个人脱敏数据或公共部门脱敏数据能否用于算法开发或算法迭代,以及由此产生的收益权归属问题是立法工作与社会治理的难题;另一方面,算法本身目前没有民法上的财产权界定,但是,算法不应该与软件著作权、发明专利权、产品专利权、商业秘密简单混淆。因此,通过完善立法、健全行政监督机制和社会治理机制等方式,促进保障用户对个人信息算法的必要知情权(该必要知情权是用户同意授权个人信息被用于自动化算法处理而产生商业化算法推荐的前提),促进在算法备案、算法监管、算法分类指导管理的行政管理过程中约束行政部门充分尊重和保护算法相关知识产权,也是算法公平与算法治理中需要考虑的难题。
算法公平与算法治理的政策建议
在全球数字经济时代,作为全球数字经济的领先者之一,中国正在探索和完善有关算法公平的市场监管、治理体系和法律监管体系。以人工智能和算法创新等科技创新为驱动的中国数字经济建设,是基于中国产业转型升级和科技创新驱动发展的最新范例。在人工智能算法治理方向上近年的立法努力意味着,中国开始尝试厘清算法公平与算法治理的产业政策、治理体系和行政监管配套制度体系。而目前的立法进程只是一个开始,人工智能有关算法公平治理体系建设不过才刚刚起步。
算法公平与算法治理,关系到数字经济部门与传统产业经济部门之间的公平竞争,关系到鼓励全球科技公平创新与科技向善,关系到科技资本与国家数字安全、与社会公众和个人数字权益能否和谐相处。发达国家曾经或正在遭遇的经济公平与算法歧视、社会公平与算法滥用、市场公平和算法垄断等层面的治理难题,也开始对国内全场景数字化和人工智能算法驱动的数字经济产业、社会公共个人信息法益和数字法益和国家数字安全形成挑战。由于目前缺少在算法公平和算法治理上的有效市场监管、治理体系和法律监管体系,在某种程度上,在以算法滥用为代表的一些数字经济领域上演了环境治理曾经遇到的诸多治理难题,在一些数字领域呈现类似先发展先污染后治理或边发展边污染边治理的态势,在个别领域甚至出现光发展不治理的苗头,没有顾及人工智能算法滥用可能对社会公共秩序、个人信息法益与数字法益和国家数字安全的潜在危害。
本文在综合分析算法公平和算法治理国内外现状的基础上,提出以下政策建议:
首先,算法公平与算法治理离不开有效的行业自律机制和社会治理机制。根据《数字服务法(草案)》,欧盟会建立欧洲数字服务理事会。作为一个独立的咨询机构,这个理事会将不仅包括欧盟数字服务协调专员,还会邀请业界代表和学术届专家担任理事。理事会将支持和协调欧盟数字服务协调专员就潜在争议展开联合调查,向欧盟数字服务协调专员提出意见和建议,并促进制定和执行欧盟数字服务协调专员有关数字治理议题的准则和报告。中国可以考虑建立类似的行业自律机制和社会治理机制,共同促进数字科技创新与国家数字安全、与社会公众和个人数字权益的和谐发展。
其次,算法公平治理规则体系是构建算法数字安全和公平科技创新的基准。在欧盟,算法公平与算法治理的规则体系涉及一部法律、两个草案和若干治理文件组成。因此,在中国现有的法律和行政法规体系之外,可以考虑结合国情和行业发展状况,着手制定和发表《中国人工智能算法公平政策》《虚假信息行为准则》《可信人工智能算法伦理指南》《算法责任与透明治理框架》《广告算法透明化规则》等指引性治理文件。
最后,在兼顾鼓励全球数字技术创新的政策机制与区域数字经济发展的前沿探索诉求的同时,还应着力完善算法安全和算法公平的监管体系和监督机制,考虑启动《算法问责条例》《数据问责和透明度条例》等行政法立法工作的前期准备和研究工作,着手算法有关数据财产权问题研究工作。
来源:《中国改革》 2022年第3期
微信编辑:李方芳
推荐阅读
同步关注CIDEG自媒体平台
CIDEG视频号
CIDEG微博