查看原文
其他

[回顾] 普通人的数字权利指北 第 2 期: 算法时代的信息公开

开放数据小编 开放数据中国 2021-12-01

前言

 4 月 17 日,我们有幸邀请到了信息公开领域专家、上海政法学院的肖卫兵教授,和我们共同探讨算法时代信息公开如何支持算法透明,自动化算法又会如何影响信息公开本身。


此篇根据当天活动的主旨分享内容和工作坊产出的成果,由主理人高丰博士为读者提供一份干货的整理。

本期要点速看

01

算法透明的诉求要讲「尺度」,透明只是算法治理的一环,更应强调「算法规制」。

02

信息公开可以适用于算法透明,应以「主动公开」为主,「依申请公开」为辅。涉及算法的「主动公开」,应以满足「绝大多数人」的基本知情权为原则;而涉及算法的「依申请公开」,则以个性化满足「适格」申请人的需求为原则

03

信息公开满足「知情」,以此为基础去推动多元利益主体在算法治理中的事前、事中、事后的「参与度」,是更为重要的话题。

04

算法的信息公开的不确定性和挑战性在于算法的制定者、实现者和运营者的多元,信息公开需要扩充原有的责任范围,才能满足算法透明的需要。


关于「普通人的数字权利指北」

《普通人的数字权利指北》是开放数据中国在「数字权利」工作板块下新开展的系列活动,旨在通过线上线下的讲座、圆桌、互动工作坊等面向普通市民科普大数据和人工智能正在如何影响每个普通人的生活,并逐步树立起自身数字权利意识,掌握如何通过既有的法律、政策等赋予的工具去主张自身的权益,并共同探索数字时代公民数字权利的新路径、新机制和新工具。


我们试图在本系列中去涵盖的针对「算法自动决策」的权利如下:

我们所谈的算法和自动决策



信息公开:政府提供的强有力的「知情」工具

信息公开是一项「古老」的「开放政府」工具,作为保障人民「知情权」的重要方式,信息公开在中国最早生根发芽是在 2004 年的上海。而在 2008 年,国家正式出台了《信息公开条例》,又在不久前的 2019 年刚刚完成二次修订。


就中国的信息公开而言,其有着非常显著的特色:即和政府「为民服务」、「便民服务」的思想结合起来,通过多年的实践积累逐步摸索形成特有的从政府信息公开到政务公开到政府公开的「服务体系」。而在这个发展中,如何去结合算法时代的新挑战,这也是信息公开领域学者面临的挑战。

算法透明的是是非非

而回到我们算法透明的话题上,其实在我们第 1 期活动就已初步地提到过,「算法透明」并不是一个完全得到认同的概念。肖教授在现场也针对正反两派的理由做了梳理。

而他本人则是「有原则」地站在「正方」,认为应当去支持透明的合理诉求和实现路径。原则背后,是他认为「算法透明」并不代表「算法治理」的全部,它是一条路径但并非唯一路径,它是重要的但不是不可缺的,它是尤其局限而非完美的解决方案。

动脑动手 I:「健康码」为例,我们到底关心什么?

从信息公开而言,作为主理人,我很感兴趣的是人们到底想问哪一些关于算法的问题?因此当天现场我们采用了Sli.do工具开展了现场大屏的互动(如果你感兴趣,还可以在下面的投票互动里提交你的想法),围绕「健康码」这一个案例,我们设计了分别包含健康码数据应用、健康码背后的组织机构、健康码计算原理和健康码权益四大类的 8 个小问题,供人们挑选出自己感兴趣的问题,并按权重排序。

读到这里,我们也邀请未能到现场的你,通过下面的投票程序投票


而当天的现场结果如下图所示:


让我个人比较感到惊讶的是,大家第一位关注的是「数据」即哪些数据被利用、被谁使用,其次是「原理」即怎么得到健康状态、如何计算风险地区停留的,最后则是「背后是谁」(谁设计、开发、维护算法)和「权益」(如何修正错误、退出健康码)。而我个人则会是「原理」、「权益」、「数据」、「背后是谁」的大类排序。


现场互动交流下,大家表示一是可能大家对于「数据」特别是「个人数据」在当下会天然更敏感;二是,大家天然不认为「健康码」还有退出可能所以也就不那么关注此类权益的问题。那么更多未到现场的朋友,你们又是怎么想的呢?也欢迎大家到群里(文末有添加方式)或留言分享大家的看法。


主动信息公开:案例与原则

在第 1 期的分享中,我们曾经提到过「算法登记」这一实践方式。在这一次分享中,我们就围绕「信息公开的主动公开」再深度检视这一来自北欧的案例。当前 Saidot (saidot.ai) 这家初创公司围绕算法透明和问责,推出了算法登记库(Al Registers)这一平台系统,这一系统为政府和企业提供了算法透明化的基础信息化支持,包括提供了标准的信息模板、不同利益相关者沟通分享算法细节的标准和权限管理等。而其在赫尔辛基以及阿姆斯特丹则正在试点具体的公共登记库,我们此次参考的正是芬兰赫尔辛基市的登记库。

以其自动停车控制的算法为例,打开其具体主动公开页面,我们会看到如下图的信息框架,分别包含:「数据集」、「数据处理过程/模型过程」、「非歧视说明」、「人类参与和监管」、「风险」这五大信息板块。

其中最为关键的是「数据处理过程/模型过程」这一模块,除了使用普通老百姓就能看得懂的语言将算法的基本处理流程描述清楚,其还特别提供了一个附件以图示的方式再进一步将算法的处理过程予以了解析说明。


而基于我们的动手实验和上述案例,我同肖卫兵教授也开展了对话讨论。肖教授指出了三个关键关键点:

一是,不要把算法透明绝对化,其是算法治理的重要一环。也因此从信息公开而言,它是实现透明的一种方式,也并非是全部路径。


二是,从原则来说,算法牵涉到商业秘密还有可能牵涉国家秘密,因此算法的公开(特别是行政中使用的算法),其本身应当以主动公开为主,基于标准的一套原则去尽量公开适合公开的内容


三是,通过主动公开去满足公众知情,但更要引导基于知情的参与,让更多元的主体能够参与到算法的设计、制定、研发、监管、审计等等全生命的周期中去

动脑动手II:如果让你提出依申请健康码算法,你会操作吗?

聊过主动公开之后,我们自然下一个议题是聊一聊「依申请公开」。在传统信息公开的实践中,「依申请公开」是一件强有力的工具,能够基于申请人的需求去定制化获取所需的信息。但是通过过往经验和实践,我们也很清楚「依申请公开」有着许多的「坑」,其中如何准确写清楚所需的信息就是一个大大的难题。也因此,在现场,我们做了第二个动手实验:

实验的结果,其实并不出乎我个人太大的意料。肖教授针对大家提交的内容做了点评,指出了两类常见的问题:

  • 问题式描述:很多朋友天然会把想问的内容以问句的形式来写出,但实际「依申请公开」是不接受这样的咨询式、提问式的申请,应当是描述性的陈述写法才是合格的申请。

  • 指向性不明:另一个常见的问题是,朋友们指向性不明,无法指出具体需要的内容是哪一个具体的政府拥有的信息或文件,而只能泛泛提出我需要算法。


肖教授也建议大家如果真正感兴趣利用信息公开作为工具去获取算法的信息,那么最好能够强化自身对信息公开工具的理解。此处也推荐大家关注肖教授「信息公开」的微信公众号和视频号(附蜡笔小新版信息公开申请攻略)。


依申请公开算法:合适的信息给到适合的人

在活动最后,肖教授也进一步针对依申请公开这项工具做了解释和未来的构想

一是,依申请公开本身应当是满足特定的算法侵权等场景下的信息知情诉求的工具,与传统「公开为常态,不公开为例外」相反,针对算法的依申请,应该是「公开为例外」,进一步解释其应当是根据具体案例分析,对「适格」的申请人提供「合适」的信息,这样才能避免和商业秘密与国家秘密等的冲突;


二是,传统信息公开会默认依申请获得的信息是可以具备传播性的,而在算法透明场景下,需要对申请人获得的信息做好限制,仅允许其在一定范围和目的下予以流通和查看


三是,针对企业参与的行政算法自动决策,未来需要探索将信息公开的义务主体范围扩大,使得企业负责提供的算法也能够在一定程度上被信息公开纳入范畴去响应依申请的知情权需求,则是未来可能在信息公开法中可以期待的。



下期预告

我们拟在 5 月中下旬开展第 3 期活动,围绕两个CODE:代码/算法(CODE) 和法律(CODE)来讨论在日益数字化的未来,法律的数字实现是通过代码或算法实现的,那么究竟是政府还是企业更多掌控数字「治理」的话语权呢?「算法」或「法律」哪个更容易影响我们的日常生活?开展活动
请留意本公众号的推送,或添加小助手odchina-editor,加入「普通人的数字权利指北」群聊


资料获取

请关注本公众号「开放数据中国」,回复关键字「数字权利指北」获取各期分享的PPT 与相关资料。


相关阅读

  1. 【工作坊报名】 我们身边的算法决策和“被流动”的个人数据

  2. 数据要素流通机制探索(一):玩转数据生态画布设计可持续流通机制

  3. [回顾] 普通人的数字权利指北 第 1 期: 我们身边的算法决策和”被流动“的个人数据

  4. 【工作坊报名】 普通人的数字权利指北第 2 期:算法时代的信息公开






关于我们


开放数据中国是中国第一个聚焦开放式数据要素流通创新和开放式数字治理的社会企业,旨在共营开放的未来数字社会(Open Digital Future)。其主要工作在「数字要素治理」、「数字权利」、「数字经济创新」三个板块,旨在以「开放原则」(Open Principle)来推进数字时代的要素流通监管,公民权利保护,以及经济模式的创新。

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存