郑磊教授在中国数字经济发展和治理学术年会(2023)上的主旨演讲:公共数据价值释放的路径和原则
7月4日,中国数字经济发展和治理学术年会(2023)在清华大学顺利举办。本次大会以“数据要素治理,数据价值释放,数字经济创新”为主题,邀请了国内外40余位数字经济领域著名专家以及在数字产业实践中取得优异成果的机构代表进行主旨演讲和交流。来自清华大学、北京大学、中国人民大学、中国科学院大学、中国社会科学院大学、南开大学、上海交通大学、复旦大学、中山大学、南京大学等高校和数字经济相关科研机构及企业的代表共400余人出席线下会议,会议通过多个平台进行同步直播,当天信息浏览量超过11万人次。
复旦大学国际关系与公共事务学院郑磊教授以《公共数据价值释放的路径和原则》为题进行了主旨演讲。本文根据郑磊教授现场发言内容整理。
郑磊教授作主旨演讲
很荣幸来参加今年的数字经济发展年会,这些年我重点研究的方向是公共数据如何向社会开放、向数字经济或数字社会赋能,所以我今天的发言主题是《公共数据价值释放的路径和原则》。
在数字时代,政府部门和公共服务和管理机构都采集了很多公共数据,这些数据不仅政府和机构自身可以使用,其实市场和社会也都非常需要,如何把这些数据的价值释放给市场和社会?目前主要是两种路径。最早是公共数据开放,然后近几年各地又开始探索公共数据授权运营。
我先讲数据开放。大概在2015年的时候,我们在上海组织了一个上海公共数据开放创新应用大赛,英文叫Shanghai Open Data Apps,它的首字母连起来正好就是SODA,就是苏打水,寓意是政府数据就像封装在苏打水杯子里的水,看上去悄无声息、安静平稳,但只要打开瓶盖,就能迸发出无穷的能量,向市场和社会赋能,供他们进行开发利用。
八年过去了,我们看到要打开这个瓶子仍然很难,而且即使好不容易打开了瓶子,数据也不会自己迸发出来,数据开放并不像打开苏打水瓶,而是更像倒茶壶,茶壶口很小,只要你不去倒它,这个水是不会自己出来的。
那么怎样把茶壶里的茶水开放给市场呢?如果有五位客人要喝茶,我直接通过茶壶把茶倒给他们,可能有的客人喝到的茶会比较浓,有的人喝到的茶会比较淡,这样就会带来不公平。所以还需要一个茶具叫“公道杯”,先要把茶水先倒进这个杯子里,这个公道杯上面还有一个滤网,把茶渣滤出来,也就是数据在开放前要做好数据安全和个人信息保护方面的审查,并且要提升数据质量,把干净的茶水开放出去。但“公道杯”还有一个很重要的功能是,让茶水在公道杯里先均匀一下,然后再到给客人,这样每位客人喝到的茶就是浓淡一样的。这个公道杯就像是公共数据开放平台,通过这个平台把数据公道地、无歧视地开放给各个市场和社会主体。
所以,数据开放强调的是普惠公平和原始数据的开放,你倒出去的就是这个原味的茶,但这个茶要经过过滤和均匀,从而保证它的安全性、公平性和质量。2017年以来,我们实验室每年在做数据开放的评估,发布开放数林指数,目前已经有200多个地级以上的地方政府上线了数据开放平台。
然而,在数据开放的过程中,从数据供给方也就是从政府部门这边来说,还是有很多安全风险方面的顾虑,这个数据一旦开放出去,就是泼出去的水,把水开放给你了,最后带来风险怎么办?好处是你拿的,但一旦出了问题还是我背锅。结果就是政府这边的开放意愿不强、动力不足,一些具有高价值但同时也具有一定敏感性的数据开放不充分,也缺少高质量的利用成果,主要原因不是因为需方不会用数据,而是供方没有把真正的好数据拿出来。现在开放出来的更多是不那么敏感的、但也价值不那么高的数据,公共数据的供需之间没有真正对接上。
那么能不能根据市场的需求,对这些高价值的原始数据进行加工处理,确保没有安全问题后再开放给市场呢?但政府部门自身人员有限,没有时间和精力来直接服务市场。只靠政府的力量,向社会免费地提供安全、优质的公共数据就很难持续。有这样的话,叫天下没有免费的午餐,免费的是最贵的。
所以各地在数据开放的基础上,又开始探索一种新的形式,试图通过引入市场机制,把这些高价值的、又具有敏感性的数据的价值释放出来。我再来做一个比喻。在台北故宫有这样一件非常珍贵汝窑艺术品,叫莲花温碗。它是干什么用的呢?它其实是一套器具,里面原本还有一个执壶,壶里可以盛水或酒。温碗的作用就是,把热水倒进温碗,热水的温度可以渗透给执壶里的水或酒,赋予其能量,但是这个热水不能拿走。我觉得这个就有点像授权运营,“温碗”就是数据运营主体,政府把热水倒进这个主体,但这个热水本身是不能拿走的,然而数据的“热量”能够通过执壶渗透出去,通过一套技术手段,可以把温热的酒可以从执壶的壶口倒出去,把原始数据加工成产品和服务后再给你,叫“原始数据不出域,数据可用不可见”,然后这些数据产品和服务可以拿出去流通和利用,进入各种场景,一级、二级往下走。
对授权运营还可以做一个比喻,就是调酒器,原始的酒不能给你,但是可以倒进这个瓶子里进行调制,调制出来的鸡尾酒也就是数据产品可以给你,但有一点很重要,你这个数据产品要能在技术上做到不可回溯或还原出原始的数据,也就是你不能再把鸡尾酒还原成原来的酒或饮料。在数据二十条里面,有这样一句话:“鼓励公共数据在保护个人隐私和确保公共安全的前提下,按照原始数据不出域、数据可用不可见的要求,以模型检验等产品和服务等形式向社会提供”。
授权运营目前也还面临很多问题需要解答。例如,数据开放和授权运营之间是什么关系?对哪类数据适合进行授权运营?数据开放更强调普惠公平,是基本的托底,政府应该首先把可以开放的数据开放出来,数据二十条里有一句话,叫“对不承载个人信息和不影响公共安全的公共数据,推动按用途加大供给使用范围”,对这些不涉及个人信息和公共安全的数据,要尽可能开放给社会。但有些数据可能确实不适合直接以原始数据的形式开放出去,因为涉及到数据安全和个人信息,这类数据就可以考虑通过授权运营这种形式,来进一步释放价值,这应该是公共数据授权运营的本意和出发点。无论是将原始数据向社会开放,还是通过授权运营把原始数据加工成数据产品和服务后再向社会提供,这两者都有一个共同目标,都是为了释放公共数据的价值,都是为了降低市场和社会主体获取数据的门槛,都是为了实现公共数据的共同富裕,只是他们的方法和手段有所不同,针对的数据也有所不同。
但在这个过程当中,我们要分清楚“安全”是一个真实的理由,还是只是一个借口。有的时候不能把数据开放出来,其实不是因为安全原因,而是因为利益或其他考虑,但是又不能明说,所以就把“安全”拿来作为不能开放的借口。很多人现在担心数据授权运营是否会对数据开放造成冲击。我们这些年在评测各地的政府数据开放情况,也发现有些地方的数据本来明明已经免费开放了,后来又撤回去了,准备走授权运营了,因为这样才有“利”可图。
由谁来授权?是大数据统筹管理部门授权,把各部门数据汇聚过来由我统一代表政府授权?但是那些数据提供部门也有想法,为什么我就不可以授权?我对这些数据更了解,也更懂数据背后的专业知识。所以如何处理好数据管理部门和数据提供部门之间的关系?
还有一些问题需要考虑,比如授权给谁?只能是国企?还是民企也可以?是统一授权给一家大数据公司?还是可以授权给很多家?选择给一家的地方政府认为这样更安全,我更管得住。但有人担心:这样会不会涉嫌垄断,产生不公平竞争的问题?另外数据的开发利用过程离不开场景和专业知识,就靠一个公司能懂各个行业的专业知识和场景需求吗?所以授权给谁这个问题需要在安全性、专业性和公平性之间保持平衡。
授的是什么权?是数据资源持有权、数据加工使用权、还是数据产品经营权?如何授权?授权的过程和方式中的很多细节都会影响到最终效果。如何做到收放自如?既能把价值输出去,又能把原始数据保护好?而不是要么收得太紧,要么放得太松。
还有定价与收益分配的问题。提供数据的部门、大数据管理部门、授权运营主体,包括数据所涉及到的企业和个人,是否以及如何在这个过程中获取收益?如何在公共性和市场化之间达到平衡?完全考虑市场机制,随便授权运营主体开价收费,整个社会会因此付出更高成本来获得这些数据,但如果要求免费或只能收取很低的价格,那运营主体和相关部门可能就没有积极性了,那我为什么要干这个事情?所谓无利不起早。所以在市场化和公共性之间如何保持平衡还需要做很多探索。我们既要充分引入市场的力量深化对公共数据的挖掘利用,把不适合直接开放的高价值的公共数据以安全的而又可持续的方式来释放价值,提升公共数据流动的动力,但同时又要保证公共数据的公共性,因为大部分公共数据尤其是政府数据是用公共财政的钱采集的,纳税人其实已经交过钱了,再要对这些数据收费的话,就是二次收费了。授权运营的根本目的是要更充分地释放公共数据的价值,增进公共利益,应该尽可能让这些数据取之于民,还之于民,赋能于数字经济和社会发展,获得更大更长久的效益,而不是只图短期的、局部的收益。但对这些公共数据进行开发利用时又确实需要投入成本,这部分可以收加工服务费,但这和直接对原始数据进行收费是两回事。
我再拿都江堰来举个例子。在古代,成都平原既需要岷江水的灌溉,又要防止岷江水的泛滥,所以整个都江堰工程设计得非常巧妙,既能把洪水通过鱼嘴分流出去,分级分类,守住安全底线,又能把需要的水引入内江。枯水期的时候,六成的水走内江,保证对成都平原的灌溉,洪水期的时候,六成的水走外江,四成的水走内江,防止洪水泛滥。内江的尾部还有个飞沙堰,来使内江的水保持在一定水位,如果水位高了,就会没过飞沙堰自动排出去,使水位“安全可控”。飞沙堰还有冲沙的作用,防止淤塞。这就很像我们的数据开放和授权运营,既要确保数据安全可控,又要保证优质数据的可持续供给。最后,也是最重要的一步是要打通“宝瓶口”,这里本来有座山,传说是李冰父子通过热胀冷缩的办法在山上打开了一个口子,叫做“宝瓶口”, 这里和我们一开始讲的SODA瓶子的比喻呼应上了,古今之间call back了。
那么李冰父子千辛万苦修了都江堰,打通宝瓶口的目的是什么?是把水圈到他们家自己的池子里面,就地卖水收水费吗?反正我这里就是唯一的出水口了,我可以坐地起价了,最后让李家和子孙后代赚得盆满钵满?
事实上打开这个宝瓶口是什么目的,每次看这个图我都很感动,水流从宝瓶口出去后,不断分流、再分流,灌溉了整个成都平原,使这里成为了天府之国。无论数据开放还是授权运营,都是为了让“公共数据”的水流出去滋养整个平原,赋能各行各业,千家万户,这应该是政府打通公共数据的“宝瓶口”的根本目的。
《老子》里面有一句话叫“上善若水,水利万物而不争”。公共数据是大家的水,所以《老子》里面还有一句话叫“生而不有,为而不恃,功成而弗居。”我打通了宝瓶口,但我不拥有它,我不居功自傲,而是事了拂衣去,但正是因为“夫唯弗居,是以不去”,成都平原上到处都有我的影子,每家每户用的水都是从宝瓶口出来的,人们世世代代感谢和纪念李冰父子。
所以李冰父子不仅伟大在技术上打通了宝瓶口,更伟大在他们打通了宝瓶口之后,没有说让他们的子子孙孙或自己人来坐地起价收水费,而是让水流入成都平原,释放流水的公共价值,成就了天府之国。但打通和运营宝瓶口是有成本的,需要收取合理的费用,为了让这项工作有动力,可持续,但不能忘记这个工程的根本目的是惠及千家万户,而不是让李冰一家赚得盆满钵满。
我们数字时代要建设数字中国,让整个国家成为数字时代的天府之国,也要学习两千年前的李冰父子,守住安全底线,打通宝瓶口,确保普惠公平,实现优质公共数据的可持续供给,这就是我今天的报告内容,谢谢!
实验室简介
清华大学计算社会科学与国家治理实验室(LCG-THU)于2021年12月批准成立,实验室挂靠清华大学文科建设处,作为教育部批准建设的全国首批哲学社会科学实验室,是促进文科与理工学科交叉融合的综合支撑平台与创新基地。实验室由副校长彭刚兼任主任,公管学院教授孟庆国任执行主任。微信公众号LCG-THU邮箱号lcg-thu@tsinghua.edu.cn