政府开放了多少数据?2015中国开放政府数据“探显镜”
The following article is from 复旦数字治理 Author 郑磊/高丰
2015 中国开放数据“探显镜”
China Open Data Lens 2015
一、为何“探显”?
随着近期国务院发布《促进大数据发展行动纲要》,政府数据开放工作成为社会关注焦点。早在2011年,上海、北京等地就已率先开始主动探索试验开放数据,不但已建立起了数据开放平台,更举办了诸如上海开放数据创新应用大赛(SODA)等活动培育和推动开放数据生态的发展,激发数据创新应用的活力。
然而,
中国政府数据开放现状如何?
有哪些问题值得我们关注?
为此,复旦大学数字与移动治理实验室 ( 微信号:dmgfudan) 和开放数据中国 ( opendatachina.com) 联合推出了 “中国开放数据探显镜”报告 ( opendatalens.cn )。
基于我国国情,构建评估框架,扫描实践案例,探测发展水平,显微细节问题,从而全面、深度、细致地展现我国开放政府数据现状,并为中国开放数据的发展提供政策建议。
二、 如何“探显”?
目前,国际上知名的开放数据评估报告主要针对国家层面而非地方层面,其评估框架和指标体系也并不完全适用于中国国情。我国的开放政府数据首先在地方层面先行探索,国家平台尚未推出,目前尚缺少对中国地方层面开放数据发展现状与问题的评估报告。
此外,国际上的评估报告大多同时对供应端和应用端进行评估,而我国的开放政府数据实践刚刚起步,目前的工作主要集中在政府数据的供应端,只有政府将数据开放出来之后,才谈得上对数据应用端展开评估。
因此,“中国开放数据探显镜”项目的首次报告,将借鉴国际评估经验,立足我国发展实际,重点针对数据供应端,聚焦于北京、上海、武汉、无锡、湛江、宁波海曙和佛山南海这七个具有引领性、代表性的地方政府的开放数据实践开展评估。
报告采用文献检索、自动爬取和人工观察等数据采集方式,针对我国地方政府开放数据实践在数据层、平台层和基础层的工作展开了评估,共覆盖了3个层面13个维度53项指标。
三、数据层探显
从数据层来看,目前中国地方政府的数据开放量较低,截至到2015年5月20日,样本地方平均公开278个数据集。同时,按照开放数据定义要求,数据应当符合易操作的可机读格式(即如xls,而非pdf),但目前可机读率仅达84.1%,其中上海目前以398个可机读数据集位列全国第一。
各地方目前普遍发布的都是静态数据(更新频率为一年或不定期),比例高达86.25%。少部分承诺将更新的数据也未能按承诺进行更新。无锡是各地方中按承诺更新比例最高的(62.5%),各地方平均仅有17.21%的数据按承诺得到了更新。
开放数据应当采用开放的数据格式以确保数据文件无需通过指定的应用程序才能访问。基于此定义,CSV是常见的开放格式而XLS则不是。目前仅北京100%提供了开放格式,南海则有98.15%的数据为开放格式,其他地方均未采用开放格式。而且目前仅南海一个地方在发布数据时提供了多种格式(CSV,XLS,TXT,XML,和JSON),以便于不同需求的数据使用者对数据进行加值利用。
在数据使用权利上,仅无锡和海曙确保数据永久免费,未使用“现阶段”字样。但目前未有一个地方能够明确确保使用者享有免费、自由增值利用,以及自由分享传播的权利。
目前各地方对于开放的数据都能提供基本的元数据信息,包括数据名称、发布单位、数据分类以及数据描述等。但南海和海曙未能明确标记出数据的发布时间,仅海曙和南海明确在数据页面标记数据更新时间,而北京、上海、无锡、湛江都将该信息提供在数据目录中而非数据页面,不便于用户查看,武汉则未提供该项元数据。
四、平台层探显
在平台建设层面,各地方均提供了搜索功能,以及分类导航(依发布机构和/或数据类别导航),其中上海、武汉、湛江还为用户提供了按特定属性(下载量、更新日期等)进行排序搜索等功能。
目前上海、武汉和南海的开放数据平台上提供数据预览功能。无锡和湛江数据下载流程最为简便,均不需要用户注册登录即可下载数据。而在其余的5个地方中,仅北京和南海无需实名注册,其余3个地方都需要用户提供身份证号码才可注册。
目前各地方都在平台上设立了应用频道展示数据应用,其中北京和海曙两个地方不但展示了数据应用,还一并公开了各应用所使用到的开放数据。平均每个平台展示了20个应用,上海展示的应用数最多,共73个应用。各地方中目前除了上海之外均允许开发者提交上传App应用。
目前除了无锡之外的所有开放数据平台都提供了交互功能,包括了数据集评价功能和数据请求功能。上海和湛江均能在不注册登录的情况下就提交数据集评价,其他地方的平台均要求先登录才可提交。对于数据请求功能,除了无锡之外各地方均允许用户提交需要的数据,而在所有地方中,仅有海曙一地将收到的用户数据请求予以公开,其他地方均不公开用户的数据请求信息。
目前仅南海为其开放政府数据项目设立了微博和微信帐号,通过社交媒体帐号推送开放政府数据相关内容。
五、基础层探显
在基础层,上海市和南海区的地方高级领导(分别为市级和区级官员)在公开场合发言支持开放数据并有媒体报道。
目前上海是唯一一个明确公开开放数据工作计划的地方。其发布的《上海市政务数据资源共享和开放年度工作计划》不但明确了整体的战略部署和年度目标,也清楚列明当年的数据开放重点领域清单。
目前在体制保障上,南海和上海有一定突破,明确了主管单位的职能和权限,比如南海成立了数据统筹局,上海市经信委成立了大数据发展处。
综合数据层、平台层、基础层的评估结果表明:
目前上海、南海两地的整体数据开放水平最高。
六、探显建议
基于以上研究,探显镜报告对我国的政府数据开放提出以下主要建议:
加强管理架构和体制机制建设,制定推进政策与工作计划
提高领导重视程度和支持力度
基于社会需求,开放高价值数据,展现数据应用
提升数据开放性与可机读比例
规范数据更新周期,落实数据更新
完善数据授权协议
降低数据获取门槛,推动有效公开的评价互动
报告出品方
复旦大学数字与移动治理实验室
开放数据中国
参与人员:郑磊、高丰、刘新萍、
熊久阳、关文雯、蔡城城
可视化制作
武汉大学镝次元数据传媒实验室
参与人员:王琼、刘真真、万翩翩
媒体合作单位
澎湃新闻
大数据文摘
点击阅读原文,下载论文全文