查看原文
其他

译文 | AI热潮背后:开放数据如何引领未来

开放数据小编 开放数据中国
2024-09-17
按:原文发布于Open Government Partnership的博客,由 Open Data Charter(开放数据宪章)现任首席执行官 Natalia Carfi、Joseph Foti 和 Global Data Barometer(全球数据晴雨表)项目主任 Silvana Fumega共同撰写


阅读这篇博客的朋友们,相信你们大多数人都还记得那些曾经风靡一时的“技术炒作周期”——比如Web 3.0、区块链、加密货币、元宇宙等。不过,这些技术大多数至今(至少目前)还没有完全实现它们最初的承诺。


曾经,开放政府数据也是技术理念中的一颗耀眼明星。它不仅展示了创新的巨大潜力,还可能纠正权力的滥用,并具有显著的经济效益。但一些怀疑者,包括信息自由的倡导者、环境正义的倡导者和隐私权的倡导者,他们认为开放数据忽略了更严格的问责措施或特定的应用场景。

时光荏苒,十多年后的今天,我们终于可以客观地评估哪些措施有效,哪些还有待改进。


特别是在政府数据领域——尤其是开放数据——我们有更多实实在在的成果可以展示:

  • Open Contracting Data Standard 的广泛应用已经让全球的数据质量得到显著提升,为纳税人的资金带来了更高的价值。

  • 国家统计办公室的能力大幅提升,使我们能够更准确地评估发展中的进展和面临的挑战;

  • 优质的治理数据在侦测金融犯罪方面发挥了关键作用,这包括了终结匿名壳公司的数据(也就是我们所说的“受益所有权数据”)。


我们认为,现在正是这些数据发挥最大效用的时刻。在一轮轮的炒作之后,一个更为理性的商业案例逐渐浮现,特别是在开放数据领域。这也正是为什么在全球关于人工智能的讨论中,我们不能忽视开放数据的重要性。


"Gartner 炒作周期"是一种评估不同技术发展阶段的工具。(见下图 )人工智能目前正处于“期望膨胀的顶峰”,有数百个应用正在开发之中。一些应用可能会成功,而另一些可能根本不会成功,或者没有商业案例或公共利益。


与此相反,开放数据即将迈入“生产力高原”。这意味着我们已经清楚它的强项和生产方式,也了解它的应用场景。我们已经走过了“立即发布一切”的阶段,进入了“有目的发布”的新时期。我们也已跨越了“幻灭的低谷”,不再认为之前的尝试都是徒劳。


我们并非对人工智能持悲观态度。但为了让人工智能真正造福人类,我们需要更高质量、更丰富的数据。我们还需要更完善的法规,以人权为核心,平衡数据访问、道德使用和隐私之间的关系。


许多国家缺乏必要的数据或依赖于估算,这导致了对发展状况的不准确描绘。这可能意味着我们无法准确了解哪些政策真正有效,环境在何处遭受破坏,或者贫困问题最严重的地区在哪里。


这引出了第二个问题:有偏见的数据会导致有偏见的人工智能。即使通过模型调整和数据加权,小规模且不具代表性的样本只会放大不准确性。这一点在讨论性别数据差距时尤为明显。同样,我们可以想象到其他方面的盲点,比如围绕种姓、阶级或中小企业等。

填补这些数据缺口需要多年的努力。但如果存在一种方法能够加速提高数据的质量和处理过程呢?我们认为开放数据正是提升数据质量和处理效率的关键因素。


开放数据的重要性不仅仅在于数据量的增加,更在于数据的开放性。在适当的情况下,开放数据不是“奢侈品”,而是“必需品”。它在许多情况下更为有效,尤其是在治理应用中。以下是开放数据的几个关键优势:

  • 可访问性:开放数据更容易被获取和使用。

  • 可验证性:开放数据有助于验证其他研究成果。例如,公共受益所有权数据是一个共享资源。设想一下,执法机构正在追踪金融犯罪,而银行家注意到了异常交易。他们可以利用人工智能标记可疑活动,但如果他们能够参照同一个公共注册表,就意味着他们拥有同一套公共事实。

  • 可解释性和可追溯性:用户可以找到并解释开放数据。基于这些数据构建的人工智能应用将随着数据质量的提升而不断改进。这在“数据匮乏”的时代尤为重要,因为许多应用可能开始依赖合成数据。拥有更新、更优质的数据对于持续改进人工智能应用至关重要。

  • 问责制:政府官员需要对数据的质量负责。当数据质量是工作职责的一部分时,对数据修复的请求更有可能得到及时响应。


并非所有数据都适合开放,但关键的开放政府数据集仍然值得我们投资。投资数据就是投资于人和组织。在开放数据热潮的高峰期,能力建设并不是一个热门话题。但现在,它已被公认为至关重要,这也是我们不能再忽视的原因。


展望未来,一个关键时刻是今年9月20日至23日举行的联合国未来峰会。该峰会旨在引导联合国成员国走向一个更可持续、更人道的高科技未来。主要的谈判集中在未来契约及其全球数字契约上。这是未来契约的重要“附件”,将在未来十年塑造关于人工智能、连通性、数据和数字权利的国际讨论。


然而,当前的成果文件并未充分反映高质量、代表性、非偏见数据的重要性。开放数据也几乎没有被提及。良好的数据对于保障人权、消除贫困和实现我们的清洁能源未来至关重要。

没有它,我们就有可能重蹈覆辙。正如那些经历过的人所证实的:那将是一个错误。

我们如何知道有了改进?在过去的十年中,人们已经跨领域地衡量了世界各地的开放政府数据。这些包括:

  • Open Data Index (OIN):评估官方政府统计数据的开放性和覆盖范围。

  • OECD OURdata Index:专注于较富裕的OECD国家的开放数据。

  • Open Government Data Index:2019年联合国电子政务发展指数的一部分。

  • Global Data Barometer (GDB):从2020年开始,提供关键领域的详细国家级见解。它建立在 Open Data Barometer 之上,不仅包括开放数据,还包括隐私、人权、人工智能、数字安全、数据治理和包容性等多个方面。


多一个点在看

多一条小鱼干


延伸阅读

继续滑动看下一个
开放数据中国
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存