查看原文
其他

研究成果 | 国际数据空间(IDS)的实践评述及启示

吴蔽余 计丽娜等 上海数据交易所研究院 2024-01-09


吴蔽余1   计丽娜1,2   唐诗2   滕俊骅2   

1  上海数据交易所有限公司

2  复旦大学管理学院


数据作为生产要素的价值得到了世界主要经济体的公认,并展开了一场打通数据要素流通利用渠道、激发数据二次价值、促进数字经济发展的国家间竞赛。对于欧洲而言,由于缺乏美国、中国这样的互联网巨头,欧洲更强调本地主义、去中心化和数据主权,一方面通过《通用数据保护条例》(GDPR)等规范遏制域外互联网巨头的数字权力,另一方面通过《欧洲数据战略》等规划试图打造一个统一的欧洲数据联合体,力图在数字经济的世界竞争中占据一席之地。国际数据空间(International Data Space,后文简称为IDS)就是实现欧洲数据战略的积极尝试。
国内学界和业界已经对IDS有所研究,并尝试建设中国版的IDS。比如中国信通院牵头建设了可信工业数据空间(Trusted Industrial Data Matrix, TIDM),华为公司牵头建设了企业数据交换空间(Enterprise Data Space, EDS)。2022年9月,IDS中国研究实验室在上海临港正式启动,展示了中外合作的发展新路径。但是,我国数据要素市场有其独特性。我国提出“加快培育数据要素市场”的战略目标后,大量政府支持的数据交易机构先后成立,这些交易机构的探索实践必将塑造中国特色的“数据空间”,并与IDS有所不同。国内尚无系统梳理IDS的架构和应用的综述性介绍,也缺乏从数据交易机构的视角反思借鉴IDS的比较研究,本文试图弥补上述不足。

01

国际数据空间(IDS)的架构
IDS的建立依托于国际数据空间协会(IDSA)。IDSA成立于2016年,最早由德国的弗劳恩霍夫协会(Fraunhofer Society)运营,随后得到了德国联邦政府教育和研究部以及德国几大工业巨头的赞助。如今IDSA已经成为具有国际影响力的数据流通联盟,成员包括来自20多个国家的130多个企业。
IDS的目标是在欧洲建立统一、可信的数据流通空间,确保数据主权(data sovereignty)的实现。数据主权是IDS最重要的概念,强调数据主权是指数据所有者(无论是个人还是企业)对于其数据在数据空间内价值链上的流动有完全的控制权,即可以自主决定是否流通、流通给谁、如何流通、何时流通、以何种价格流通等。数据主权可以实现数据保护、数据安全、机会平等等价值,也给去中心化的数据生态、增值的应用程序和活跃的数据市场提供了基础。IDS通过一个连接器(connector)的设计,将数据主权的描述性定义转向可操作可落地的实践。连接器起到阀门或网关的作用,赋予了参与者以数据主权。数据空间参与者在连接器的连接下,共同形成了可信、统一的数据空间。为了具体描述这种数据空间,IDS提供了一套参考架构模式(Reference Architecture Model, RAM),如图1所示。

图 1 IDS-RAM图示


IDS-RAM是一个高度抽象的架构模型,包括五个横向层级和三个纵向视角。五个横向层级代表了不同层面上参与者的关注点,三个纵向视角则横跨所有层级,需要在各层级上贯彻落实。

横向层级



从横向来看,IDS-RAM包括业务层、功能层、流程层、信息层和系统层五个层级。其中,业务层是IDS的顶层设计;功能层表达了IDS的具体建设目标;流程层描述了IDS成员互动的标准流程,可以视为对业务层的具象化;信息层通过概念模型来描述IDS中的数字资源;系统层关注具体软件组件的技术分解。

其中,业务层和功能层是最为重要的两个层级,其他三个层级可以视为实现上两个层级设计和目标的具体手段。因此,本文重点阐明业务层和功能层。

业务层:顶层设计


业务层定义了IDS参与者的不同角色以及这些角色之间的交互模式,是数据空间的顶层设计,也是其他各层级的基础。
在IDS中,参与者的角色可以分为三类,即核心参与者、中介机构和监管机构。核心参与者是指直接参与数据流通的供需方,包括数据所有者、数据提供者、数据消费者和数据使用者。其中数据提供者和数据消费者之间通过连接器(由IDSA提供)进行连接,实现转换数据和接受数据功能。中介机构包括经纪服务提供者、清算服务提供者、应用商店提供者、数据应用提供者和词汇提供者,他们通过提供中介服务促成数据流通。最后,监管机构包括认证机构、评估机构和IDSA,它们为满足特定条件的参与者提供认证,从而保证各参与者间的信任。除监管机构外的各参与者在数据流通中的交互关系如图2所示,包含数据流、元数据流、软件流三种连接方式。

图 2 IDS中各参与者之间的交互关系

功能层:目标体系


功能层定义了IDS的六大建设目标体系,分别为信任、安全和数据主权、数据生态系统、标准化的互操作、增值应用程序和数据市场。具体而言分为六点:

1.IDS要建立参与者之间的信任机制。信任是数据流通的基础,通过对参与者的评估和认证来实现。IDS定义了两种信任类型,即静态信任和动态信任。静态信任是指进入市场之前,评估机构、认证机构对参与者及其核心技术组件的认证。动态信任是指进入市场之后,基于DTM(Dynamic Trust Monitor)逻辑对参与者及其核心技术组件的动态监控。DTM对参与者的可信度进行动态评级,数据供需双方可以获得对方实时的可信度评级信息。

2.IDS要确保数据安全和数据主权。数据安全主要依靠信任机制中的评估和认证实现,数据主权主要通过使用协议(usage contract)来确保实现,或者说前文所述的连接器(connector)在功能层的表象即使用协议。使用协议由一系列使用规则组成,描述了数据使用者各类权限和义务。使用协议呈机器可读格式,在数据使用过程中利用技术手段强制执行。

3.IDS致力于建构数据生态系统。IDS采用去中心化的数据存储和流通形式,参与者之间通过连接器直接相互连通,就可以进行安全互信的、保证数据主权的数据流通。IDSA等监管者仅提供对参与者的评估和认证,并非提供一个中心化平台。为了实现一个去中心化的数据生态系统,第三方服务商是至关重要的。生态系统内的数据资源必须得到完整的描述,并形成公认的词汇表(vocabulary)。为了快速便捷获取数据,生态系统内必须有数据经纪人(broker),并提供实时的数据搜索服务。

4.IDS提供标准化的互操作。连接器可能来自不同的供应商,必须建立标准,让所有连接器之间实现互操作,确保生态系统内的所有参与者通过连接器能够互联互通。互操作包括三个层面,即语义互操作(包括数据元素、模块、映射等的互操作)、语法和结构互操作(包括标准的数据资源描述框架和格式)、协议互操作(包括相同的规则和协议)等。互操作的实现有赖于IDS提供的统一标准。

5.增值应用程序。IDS中的应用程序是植入连接器的,在数据流通之外提供增值服务,包括数据处理、数据加工、数据分析等。这些增值服务内嵌于连接器内,给连接器赋予了保证数据主权、互操作之外的新功能。

6.数据市场。数据市场包括数据清洗、标注、数据经纪和数据中介等服务商,也包括使用限制、法律协议等模板提供者。这些第三方服务商给IDS实现商业价值提供了支撑。可以说,连接器将数据空间内的参与者相互连接起来,构成了一个数据网络,那么数据市场的第三方服务商则弥散在整个数据网络之中,给整个生态系统赋能。

纵向视角



从纵向来看,IDS-RAM包括安全、认证和治理三个方面的要求。这三个要求贯穿五个层级,在各层级之中均有所体现。

安全要求


安全是IDS的基本要求之一,也是让参与者之间达成信任的前提。IDS的安全架构主要解决七个安全问题,即安全通信、身份管理、信任管理、可信平台、数据访问控制、数据使用控制和数据溯源。该安全架构是根据以下两个基本原则构建的。

1. 使用现有的标准和最佳实践安全架构并不是为了给已经解决的问题提供一个新的解决方案,而是将现有的、成熟的方法有机结合起来,并在必要时进行适当的增补。比如,IDS自主开发的DIN SPEC 27070安全标准就是建立在已有标准的基础之上。

2. 可扩展的安全等级IDS并不对全部参与者强制推行单一的安全标准。某个组织或企业接入IDS只需满足一个最基本的安全要求(Base级),使得资源和技术较为有限的组织机构也可以参与进来。在最基本的安全等级之上,参与者可以自主按需选择更高的安全等级,即Trust级和Trust+级。其中,Trust级适用于比较重视数据安全保护的场景,通过容器隔离、完整性保护登录和持久性数据加密等方式防范管理员的无意入侵。Trust+级则是在Trust的基础上加强的等级,可防范管理员利用技术手段蓄意入侵。在实践中,一些数据资源和数据服务会设定最低安全等级限制。换言之,安全等级越高,能够访问更高质量的数据资源、享受更优质的数据服务。

认证要求


为确保数据主权,任何访问IDS的组织、个人以及核心技术组件(如IDS连接器)都需要经过认证。对个人和组织的认证侧重于安全和信任,而对核心技术组件的认证则更强调其是否满足互操作的技术要求。为满足对两种客体的认证过程相一致,IDS采取的方案包括申请、评估、认证三个阶段,涉及的角色包括IDSA、认证机构和评估机构,各角色之间的关系参如图3所示。

图 3 IDS的认证视角

治理要求


在治理方面,IDS-RAM定义了数据空间中参与者的角色、功能、流程,使其能够建立健康和可信的数据生态,进而保护各方利益。IDS在构建数据生态时不采用任何强制性或法律性的手段,而是通过以下几种方式来解决治理问题。一是提供数据交换、企业互操作和采用新型数字化商业模式的基础设施;二是建立数据所有者、数据提供者和数据消费者间的可信关系;三是扮演参与者之间调解受托人的角色;四是促进协议和合同的协商;五是关注数据流通和数据使用的透明度和可追踪性;六是允许公开和非公开的流通;七是将每个参与者的需求纳入考量;八是提供没有中央权威机构的去中心化架构。


02



国际数据空间(IDS)的应用

IDS的架构给数据流通提供了基础设施,但是真正给数据流通提供动力的是创新性使用场景及其商业价值。IDS通过聚焦需求,从实际面临的商业痛点出发,积极挖掘出基于IDS技术的数据使用场景。一方面,IDSA要求成员企业提供各自的用例(use case);另一方面,IDSA按行业对成功的用例进行汇总和公布。

IDSA提供的标准用例模板包括行业痛点、解决方案、使用到的IDS技术、数据供需方和最终价值等方面。用例不仅可以帮助识别、分析和评估用户需求,还可以展示IDS技术跨组织、跨行业协作的可能性。比如IDS在车辆数据方面的用例。随着车联网从理念走向现实,一些大型车企控制了大量车辆数据,包括驾驶者行为数据、行车数据,也包括车载传感器所获得的数据。如何通过IDS实现这些数据的潜在商业价值,需要具体用例来进行说明。典型的例子如下。
1. 动态交通预测。交通信息通常存在更新不及时的问题,如何才能动态预测交通情况,IDS提供了基于行车数据的解决方案。IDS成员汽车企业是数据提供方,将其车辆采集到的实时交通信息通过IDS连接器上传。数据需求方是提供交通预测服务的人工智能企业。需求方通过连接器获得实时数据后,使用人工智能进行动态交通预测。对人工智能的训练可以通过前期累积的大量行车数据进行。
2. 空气质量监测。空气质量监测传统上依赖于网格状的传感器,通常存在颗粒度过大、识别不够精确的问题。IDS基于车载传感器数据提供了提高空气质量识别能力的解决方案。IDS成员汽车企业通过在车辆上设置空气质量传感器,实时向IDS上传车辆附近的空气质量信息。政府环保部门是相关数据的需求方,结合车载传感器数据和其他数据,对小颗粒范围空气质量进行监测并精确识别。
3. 危险路况警示。危险路况具有突发性,通常存在更新不及时的问题,由此导致车辆进入未预料的危险路况。IDS基于车载传感器数据提供了提高危险路况警示的实时性的解决方案。IDS成员汽车企业通过车载传感器,实时分享车辆周边路况信息,对危险路况进行及时分享和相互提醒。驾驶员、导航服务提供者、市政和保险公司等都是相关数据的需求方。
上述三个用例展示了IDS在车辆数据方面如何形成了一个行业性的“车辆数据空间”(mobility data space)。相应的,工业、物流、医疗等不同行业均可以形成行业性或领域性的数据空间。这些数据空间提供了创新性的使用场景和用例,为潜在参与者提供指导范例,并将之吸引进IDS的生态系统。

IDS的成功应用离不开作为协会的IDSA。IDSA本身不是平台,而是建构了生态内参与者之间的“非交易性”社会关系。前文已经提及,IDSA承担了参与者评估认证机构的功能。此外,IDSA还有两大功能。一是IDSA承担着社会功能,如开发设计IDS-RAM、促进企业与科研机构之间的经验共享、教育培训、对外合作、国际宣传等。二是IDSA设立了各大行业社区,包括工业、汽车、物流、医疗等多个行业(参见图4)。行业社区中的企业在IDS通行规则的指导下,通过合作、协商,形成行业标准、技术、规则和治理体系,使得IDS的原则适应于行业的特定需求。行业社区内的互动并不完全依赖于IDS的技术平台,而是体现出“自组织、可持续、可扩展”的特点。

图 4 IDSA与行业社区关系图


03


国际数据空间(IDS)对我国数据要素流通实践的启

我国数据交易机构与IDS的不同点


自2014年以来,国内已经先后成立了至少50多家数据交易机构。国内数据交易机构通常具有政策和市场双轮驱动的特征,政府支持建设平台化的数据交易机构,以此规范和培育数据要素市场,这是我国与欧美国家显著不同的地方。此外,与IDS相比,我国的数据交易机构具有以下三个显著的不同点。

1. IDS致力于数据共享,而我国绝大多数数据交易机构致力于数据交易。
2. IDS建立去中心化的网络结构,而我国绝大多数数据交易机构建立了中心化的交易平台。
3.IDS具有企业联盟属性,而我国绝大多数数据交易机构往往是个具有单个企业属性的机构。

IDS对我国数据要素市场的参考意义


IDS的实践对我国数据要素流通市场的建设和实践依然具有参考意义,提供的启示可以总结为如下几点。

1. 通过中心化与去中心化相结合的架构重塑市场。在数据交易机构的交易平台建设初期,中心化架构的网络效应尚未显现,围绕平台的数商生态尚未形成,与场外相比在交易成本上不具有优势。IDS的去中心化结构比之传统的企业间场外交易而言,增加了信任与安全机制。数据交易机构在坚持平台建设的同时,也应注重对场外交易的规范引导,通过优惠甚至免费的形式,为企业间场外交易提供信任和安全的技术支持,以及场外交易通用的标准。通过培育去中心化的市场,推动场内场外交易实现分离均衡,让合规需求较高、增值服务需求较高的数据交易主动进场交易,使数据交易机构真正成为全国统一数据要素市场的枢纽。此外,IDS的连接器是非常好的数据交付手段,提供了数据交易的“物流”。数据交易机构作为中心化供需匹配、数商匹配的平台,辅之以去中心化的数据“物流”网络,可以实现对市场的重新塑造。
2. 通过评级认证规范市场。互信难是我们目前数据交易市场存在的一个重要问题。IDS的静态评级、动态评级解决了企业间在交易前和交易中的信任问题,减少了信息不对称。而我国绝大多数数据交易机构尚未对数据交易供需方和数商进行评级认证。数据交易机构本身作为具有公信力的平台,需要将企业间的互信转移到对数据交易机构的信任。随着平台参与方的增多,数据交易机构不仅要对交易的数据产品进行分类分级,也应对参与方进行评级,通过数据交易机构的认证重新建立企业间的互信。数据交易机构可以参考IDS可扩展的安全等级,设置适合国内情况的数据交易安全资质等级,为数据供需方、注册数商提供等级认证。国内目前已有DCMM贯标等级认证,但其主要针对的是内部数据治理。数据交易机构可以提供一套独立的培训和认证标准,将安全合规与评级认证结合起来。

3.通过用例激活市场。我国数据场外交易已经比较活跃,这些交易存量通常与特定应用场景有关。比如银行的贷款业务,需要通过大量公共数据、行业数据、征信数据进行辅助决策。再如互联网广告需要大量个人信息数据、行为数据进行精准定位。要激活场内交易,获得交易增量,就必须让市场看到新的商业模式。用例就是展示应用场景的最好方式。数据供方登记数据产品时,不仅应该提供产品说明书,更应该提供用例,即在什么场景下数据产品可以被使用、解决了需方什么痛点、在数据交易机构获得了什么技术支持和增值服务、实现了什么市场价值等。用例可以形成虹吸效应,让更多参与者看到场内交易的价值,激发参与热情。同时,用例可以鼓励创新,形成专门从事用例研究的第三方数商,孵化新的应用场景的诞生。用例将对行业进行赋能,形成以数据交易机构为纽带的数据空间,进而迈向全国统一的数据要素市场。


吴蔽余 法学博士,上海数据交易所,主要研究方向为数据要素市场化配置的法律机制。

计丽娜 上海数据交易所,复旦大学管理学院,主要研究方向为海外数据交易市场。

唐诗 复旦大学管理学院学生。

滕俊骅 复旦大学管理学院学生。

排版:曾萍萍

点击下方阅读原文获取PDF全文

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存