查看原文
其他

三步骤厘清可信数网(TDN)总体框架


随着政府和企业数字化转型的深入、智能化水平的不断攀升,数据要素价值的释放越发体现在让数据可信的流通到更需要的地方,破除跨域互联阻碍,让不同来源的优质数据在新的业务需求和场景中汇聚融合,实现双赢、多赢的价值利用。因此,为激活数据要素市场,助力建设全国统一大市场、形成高效数据流通基础设施,可信数据流通网络应运而生。




(一)总体功能


1.核心能力


可信数据流通网络(简称可信数网,Trusted Data circulation Network,TDN)是以数据可信流通为基础原则,以“全国互联、数据可信、流通安全、全程可溯、贡献可量”核心能力为目标,而建立的跨区域、跨行业、跨主体的数据流通基础设施。可信数网基于分层次的网状结构,通过建立顶级节点、枢纽节点、子节点,以实现数据、算力、网络等的互联互通和价值共享。在保证数据安全合规使用的前提下,可信数网为解决数据确权授权、数据质量管理难、流通主体相互不信任、安全流通无范式、使用过程不可控和收益分配难度量等问题提供了一种可行的解决路径。


全国互联是基础支撑。在数据的规模效应不断显现,越大规模、越多维度的数据融合汇聚创造的价值倍增的条件下,政府数据、企业数据、个人数据等充分共享才能实现数据要素价值的最大化利用。因此,构建一个全国数据流通网络、一套可互操作的开放体系,通过将全国各地方、各行业的跨区域、跨主体的节点灵活组网、数据统一接入、计算高效调度等能力,实现数据价值的共享互通。


数据可信是内在要求。只有在数据来源清晰、数据质量有保障的条件下进行数据共享交易,才能促进数据安全流通、提高参与流通的积极性。可信数网通过认证鉴权、身份治理、登记指南、质量评估等能力,支持数据规范登记、自由接入和高质量供给。


流通安全是核心诉求。数据安全可控高效的流通是价值共享的初衷也是核心要求。依托去标识化、使用控制、隐私计算、智能合约、区块链、可验证计算等可信流通技术手段,实现多场景、多形态的数据安全流通,满足“原始数据不出域、数据可用不可见”的要求,避免因数据流通造成的数据泄露、滥用和隐私泄露等问题。


全程可溯是监管保障。数据流通过程往往涉及多方行为,数据应用场景纷繁复杂,为避免数据被滥用、误用,可信数网通过提供流通过程安全审查、算法审查、服务或任务存证等功能,建立数据流通全流程证据链,保障数据服务可控可管。


贡献可量是持续动力。从流通过程中各个参与方所提供的数据资源、数据产品、算法模型、软硬件基础设施以及相关专业服务等方面,依据数量、质量、效果、场景等多维度评价各方贡献,合理进行数据价值分配,有助于政府或企业持续进行数据流通,加快数据要素市场化。


2.功能框架


可信数网作为一种数据流通基础设施,围绕“全国互联、数据可信、流通安全、全程可溯、贡献可量”的核心能力和目标,其功能框架主要分为四层:互联基础层、资源接入层、计算控制层、流通服务层,如图1所示。


来源:CCSA TC601

图 1 可信数网(TDN)功能框架


互联基础层一方面提供了数据流通所有环节需要的计算、存储、网络的基础功能,包括但不限于大数据软件系统、通信网络、硬件算力设备、云服务等。另一方面,根据跨节点的数据共享或计算需求,提供一套数据流通互联互通协议,基于统一、标准的协议连通基础层各节点及资源,实现各节点间可相互连接和交互。


资源接入层提供数据、模型、算力等资源的接入能力,实现资源统一对接,保证资源来源清晰可信。在接入的过程中,提供资源登记、资源评估及资源处理等能力,其中资源登记用于保障各类资源来源的合法合规,资源评估(包括质量评估、安全评估、价值评估等)确保资源的安全可用,资源处理则是支撑对各类资源的接入、处理及管理,从而保障经过接入层的资源是来源清晰的、可信的、高质量的、高可用的,促进资源的高效流通计算。


计算控制层主要是保障数据流通过程的安全可控。数据共享或计算的过程,从数据来源角度可分为单方本地计算、多方协同计算、多方汇聚计算等方式;从隐私保护角度可分为明文计算、失真数据计算和密态数据计算等方式。根据不同的处理方式,各个参与方调配相关的数据、算法或算力资源,执行数据计算服务,然后将服务结果传递到指定需求方,经核查后完成交付。在这个过程中,一是数据供需双方要约定数据使用的策略,包括用途、用量、使用次数、处理方式、加工算法等,并确保依据所约定的策略执行数据处理;二是数据提供方在计算前可对数据进行脱敏、去标识化、加密等转化处理来满足不同的流通需求;三是提供对流通全流程的监控、身份管理和合约管理等功能。


流通服务层则是根据各方所签订的数据使用合约、各类数据计算服务的操作记录、流通各环节的日志存证等开展安全审查、资源计量计费等内容。同时,也可由此对产生的收益进行合理分配,对参与流通过程的各方的服务进行评价,包括信誉评价等内容。



(二)网络结构

1.拓扑结构


可信数网采用分层次的网状结构,通过建立顶级节点、枢纽节点、子节点,实现公共数据、企业数据和个人数据的跨区域、跨行业的可信流通,其拓扑结构如图 2所示。

来源:CCSA TC601

图 2 可信数网拓扑结构图


顶级节点是面向全国范围内跨地域、跨行业的数据流通管理节点。提供包括节点管理、可信认证、数据登记、数据交易、监管等能力。既要保持顶级节点间的联通性,又要与各个枢纽节点之间建立连接。


枢纽节点是面向省、市或者特定(多个)行业的数据流通服务能力节点。它既要与上层的顶级节点对接,又要为其负责的子网内各节点的数据流通活动提供节点管理、可信认证、数据登记、加工处理、数据交易、监管等能力,同时枢纽节点自身也应满足安全性、稳定性和可扩展性等方面的要求。


子节点是一个组织机构(如企业)对外提供数据流通服务能力的节点。既可以独立和其他子节点进行数据流通业务,也可以通过与枢纽节点对接,开展对外数据流通业务。通过接入数网可以提高其流通业务能力的可信水平。


以枢纽节点为中心,连接多个子节点,形成了区域级、行业级的可信子网;以顶级节点为中心,连接多个枢纽节点,形成了跨区域、跨行业的全国可信数网。


可信数网中承载的数据流通活动都应在对应的可信域内开展。可信域是指在同一套数据流通规则(包括管理规则和技术规则)约束下,多个参与实体相互协作、共同完成数据流通任务的节点的逻辑集合,具有自治性、域内可信、可伸缩性和可嵌套性等特点。数网节点可以根据实际应用需求,在其所属的枢纽节点、顶级节点监管下,与其他节点之间建立可信域,并开展数据流通活动。


2.流通模式


数据流通的本质就是数据怎样安全、高效、合规地从提供方流转到需求方的一个过程,这中间还会涉及提供数据加工治理、算法、算力、基础设施等的中间服务方,以及需要对流通全过程进行存证监控服务从而满足监管方的要求。


可信数网中的子节点通常作为数据提供方或需求方,提出数据应用服务需求,承诺数据合规使用,接收数据或服务结果;枢纽节点、顶级节点通常作为中间服务方和监管方,提供可信认证、数据资源目录、合约服务、算法服务、计算服务、交易磋商、结算清算以及对应的IT基础设施等,并对数据流通中各方行为进行全流程监控审计。


随着数据流通技术水平与应用需求的发展,数据流通模式也在不断扩展,可信数网能够支持两大类典型流通模式:


来源:CCSA TC601

图 3 可信数据流通模式示意图


(1)受控汇聚式。数据提供方(子节点)将原始数据或加密数据汇聚到枢纽节点提供的环境,根据数据需求方(子节点)提出的使用需求,枢纽节点提供相应的计算服务,并将计算结果提供给数据需求方。流通过程中采用例如数据沙箱、可信执行环境等技术手段保障数据的机密性、完整性,算法的一致性等。

(2)受控分布式。数据供需双方(子节点)通过枢纽节点进行磋商和约定,不进行原始数据的汇聚。各方之间采用如多方安全计算、联邦学习等方式,仅交互密文数据、计算因子或中间参数等信息,通过分布式计算的方式将计算结果提供给数据需求方。



(三)建设思路


在构建可信数网时可采用循序渐进的建设步骤。首先,应以建设枢纽节点为核心抓手,形成区域级、行业级的可信子网,实现子节点间的数据可信互通。然后,基于标准化的建设规范及互联互通协议,连通各区域级、行业级可信子网,推动跨地区、跨行业的数据流通应用落地。随着节点覆盖范围的持续扩大,落地应用场景的不断丰富,最终将形成可不断扩展、生态繁荣的国家级可信数网。


作为推动跨省市、跨区域、跨行业数据流通的主要抓手,枢纽节点是打造有价值的数据流通应用场景、构建数据要素市场的关键。根据数据流通服务的主体及业务模式不同,主要包括两种典型情况:一是地方级的枢纽节点,面向某省、市提供数据流通服务,为该地方的子节点提供统一对外接口规范和服务;二是行业级的枢纽节点,其面向特定行业提供数据流通服务,同一行业可建立多个行业枢纽节点。


目前我国数据要素流通还处于区域化和行业内流通的建设阶段。针对地方级枢纽节点,地方政府应充分发挥主导作用,结合自身公共数据的优势,以公共数据授权运营场景为导向,推进建成地方级枢纽节点;通过数据流通场景的开放,吸引地方各机构建立子节点,从而构建起地方枢纽和可信子网。针对行业级枢纽节点,可先由一家或多家行业龙头企业基于业务需求进行构建,以此带动产业上下游企业或供应链上下游企业协作共建子节点,通过业务需求的释放,激发各节点间的数据流通及业务协作,助力形成行业级可信子网。


本文节选自隐私计算联盟于“2023数据要素发展大会”上发布的《可信数据流通网络(TDN)白皮书(2023年)》。


报告介绍及全文下载链接如下:

《可信数据流通网络(TDN)白皮书(2023年)》发布!附下载链接






中国信通院云大所长期深耕数据要素研究工作,深入数据要素理论体系、制度政策、市场培育、技术应用相关话题,持续编写并发布《数据要素白皮书》《可信数据流通网络(TDN)白皮书》等研究报告;重点聚焦公共数据、企业数据、个人数据的合规可信流通实践:形成了可信数据流通、可信隐私计算系列测试与咨询服务体系。


联系人:

白老师 

18810275013

baiyuzhen@caict.ac.cn

往期推荐

01

数据要素再认识

02

国家数据局正式挂牌成立,开启数据要素新征程

03

分类推进数据要素探索已成共识

继续滑动看下一个
CAICT数据要素
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存