《数据要素安全流通白皮书》项目第六小组评审工作研讨会
当前,在数据资产快速发展的背景下,企业数据资产管理涌现了新模式,数据资产管理新技术也层出不穷。为进一步引导企业全面推进数据资产管理工作,华东江苏大数据交易中心、国家工业信息安全发展研究中心、国家金融科技测评中心三方共同发起《数据要素安全流通白皮书》编撰工作。
同时,为了推进《数据要素安全流通白皮书》项目进程、优化白皮书的内容,我们在项目初始阶段就对外征集相关领域的参编单位。截至目前,已收到参编申请表百余份,经过我们专家评审团的初阶段审核,筛选部分企业进行分组,在接下来的一周内,我们根据小组类别分别展开小组评审工作。
在4月20日下午,我们展开了第六小组的评审工作,在本场评审工作中,有以下专家和嘉宾出席。
一
【交易中心总经理汤寒林致辞】
汤寒林首先对各企业的到来表示感谢,这次的白皮书项目也受到了国家工业信息安全发展研究中心、国家金融科技测评中心的大力支持,希望本次白皮书项目能够体现行业标准。同样,汤总也表示希望本次白皮书可以帮助企业进一步提升品牌影响力、为定制行业标准做出贡献,也希望本次会议能够让大家广交朋友、有所收获。
二
【协办单位介绍】
在本次评审工作会议中,数据宝ChinaDataPay作为《数据要素安全流通白皮书》指定协办单位和编委会核心成员,全程参与白皮书项目,包括本场小组讨论,并提供全程服务支持。
数据宝首席精算师吕定海主要从公司概述、平台介绍、产品介绍和客户案例三个方面介绍数据宝,数据宝是中国领先的国有数据资产代运营服务商,致力于为国有数据资源方提供数据治理智能化、建模加工产品化、场景应用商品化、流通交易合规化等数据要素商品化全生命周期管理服务,是国内少数具备“国资参股、政府监管扶持、市场化运作、大数据资产交易合法经营资质”属性的大数据“国家队”,数据宝的平台优势有三大点:多元、合法、安全。在产品上,主要分享了大交通数据产品-货车信用宝和智慧交通,其中货车信用宝能够进行货车基础档案评估、货车行驶行为评估、货车运力评估、通行费支付行为评估、行使地域评估和货车信用综合评估,智慧交通能够基于交通大数据,对全国高速公路按时段及路段进行窗口化,基于通过的车流量、车均速度、前后门架等来对时段上的路段的负责饱和度进行监测及预警分析。数据宝已服务超过180个应用场景和近万家知名品牌。
三
【第六小组申请参编单位演讲】
在本次评审工作会议中,各参会企业依次进行公司介绍、案例分享及对白皮书的建议。
北京百度网讯科技有限公司百度安全解决方案架构师周杭
(1)AI时代面临的安全威胁
机器学习和适应人类、海量数据为机器学习提供了丰富“原料”、万物互联,AIoT全面覆盖云管端以及AI正在渗透到经济和社会的毛细血管中。
物理世界安全攸关场景下的威胁:无人驾驶、算法模型是人工智能的核心,安全隐患可能给人工智能带来致命的安全后果。
数字世界对抗样本攻击威胁:云端黑盒模型:虚假的安全感;迁移学习(TransferLearning)训练方法高效性及缺陷:利用对抗样本在不同模型间的可迁移性,对AI模型进行定向/非定向攻击;指纹攻击(Fingerpringting attack):根据极少的请求结果推测出模型的结构,导致Google Cloud Object LocalizationAPI输出错误结果(Baidu@ BlackHat Asia 2019);基于特征图的PGD算法(FFL-PGD)可欺骗Google Image Search(Baidu @ DEF CON CHINA 1.0)。
AIoT时代的安全威胁:设备劫持-隐私泄露-播放劫持-支付风险-广告劫持-云端风险。
(2)百度安全能力矩阵
行业生态安全:供应链安全、威胁情报、黑产溯源打击。
行业应用安全解决方案:4A安全、私有化部署、安全合规。
数据安全与隐私保护:生命周期安全、隐私保护检测、合规治理。
端边云融合安全:端设备安全、边缘对抗、云端防御。
云原生安全:硬件安全、计算安全、存储安全。
AI模型安全:鲁棒性检测、鲁棒性加固、深度伪造检测。
(3)开放百度安全能力构建AI安全开放生态
百度安全开放的研究:在可信安全计算、企业级web安全防护、混合内存 安全、漏洞挖掘修复、人工智能模型攻防、鲁棒性验证等多个前沿领域,拥有世界级研究成果。
对《数据要素安全流通白皮书》的编写建议和编写意向主要有以下几点:
翼健(上海)信息科技有限公司政府事务总监田冀、高级客户经理徐英凯
翼健(上海)信息科技讲述了时代背景、数据要素特性及隐私安全计算,认为数据是智能时代最活跃的生产要素,生产率提高最快、对经济增长边际贡献最大,是社会资源配置围绕的中心、企业与国家竞争力的要害,此外,讲述了数据流通面临的挑战。翼健(上海)信息科技解锁数据价值的全栈技术矩阵,其核心产品有DataWand、翼数坊XDP平台、探路者PathFinder,在解锁数据价值的路径上,核心产品有XDP联盟。
在案例分享上,介绍了厦门健康医疗大数据应用开放平台、香港科技园的AI验证平台、宜昌传染病多点触发监测和智慧化预警平台以及长三角生物医学产业大数据联盟等。
杭州复杂美科技有限公司CEO吴思进、南京本链总经理袁子
杭州复杂美科技有限公司主要分享了区块链在数据要素流通中的价值,首先是数据可信追溯,例如企业电子档案区块链存证,结合区块链实现了大型企业基于区块链的电子档案存证、验证和追溯,建立了跨系统、跨组织多方协同的信任通道,降低了沟通管理成本,为信息的互享互认奠定基础;在数据验真上,区块链验真平台提供电子文件Hash值、单份电子文件、批量电子文件等方式进行真实性验证,平台收到上传信息或文件后,经计算比对反馈验证结果。
在数据可确权上,结合去中心化身份实现数据确权,数据要素要更好的实现可流通可交易,需要结合区块链技术来鉴别数据产权的确权问题。一旦数据产权确权了,就具备了市场交易的可能性。而数据确权,需要将数据和人在区块链上实现绑定,可以通过某个人查到他拥有的数据,也可以通过某个数据查到它当前属于哪个人,甚至还需要支持查看这个数据流通历史。满足上述条件,需要由区块链的去中心化身份来支撑。
长三角数据要素流通服务平台负责人乐巍
三角数据要素流通服务平台主要分享了落地案例,在头部人工智能企业案例上,S公司、Y公司分别是在语音识别、图像识别领域的国内知名人工智能企业,每年投入数千万元采购语音和图像数据,用于标注和模型训练。随着《数据安全法》的颁布,该业务模式的经营风险不断加大。数据采购和训练是人工智能企业必备的业务环节,通过具备资质的平台进行数据流通,合法合规、流程高效、成本可控地获取数据,可以规避由此引起的经营风险。长三角采用“联盟+平台+公司”的落地模式。在与F公司的合作案例中,F公司是一家从事农渔业供应链金融科技的科技创新公司,主要业务是通过IoT设备,采集农渔业的数据进行分析,为保险公司开发新产品、评估保费、定损理赔提供依据,主要客户包括人保、安信保险等。
在业务开展过程中,保险公司要求F公司不仅提供通过算法生成的分析结果报告,也要提供IoT设备采集的原始数据,规避F公司和农渔户串通,篡改数据骗取保费的风险。为了满足该需求,保险公司的业务系统要进行大幅改动,对接IoT设备,实现数据采集、脱敏、传输、管理等一系列功能,可行性极低。而如果由F公司的系统接收数据之后提交,则又存在篡改数据的可能性,达不到保险公司的预期目的,因此该项业务迟迟难以实际落地。基于长数平台的服务,F公司的原始数据保存到可信的数据存储平台,在区块链登记。保险公司按既有的流程不变,获取分析报告结果数据,可以查看和验证存证的原始数据。
上海域乎信息技术有限公司CEO曹胜虎
上海域乎信息技术有限公司介绍了其数据要素+联盟链方案路径以及数据资产服务平台-鲸矿和联数链,其中联数链平台提供账户内服务确权、账户间交易、账户间交割和账户间赠与的4类确权证书,支持不同交易类型,不同交割方式的义务扩展。在应用案例分享上,分享了苏州区块链产业服务平台、长三角数据要素服务平台。
深圳星算科技有限公司CEO杨建兵
深圳星算科技有限公司是一家做区块链服务平台,主要致力于政企服务软件技术开发、区块链应用解决方案研究、区块链底层链技术应用开发、Star Cloud底层Baas平台和区块链技术人才培养。在区块链开发经验上,分享了政府大数据共享平台、区块链金融平台、钢贸行业区块链平台和防伪溯源平台等案例。
四
【企业代表、专家交流讨论】
在本次会议的最后,数据宝首席精算师吕定海首先基于以下几个问题与各参会企业进行探讨:
隐私技术和区块链的技术,跟整个商业应用场景怎么样能够更有效地结合,比如说我们能不能够形成一些这个标准的应用场景的,一些标准的这个技术方案。我们举个例子,比方说这个保险行业,那保险行业呢,我们知道这个每个公司呢,都认为他的这个理赔数据啊,这个是非常敏感的数据啊,不能给到外面去,只能在他们公司内部,但是话说回来,你这个有些保险公司规模很小,他拿的数据做什么风控,甚至于说做自己产品的定价都实现不了,所以实际上他是有这个诉求,就是有更大的一个数据范围能整合进来,但是你对于很多这个大的这个公司来讲呢,可能他认为我是市场份额已经占到30%,我自己的数据就够了,对吧,他不一定有动力去加入这个联盟,因为他认为它的优势就是数据优势。这些敏感数据国家法律也看的很严,导致很多事情很难推进,所以是不是可以围绕标准化的应用场景提出标准化的做法,前提也要解决技术的合规性。
此外,数据要素的安全流动首先要有动力去流动,我们怎么调动各方参与进来,包括政府。保险领域有个车险定价,保险保费跟交通违法行为紧密相关,但到目前为止,中国仅有几个省份才能拿到车辆的这些违法数据,这些公安数据很难协调,像在美国这种车辆的违法数据在定价时是必须要考虑的,所以怎么调动政府和中小企业的积极性来参与区块链或者联邦学习的平台来提高数据的流通,在整个过程解决了这种数据交易价格的机制问题,还可以有其它方面的考量。
深圳星算科技有限公司CEO杨建兵表示:大家都是给政府做外包项目,卖区块链的系统,但是卖完之后根本没有运维的能力,因为政府不会交给我们,哪怕给企业做也是同样的道理,到最后做下来也会亏本。中小型企业在这行业怎么生存,国内企业有些是不错的,和大型的生产制造型企业区块链的供应链经营做改革,采取分成制,企业会把核心业务放上去就能活得很好,但是这种企业很少。所以我也在思考,第一我们是做什么平台,做什么产品?第二赚谁的钱?赚政府的钱、企业的钱,还是去运营平台做平台去转?第三是中小型区块链企业怎么生存?包装平台的技术含量,和物联网结合去研发新专利和技术去融资,但这个不是常态,企业正常的经营状态是要盈利,但这样的企业不多。那联盟链去搞数据交易,基于某个特定行业有很多方案,例如政务方案,每个企业都有自己的政务方案,每个公司都有自己的溯源平台,对溯源统一标准体系也没有太大意义,每家公司有团队要养,统一标准的话利益层面没办法磨合,所以核心点是能不能通过大家一起沟通,在现行国内下的区块链和区块链平台,有没有新的商业营收业态。主要可能出现在应用场景,之前是政府补贴,但目前因为疫情,政府没有那么多时间精力牵头找试点型企业,所以在当前情况下,大多数中小型区块链企业怎么更好的发展。
上海域乎信息技术有限公司CEO曹胜虎表示:不管区块链选择什么技术去搭建,链上要有东西进行交易流转才有价值,数据流通对于区块链而言是很大的应用场景,数据要素在发展过程中也需要解决数据确权或确权后的授权,以及最终形成交易全过程的追溯,包括把区块链当成一个账本,怎么把这个账本公开透明,让产业的上下游看到这笔帐,是通过第三方技术手段实现的安全流通的记录,两者是存在相互促进发展的关系。刚才杨总说的问题确实是一些区块链创业公司会遇到的问题,区块链公司跟数据要素结合分为几类,第一是围绕政务场景做数据要素流通和共享的服务,去年十八个部委发布了每个部委的数据要素跟区块链试点的应用场景,包括各地交易所也用了隐私计算加区块链2.0的技术架构在进行数据流通的交易,所以区块链不管从政策方面还是国家重视角度,包括市场上认可的角度,已经成为一个数据要素流通的必要技术了。所以大家考虑的问题是走私有链还是走生态联盟的机制去搭建,联盟产业上下游大家共同去治理建设的链是更有生命力的,也是市场化的数据要素交易场景。个人数据和政务数据交易都不大可能,更有可能的还是围绕企业行业里产业上下游的数据共享、流通和交易。像有些城市已经要求这样做了,所以找这样的城市和产业的场景及当地的合作伙伴合作,把试点应用场景落地,虽然是很常规的商业拓展模式,但还是存在未聚焦实践,这也是让数据要素流通、盘活最重要的一点思考和实践。
长三角数据要素流通平台负责人乐巍表示:现在很多数据流通还是政府买单的试点行为,买单方有些是银行征信买了数据卖给金融机构,还是停留在传统的数据流通里面,但如果大家都在政府机构、金融机构里,蓝海也会变成红海,平台联盟的创新是立足于产业做创新,挖掘出新的数据应用的场景,随着产业的深耕总会产生数据流通的需求。所以第一是创新,第二是深耕,要和行业深度绑定做这些事情,通过数据流通让产业链更有效率,每家企业遵循的都是降本增效,所以如果数据流通能促进产业上下游的升级,效率提高,企业是会愿意买单的。这样数据流通也有了价值,不是为了流通而流通,所以联盟和发起方也都是抱着这样一个理念,不是说卖产品卖平台,而是通过联盟里的会员大家加入后沟通数据流通的场景,有的是技术支持方,有的是需求方,要真正把产业里的数据做深做扎实是平台的想法,之后有了创新和供应链的升级变革,数据就流通起来了,数据流通就成为了梳理这种业务的结果。不过难点第一是要深根这个产业,第二是拉下身段去服务。
数据宝首席精算师吕定海:有了更多的应用场景,系统、平台都有事情可做。
杭州复杂美科技有限公司CEO吴思进表示:去年在苏州工业园区做政务类的区块链项目,里面有几个问题,我们是区块链的技术提供方,实际上对传统业务,例如供应链金融和存证溯源了解很少,要花大量时间和精力跟专业人士沟通交流,区块链到底能解决你们什么问题,工业园区提出要数据目录共享,把数据目录放在区块链上,但是对方领导听说这个是很大没有创新性,因为数据目录已经有了,只是基于区块链做一个存证意义也并不大,把数据目录做成数据资产和交易要考虑合规性、合法性的问题,对于区块链厂家来说比较难判定是否合规合法,所以这是一个问题。特别像政务类能直接提出一个很大的话题,区块链企业就像一个小船进入汪洋大海里,感觉里面都是机会,但其实很难深入切到里面去,需要事前不断跟他们沟通交流,才能知道区块链能给他们解决什么问题。两方都不一定能深入了解,也存在一种人才的匮乏,跨界的人才还很少。
还有就是更适合从企业级的规模做出,制定企业级的标准,项目推进顺利,主要是因为他们的需求和意愿都很强,会派相应的人跟你沟通交流。区块链企业也能通过这些企业级的点,积累自己的经验。区块链和应用之间要更多的磨合,才能更好的解决实际的问题。
翼健(上海)信息科技有限公司高级客户经理徐英凯表示:更想让数据流通有一个市场化的行为,在实际场景中,数据能利用起来,但离市场化距离还较远,可以做到给政府的数据和模型做应用,还是没有利用市场的反馈给政府创造营收,所以政府没有很大兴趣,还是处于政府投入行为,因此支持力度不大,所以要考虑更多的方向和应用场景。
01 |
02 |
03 |
04 |