【金猿案例展】浙江省统计局大数据应用中心——隐私计算赋能政务数据跨域安全共享与融合计算
金智塔科技案例
本项目案例由金智塔科技投递并参与“数据猿年度金猿策划活动——《2022大数据产业年度创新服务企业》榜单/奖项”评选。数据智能产业创新服务媒体
——聚焦数智 · 改变商业
近几年,国家先后发布多个政策文件,要求建设协同高效的数字政府;并开放政务数据,赋能数字经济发展。但另一方面,为保护个人隐私、保障国家信息安全,政府也出台了一系列法律法规,旨在规范和整治数据信息非法泄露、滥用等乱象,数据流通合规要求不断提高。因此,各级政府面临着数据开放和隐私保护之间难以两全的局面。
随着数据合规监管趋严,以及数字政府建设不断深入。隐私计算技术安全合规打破了政府各部门间数据孤岛,实现了数据可用不可见,正成为政务数据安全共享和融合计算的关键核心技术。
实施时间:项目开始时间:2021年11月
中间重要时间节点:2022年05月
项目完结时间:2022年08月
应用场景项目实现了浙江省统计局、浙江省经信厅、嘉兴市发改委等多个政府部门内外部千万级数据安全共享和融合计算,相继成功应用到省市多个政府部门的具体业务场景,如:亩均论英雄联合隐私统计、企业经营状态智能查询、新业态从业人员群体识别和预测、双碳数据隐私计算、共富指数联合预警等。
场景1:亩均论英雄联合隐私统计
在省统计局侧部署数据融合计算平台的调度节点和子节点,并在省经信厅部署数据融合计算平台的子节点。通过数据融合计算平台中联合统计模块中的自助查询功能,创建省统计局与省经信厅的联合任务。运行该联合计算任务,可得到企业亩均论英雄各指标与年度基准值的比值。将平台所得结果下载,进行汇总计算,即可得到各企业的亩均论英雄的评分结果。
场景2:企业经营状态智能查询
在省统计局侧部署数据融合计算平台的调度节点和子节点;在杭州征信部署据融合计算平台的子节点。通过数据融合计算平台中联合查询模块中的联邦求交功能,创建省统计局与杭州征信的联合任务。运行求交任务可得到在营企业名单和非营企业名单。将平台所得结果下载,按行业进行分组,可得到在营和非营企业在各行业的分布,用以核查分析。
场景3:新业态从业人员群体识别和预测
在省统计局侧部署数据融合计算平台的调度节点和子节点;在浙江移动部署据融合计算平台的子节点。通过数据融合计算平台中建模功能,创建省统计局与浙江移动的联合建模任务。以浙江移动信令、通话行为等数据为依托,结合统计数据,通过对外卖员行为特征的分析,提出一种基于XGBOOST决策树算法对外卖员行为进行预测的方法,根据外卖员判定条件,达到对外卖员群体的精准识别。
面临挑战该项目主要实施难点体现在部署和性能两个方面。
在部署方面,本项目涉及的节点众多,且各自的基础设施和网络差异较大,部署实施面临较大困难。本项目节点分为横向和纵向两个维度,横向维度包括:统计局、经信厅、税务以及外部的征信公司等,纵向维度涉及省、市、县三级的打通。横向和纵向两个维度的基础设施、网络情况各不相同。在基础设施方面,有的机构是提供虚拟机,有的机构是基于容器化底座,有的需要适配机构的已有数据库。在网络方面,不同机构具有不同的网络策略、四层和七层代理方案。这些复杂性给项目部署实施带来很大的困难。我们采取service mesh技术,将跨机构网络打平,对上层应用屏蔽网络复杂性,使得上层应用的部署运维更加简单、可扩展,将节点部署的耗时由原来的两周缩短至1.5天。
在性能方面,本项目面临的问题是节点之间专线带宽有限,且各节点的计算能力差异较大,这给算法设计带来不小的挑战。针对带宽受限的问题,我们利用机器学习容错性的特点,在保证算法安全的前提下,通过模型压缩、量化、近似拟合等手段,平衡模型精度和性能。针对各节点计算能力差异较大的问题,我们调整算法设计,利用同态加密技术,将计算平衡至算力较强的一方进行计算。
数据支持
在统计基层数据共享场景,突破性的实现基层数据安全共享,累计共享5600万。
技术解决方案
数据融合计算平台基于“金智塔隐私计算平台”的成熟框架开发,采用多方安全计算、联邦学习和区块链等技术,打破政府部门间的“数据孤岛”并安全接入社会商业数据,构建省市县三级一体化横向、纵向的数据要素流通体系,在保护数据隐私安全的前提下,激发政务数据的应用价值,最大限度造福社会。
数据融合计算平台提供基层数据共享、联合查询、联合建模、联合统计等服务,安全合规融合统计局、征信公司、电力公司、发改委、经信厅和中国移动数据,实现数据可用不可见、用途用量安全可控;提供存证审计功能,数据使用可查可溯源;保护数据的隐私、保障数据的安全,实现数据的多跨安全共享和融合计算,助力提升政府的治理和服务水平,促进社会经济的发展。
关键技术路线
多方安全计算:需要使用两个或两个以上部门的数据,开展多方数据安全计算,如联合查询、联合统计和联合建模等工作。适用于多个部门的原始数据均不允许出域的应用场景,需要在多方部署子节点。
联邦学习:一种分布式机器学习技术,可以在多个分散的节点上训练算法,而不需要交换本地数据。联邦学习由一个中心服务器聚合本地训练得到权重或梯度,更新全局模型。联邦学习性能较好,适合大数据量下不要求算法可证安全的场景。
区块链:区块链是一种分布式账本技术,由不断增长的记录列表组成,这些记录使用加密技术安全地链接在一起。区块链是不可逆的,一旦记录下来,任何给定块中的数据都不能在不更改所有后续块的情况下更改。因此,区块链技术在隐私计算场景非常适合对操作进行存证、审计。
在亩均论英雄联合隐私统计场景,运用数据融合计算平台中联合统计的自助查询功能,创建并运行省统计局与省经信厅的联合任务,可得到企业亩均论英雄各指标与年度基准值的比值。
在企业经营状态智能查询场景,使用数据融合计算平台中联合查询模块中的联邦求交功能,建立并运行省统计局与杭州征信的联合任务,可得到在营企业名单和非营企业名单。
在新业态从业人员群体识别和预测场景,运用数据融合计算平台中建模功能,创建省统计局与浙江移动的联合建模任务,采用基于XGBOOST决策树算法进行预测,实现对外卖员群体的精准识别。
商业变化
在统计基层数据共享场景,突破性的实现基层数据安全共享,累计共享5600万次;在企业在经营状态查询场景,核查效率提高10倍以上,准确率从85%提高到96%,并极大节省了人力;在亩均论英雄场景,应用隐私计算技术,较大的提高政务工作效率:由原来耗时2天,到现在只需130秒,节省了大量人力,并减少企业报送50712次,环比减少50%以上;在新业态从业人员群体识别和预测场景中,利用隐私计算技术,创新性的完成了高实时、高精准识别从业人员。
融合计算平台响应了国务院《关于加强数字政府建设的指导意见》、浙江省人民政府《关于深化数字政府建设的实施意见》等政策文件,构建数字化、智能化的政府运行新形态,推进公共数据、社会数据融合应用,促进数据合法有序流通利用,避免了公共数据泄漏的风险,并落实了浙江省“最多报一次”的政策要求。
作为浙江省首个省级政务数据隐私计算平台,为政务数据的安全共享、融合创新应用积累了丰富经验,具有强烈示范效应,已获得中国信通院2022大数据「星河(Galaxy)」隐私计算标杆案例。近期,浙江省人社厅、国家电网等部门已提出新的业务应用需求,其中包括“困难补助人群智能监测”、“电力能耗数据质量校验”等,将进一步加快政府数字化数据要素流通与应用,助力浙江省建设数字政府。
相关企业介绍
·金智塔科技
金智塔科技是由浙江大学人工智能研究所和浙江大学金融科技研究院联合孵化的隐私计算服务商,为政府、金融机构、大型企业等提供安全高效的隐私计算产品和数智化解决方案。
作为国家高新技术企业,金智塔科技拥有40余项发明专利和软著,通过CMMI3、ISO9001、ISO27001认证,参编数据要素流通与隐私计算相关标准40余项,承担多项国家和省部级重点研发项目,并入选杭州市海外高层次人才创业计划。金智塔科技由斯坦福大学访问学者、浙江大学人工智能研究所博导创立,核心团队来自浙大、阿里,具有突出的技术创新能力和丰富的运营经验。
在国家重点研发项目(NO.2018YFB1403001)支持下,金智塔科技自主研发的工业级隐私计算平台融合了多方安全计算、联邦学习等技术,对接了大量的征信、房产、发票、运营商、物流、知识产权等权威数据,可基于不同业务场景提供多层次产品和服务。平台通过了央行国家金融科技中心、工信部中国信通院等权威机构的评测认证,并成功应用在数字政府、智慧金融、智慧企业等领域。
·浙江省统计局大数据应用中心
浙江省统计局大数据应用中心是浙江省统计局下属机构。主要职责包括:开展统计大数据研究、开发与应用,推进大数据与统计工作深度融合,承担《国家统计局浙江省人民政府共建统计大数据应用中心合作协议》确定的统计大数据应用与开发平台的共同建设任务,承担省政府统计大数据和国家统计大数据的共享与利用,承担全球平台亚太区域中心大数据和全国统计大数据的挖掘与分析,承担统计大数据能力建设相关工作等。
《2022中国企业数智化转型升级服务全景图/产业图谱2.0版》
❷ 创新服务企业榜
❸ 创新服务产品榜
❸ 最具投资价值榜
❺ 创新技术突破榜
联系数据猿