其他
数据作为数字经济时代核心的生产要素,已经成为经济增长的动力引擎。近几年,随着国家相关数据安全法规的陆续出台,数据安全被提升到了一个新的高度,甚至上升到国家战略层面。大数据作为企业数据资产的主要载体,是数据安全能力落地的关键,同时伴随着使用场景复杂和技术多样性等众多挑战。本文分享以货拉拉大数据平台的实际落地经验为基础,结合真实案例,系统的阐述大数据场景下的数据安全体系建设实践和方法论思考,包含了覆盖数据全生命周期的安全规范建设、安全能力建设和系统治理三方面内容,重点讲解数据使用场景、技术挑战难度下的数据(数据库表、数据报表、数据指标等)分类分级、数据的分级使用和加密存储、数据灾备等实践思路,最后全面的建设落地数据安全体系,提升数据安全能力成熟度,保障公司数据安全。分享大纲:1、背景和挑战2、大数据安全体系3、总结与思考背景和挑战货拉拉是一家互联网物流商城,提供同城/跨城货运服务,涵盖从面包车到17.5米货车多种车型,用户一键呼叫,司机实时抢单;企业版提供月结账期、定制配送等服务;零担物流,提供直达全国、门到门的长途物流运输服务;汽车租售,满足司机和企业租车购车需求。目前,货拉拉拥有6个以上的业务线,包含跨城、零单、物流以及搬家等。在大数据层面,货拉拉包含了3个IDC,是一个跨云、混合云的架构,包含阿里云、华为云以及一些自建的机房。机器数包括存储量和日均任务数,在业界属于中等的位置,在快速发展中。大数据的使命是驱动业务数智化,助力公司业务持续增长。而大量的数据存储会对我们的数据管控和数据安全带来一定的挑战。上图是货拉拉的大数据体系,自底向上,分别是基础层、接入层、平台层&数仓、服务层、应用层。基础层和接入层提供最基础的存储和接入的能力。在平台层&数仓层,包含数据研发平台、数据治理平台、数据资产。在服务层,面向服务场景开发的大数据应用,包含数据应用支撑服务工具、数据服务工具、数据智能支撑工具。在应用层,有辅助决策类应用和赋能业务类应用。整个大数据体系是相互依赖、相互支撑的体系。数据架构自左向右分成数据采集、数据存储和计算、数据应用三个层面。通过数据采集将日志数据、埋点数据、交易类数据集成到大数据平台,先做好数据存储,然后通过实时和离线链路进行数据加工处理,针对实时和离线,我们分别建立了一个数仓体系,最后将加工好的数据会推送到数据应用里面。货拉拉为什么要做大数据安全?一是因为数据资产保护的要求,二是因为个人信息保护法、网络安全法、数据安全法、数据安全管理办法等法律法规的要求。大数据安全面临着众多难点和挑战,货拉拉的数据资产类型多,