傅一平点评:信通院给了当前大数据技术的十个热点,分别是:新型数据库、图计算平台、数据中台、DCMM、数据估值、DataOps、隐私计算、数据要素政策、数据安全合规及数据分类分级,具体介绍见正文。基于我自身的实践,给出八个看法,有些东西不了解就随便说几句,大家看看就好:1、图计算平台应用价值很大,但普及水平太低,企业大量价值业务场景没有被挖掘,技术挑战也挺大,开源的免费的在大规模数据面前不太行,商用的能打的国内成熟产品不多2、数据中台的理念很好,推进了企业数据仓库的普及,但数据中台重在业务和数据,因此商用化产品的钱途并不是很好3、DataOps是大数据领域的DevOps,DataOps不是光靠一个产品就能打造的,其能否融入企业的平台、数据、应用生态是成功的关键,DataOps是数据开发体系的数字化转型,核心是流程重构4、隐私计算给大数据变现打开了一扇窗户,在新安全背景下成了推动数据要素流动的核心技术手段,甚至是唯一的手段,其应用已经从探索走向了真正的商用,但还是有大量的技术问题需要解决5、数据要素政策逐步向基础性制度的建立发力,数据产权、流通交易、收益分配、安全治理这些以前充满争议的课题终于要建章立制了,我对此充满期待6、数据分类分级是达成数据共享开放和数据安全合规平衡的主要手段,在“三法一条例”的背景下,没有数据分类分级的精细化管理,数据应用创新举步维艰7、DCMM的意义不仅在于客观评级,更在于大家都希望通过DCMM这个平台能学到或借鉴到其它行业的真功夫,在这方面DCMM还有很多的事情要做8、新型数据库(AI数据库、Serverless云原生数据库、防篡改数据库、全密态数据库)都没用过,也不太懂技术细节,除了Serverless云原生数据库,我在想,为啥一定要研发新的数据库呢,能否在原有数据库上升级一下就基本能用呢,我不需要性能非常极致,大致可以就行了,否则我的投资怎么能得到保护呢?正文开始为进一步加速推动我国数据智能转型进程,推动“十四五”期间数据智能产业交流与合作,由中国信息通信研究院、中国通信标准化协会指导,中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)主办的2022大数据产业峰会于6月28日在京召开。在峰会主论坛上,中国信通院云大所所长何宝宏发布了《2022大数据十大关键词》。以下为演讲实录
大家好,我是中国信息通信研究院云计算与大数据研究所何宝宏,今天很荣幸,由我来为大家发布2022大数据十大关键词。大数据十大关键词是基于我们长期对于产业的研究观察,以及与一线专家的研讨交流完成。如图所示,本年度十大关键词涉及数据从计算机语言到成为生产要素的全生命周期,包括:(1)【数据资源化】,即数据从计算机语言到成为可被人类识别的信息(2)【数据治理】,即将散乱的、庞杂的数据进行归类、整理、管理(3)【数据资产化】,即将数据与货币进行对应挂钩,
(4)【数据开发应用】,即加工数据使其为业务赋能,
(5)【数据流通】,即完成数据在部门与部门间、机构与机构间进行点对点的合规交换共享,
(6)【数据要素市场】,即促进全社会按照统一规范的制度、体系完成数据的合规流通利用,
(7)【数据安全】,即保障数据流转的全生命周期符合相关法律法规。以下我将按顺序一一介绍。
关键词一:创新型数据库优化数据资源化过程数据库作为支撑数据存储、计算的核心技术产品,为了适应数据要素相关需求,正快速进行技术革新。一方面AI数据库、Serverless云原生数据库推动对于数据的价值挖掘从“阳春白雪”变为“下里巴人”。利用数据不再是金融、电信等数据密集型行业的特色,而是变成全社会、全行业的普适性行为。这导致数据的加工利用过程需要更加平民化、高效化。AI数据库具备自动运维、智能开发等能力,Serverless云原生数据库具备按量计费、弹性扩容等能力,均可实现数据加工利用过程的降本增效,正成为甲骨文、亚马逊、阿里、华为等巨头供应商的研发热点。另一方面防篡改数据库、全密态数据库支撑数据完成高效确权定价、便捷合规流通。防篡改数据库在高效存储计算基础上,提供数据防篡改和操作防篡改功能,从而支撑数据确权定价,而全密态数据库能够实现数据在加密状态下的高效存储和计算,从而支撑数据合规流通。两者均成为MIT等学术机构的研究热点,以及华为、阿里等供应商的研发热点。关键词二:图计算平台助力大规模图数据资源化图数据与传统行列式数据不同,它通过点、边模型,高效描述实体、属性、关系的数据模型,近年来被广泛用于企业智能营销风控等必要数据应用中。随着行业数据智能转型的深入,图数据在数据总量中的比例也正在快速上升。Gartner预计,到2025年图技术在数据和分析创新中的占比将从2021年的10%上升到80%。随着图数据规模的变大,开启了图数据的“大数据”时代,起源于80年代的传统关系型数据库,以及起源于2000年左右的专用图数据库已经无法支撑大规模图数据的高效存储与计算。图计算平台通过抽象计算层和集成层,在图数据库基础上增强了兼容性和大规模数据计算能力,实现了多种存储介质中图数据的高效汇聚以及多跳情况下的复杂计算能力。目前该领域政策扶持力度不断加大,开源体系发展迅猛,商用产品层出不穷,从而快速支撑了图数据这一重要要素类型的价值释放。关键词三:数据中台成为企业挖掘数据要素价值的核心引擎随着企业数字化转型的加深,数据相关系统、组织逐渐复杂、冗余,壁垒逐渐增多。为在组织或企业内部构建一套可复用的数据和分析能力,减少数据本身及相关技术架构的冗余,打通不同系统数据间的壁垒,数据中台应运而生。其理论体系从发展初期的“百家争鸣”,逐渐聚焦和明确,并在业内达成共识,即数据中台构建了数据资源与业务价值间的骨干网,是“企业数智化转型的核心引擎”。近年来,由于数字化转型政策的持续推动,数据中台发展迅猛,Gartner在成熟度曲线中将其标记为期望值最高。国内该领域供给侧迅速发展、供应商不断丰富,除概念提出者阿里巴巴外,华为、腾讯、网易、星环等大数据企业纷纷入场。应用侧相关落地案例迅速增多,中国移动、中国联通、工商银行、农业银行等大型央企、金融机构以及各地方政府纷纷立项招标,并形成自身实践案例。关键词四:DCMM贯标引领行业数据治理DCMM是我国数据管理领域的首个国家标准,为企业数据管理工作提供客观的评价依据,指导企业体系化构建数据管理框架、持续优化数据管理能力。经过近3年时间的发展,DCMM已得到广泛认可,贯标评估的工作成效正加速显现。在数据要素统一大市场的培育过程中,DCMM贯标评估可以提升各类市场主体的数据能力和数据活力,弥合地区间差异、拉齐行业间水平,扩大数据资源优质供给,从而提高数据要素流通效率,引导数据资源的高效积累和有序聚集。为持续推动企业数据管理能力提高,工信部印发“企业数据管理国家标准贯标工作方案”,全国各地配套产业补贴政策,推动重点地区、重点行业的贯标评估工作,预计到2025年,贯标评估企业超1万家,宣贯培训人员超15万人。
关键词五:数据估值成为数据资产化切入点数据估值探索历程伴随着企业数字化转型的发展而发展。Gartner于2015年提出信息价值评价框架,从信息内在价值、信息商业价值、信息绩效价值、信息成本价值、信息市场价值、信息经济价值六大维度进行衡量。但是,这一框架多停留在理念层面,仅明确了主要影响因子,未提出具体的测算指标和方法。中国企业的全面数字化转型大致始于2015年,并在2017年后进入爆发期。企业在意识到数据价值的同时,投入了巨大的人力、物力和财力,因此,亟需一套估值指标清晰量化数据价值,评价数字化转型的成效。自2021年初起,光大银行、南方电网、浦发银行等企业陆续进行数据估值的研究与实践。但是我们也应认识到数据估值仍处于发展初期,估值目的、估值框架有待在具体场景中探索验证。我们在分析业界数据估值的成果后,认为可以将数据产品作为估值对象,而估值实际上是在衡量数据对于业务发展贡献的间接经济价值,以及将数据视为商品进行交易获得的直接经济收益,因此,数据估值是一项涵盖了数据管理、数据应用、数据交易、AI建模的综合性工作。下一步,我们诚邀大家与我们共同探索数据估值的方法,提高数据人员的价值感,为数字化转型指明方向。关键词六:DataOps定义数据开发应用新模式DataOps的概念最早在2014年由国外学者提出,随后业界逐步对其内涵进行补充。其在2018年正式被纳入Gartner的数据管理技术成熟度曲线当中,由此进入了国际的视野当中。2022年中国信通院正式牵头启动了DataOps的标准建设工作,以此为基础推动我国大数据产业的多元化发展。DataOps作为协助企业完成数智化转型的良药,供给侧和需求侧都在争相尝鲜。厂商中,诸如腾讯、阿里、亚信、海南数造等公司纷纷采纳DataOps的理念构建新一代数据研发工具平台。企业中的一些头部机构,例如工商银行、农业银行、中国移动等也在对DataOps进行实践,并取得了不小的成果。在标准化方面,今年信通院牵头联合各行业30余家单位开展标准制定工作。标准包括了7个模块25个环节,旨在推动我国数据文化扎实发展。关键词七:隐私计算一体机助力数据要素流通破局今年是隐私计算落地应用元年,多个场景应用加速落地,隐私计算一体机为应用开辟新路径。一是作为软硬结合一体的专用设备,利用硬件特性增强软件实现方案,其安全加固、性能加速和易用性增强的三大优势,使得隐私计算一体机从众多工程优化方案中脱颖而出,降低用户使用技术门槛和综合成本。二是一体机的技术实现方式不唯一,各家产品百花齐放。可基于可信硬件或加密卡,同时利用计算加速卡或网络加速卡,也可预装应用服务场景组件,组合方案多样化。多硬件多角度组合提升成为软硬结合发展趋势,并在金融政务医疗等场景崭露头角。三是产品形态多样,标准化需求迫切,国内外已有多个标准带头规范技术研发和应用。但也值得注意,并非仅有隐私计算一体机可以突破应用瓶颈,扩大应用规模,面对数据安全流通巨大的需求,我们仍要继续探索更多好用易用的落地方案。关键词八:数据要素政策从宏观到落地今年年初,十四五数字经济规划、要素市场化配置改革方案两份文件对数据要素的专门布局,让数据要素领域的探索再掀热潮,政策推进、产业实践都在不断深入、不断创新。一是顶层设计逐步细化,国家站在全国统一大市场的高度对数据要素发展做出安排,又针对深圳示范区的数据要素市场准入做出具体部署,数据基础制度体系建设也在加快推进。二是地方法规陆续出台,目前已有十九省市公布了相关数据条例,以促进数据利用和产业发展为基本定位,多以公共数据为抓手,结合地方实际和特色进一步激发市场主体活力。三是交易模式不断创新。各地数据交易所优化经营结构,贵阳制定交易规则、上海建设数商体系、深圳打造开源社区等探索让数据交易有了更实在的依托。但是我们离数据要素价值的充分释放还很远,数据权属、定价的共识还未建立,数据泄露、越权滥用等问题加剧人们的不信任感,如何建立有效的规则体系和监管机制,如何利用前沿技术破解难题,仍需政产学研用各界共同发力。关键词九:数据安全合规整体迈入新阶段随着2021年两法的颁布实施,各行各业的数据安全监管力度不断加强,合规工作也迈入新的阶段。首先,为了正确理解监管内容,有效落实监管要求,各行各业广泛掀起了政策法规的学习浪潮。其次,数据分类分级作为数据安全领域的重要工作,也是实现精细化安全管理的必要能力,同样成为这一轮学习热潮的重点关注对象。再次,为推动本行业企业数据安全的贯彻落实,部分行业主管单位启动监管报送工作。最后,在供应侧市场,部分企业开始着手开发合规管理工具,以协助需求方实现监管应对的自动化实现。关键词十:数据分类分级在数据安全治理中率先落地数据分类分级作为数据安全工作的基础内容,是数据安全精细化管理的必要前提,需要在数据安全治理工程中率先落地。凭借在方法论共识、行业细化、工具开发等方面呈现的发展态势,数据分类分级同样上榜十大关键词。首先,分类分级作为《数据安全法》明确提到的概念之一,引起地方、行业、企业的研究探讨,并逐渐形成从建立组织保障到落实对应级别数据安全管控策略的“七步走”方法论共识。其次,为指导企业分类分级工作的推进落实,各行业通过制定标准规范,明确分类分级工作的原则、方法、定义,进一步细化相关要求。最后,自动化分类分级工具或咨询服务在数据安全供方市场蓬勃发展。据中国信通院“可信数安”评估体系统计,2022年分类分级工具或服务的参评企业从2021年的4项增加至14项。以上就是2022大数据领域十个关键词。最后,我们对其进行归纳总结,发现他们涵盖政策、理念、安全、技术等支撑数据要素价值释放的方方面面,这些关键词所涉内容的快速发展,进一步印证了我国数据要素市场在快速发展过程中,已逐步构建起政策引领、理念先行、技术支撑、安全护航的健康发展格局。好的,今天我为大家分享的2022十大关键词就到这里,未来信通院云大所将持续跟踪、研究大数据领域各类政策、技术、产业动态,并及时与产业同步,进一步推动产业发展。谢谢大家!来源:大数据技术标准推进委员会
【PPT】我在高中讲大数据 by 傅一平
为什么达不到这五个境界,就没资格称理解了业务
数据驱动业务的18个有效策略
新人和老人关于数据思维的50个区别
【漫画】为啥客户都喜欢聊大数据?
我们有多少机会将数据、信息、知识转化为智慧?
有一种信息化的死敌,叫数据打通!
数据中的商机
大数据的过去、现在和未来:万字长文解读《大数据四十二条》
点击左下角“阅读原文”查看更多精彩文章,公众号推送规则变了,如果您想及时收到推送,麻烦右下角点个在看或者把本号置顶!