查看原文
其他

干货丨数据基因的逻辑与信息资源管理的“二次革命”

2017-03-11 朱娇娜 电子政务智库

信息是人类社会发展的三大战略资源。习近平总书记明确提出,推进国家治理体系和治理能力现代化,信息是国家治理的重要依据,要发挥其在这个进程中的重要作用,要以信息化推进国家治理体系和治理能力现代化,统筹发展电子政务,构建一体化在线服务平台,分级分类推进新型智慧城市建设,打通信息壁垒,构建全国信息资源共享体系,更好用信息化手段感知社会态势、畅通沟通渠道、辅助科学决策。然而社会公众对信息的认识还非常单薄,与此同时,以大数据为主的新一代信息技术正在冲击和重塑当前时代资源观,带来一系列的资源管理问题。


国脉数据基因系统针对我国当前大数据建设中需要迫切解决的问题,自主设计开发数据管理的体系架构,提供数据元标准化管理、信息资源模板生成、信息资源目录管理、信息资源模型设计、信息资源关联分析等重要功能,为信息资源管理带来革命性变化。


NO1从历史和全局战略认识信息资源管理


20世纪70年代,以诺伯特·维纳(N.Weiner)为首的美国哈佛大学研究小组提出了著名的资源三角形,“没有物质,什么也不存在;没有能量,什么也不会发生;没有信息,任何事物都没有意义”,物质、能量、信息是共同构成现实世界的三大要素。


为什么信息能够居于如此的并列高位,首先在数量上,信息的量和物质的量是完全可以等量齐观的,一个原子很小,但是描述一个原子的信息要很多。举一个直观的例子,目前桌面终端和用户终端是亿次级,再过几年就是千亿级,存储和计算能力从G级到T级、P级、Z级,每一个概念的提出都代表一个数量级的增长。


再者从质量上看,手机地图能够实现导航,支付宝和互联网金融可以快速发展,波音成为世界上规模最大的飞机制造公司,都离不开背后拥有的信息资源。


然而,这一理论在中国一直没有得到良好的实践支撑。从历史和全局的发展角度看,信息资源管理已经经历了三个发展阶段,从文书记录的传统管理模式,到依托计算机的技术管理模式,再到目前的信息资源管理模式。


下表围绕核心概念、重要驱动、主要特征、管理内容、组织地位等对不同阶段的管理模式做了简单的对比分析。可以发现,不同时期的管理模式都是适应时代发展的要求而出现的,信息作为一种资源,在当时都发挥了积极的作用。但是从其本身所蕴含的价值来看,其作为一种生产要素或经济要素的价值还远远没有被开发出来,这也就是为什么大多数人还没有建立起对信息资源应有的认识。


▼表1.  信息资源管理的发展历程


NO2从问题和价值导向直面大数据时代信息资源管理难题


数据正在重塑当今时代资源观。不同于能源和物质具有不可复制性,并且在使用过程中是不断消耗的过程,信息资源在传递和应用的过程中是被不断赋予新的价值。大数据是数据积累到一定规模后引发的质变,更接近把握信息资源的本质,能够大范围地消除信息不对称的现象,释放巨大的生产力,促进产业间的跨界、融合和颠覆,提升国家治理水平。数据资源的价值凸显,数据的多寡、好坏、开发利用能力的强弱已经直接影响到了组织运营和创新服务能力。因此,在看到大数据关键技术以及核心技术等方面的短板和不足的同时,更要正视的是中国大数据发展过程中亟待解决的突出问题。


首先是大数据4V特性引发的一系列问题。“大量(Volume)、多样(Variety)、快速(Velocity)、价值(Value)”的信息被大量地创造,对信息资源管理在统一标准规范、实时精准管控、深层价值挖掘上带来巨大挑战。具体表现在:


  • 大数据引发信息超载问题,近年来数据量呈指数级增长,信息资源呈爆炸式激增,海量数据使得寻找所需的信息如大海捞针般困难,其中非结构化的数据信息达到85%左右,给信息资源统一标准和规范的建立带来麻烦,使得体量庞大的结构化和非结构化的信息资源处于无序组织状态。


  • 大数据冲击信息发布的权威性,由于数据来源多样,不同系统间的描述不一,且进入系统后的数据大多没有经过清洗比对或是清洗的粒度过粗过细导致价值密度较低,加上数据产生过程中的动态性和交互性,使得利用信息驱动决策的成本和复杂性与日俱增。


其次是大数据的价值链断档。大数据的核心应用价值不在于数据本身,第一个价值链应该是解决问题,利用数据驱动管理模式的转变、营销模式的创新、IT系统架构的变革等,为政府和企业战略决策提供重要的依据。但是,大部分政府和企业积累的数据资源并没有为社会很好地利用,造成极大的社会资源浪费。究其原因,有以下几方面:


  • 传统粗放式信息资源管理的限制,大量数据信息仅仅是存储下来,缺少信息的甄别、分类、整合和加工,无法及时有效的对信息资源进行提取、集成和分析,整合度非常低。


  • 对大数据的认知还只留于表面,未对大数据特征以及大数据给信息资源管理带来的难点没有形成深度认知,无法有序组织和管理结构复杂、大量、实时、潜在价值高的数据信息,导致信息资源的有效利用率偏低。


  • 缺乏数据治理体系化建设,数据治理尚处于初级阶段,大多只是做了简单的数据质量检查、数据归档、数据安全等分散性的数据处理工作,没有形成数据治理方法论,数据作为核心资产来运作的理念还未真正形成。


最后是现有体制机制的桎梏。大数据自身属性特征决定了其和传统数据有着本质上的区别,然而在现阶段的信息资源管理中,从信息采集到信息运用都远远落后于现代化管理的需求,传统的管理思维仍然禁锢着信息管理的方式。这主要是有内外两方面的原因造成的:


  • 对内是管理机制体质的限制,目前大多数政府或企业基层部门未配置专业的信息人员队伍,未设立专门的信息资源组织机构,使得信息资源采集出现空白,资源标准不一造成数据和信息不能在部门间及时且完整地传递与交流,同时由于组织体制和队伍建设方面存在的问题,直接导致了信息工作中调研决策等主要职能的偏离。


  • 对外是共享开放生态的呼唤,鲜活的数据才有价值,信息资源管理的创新无法靠政府单打独斗或是一家公司大包大揽,而是要用“互联网+”思维,连接起政府、企业、公众,调动一切可以利用的资源和力量,构建基于大数据创新和应用的开放生态,才能在大数据生态下共生共赢。


NO3国脉数据基因带来信息资源革命


革命是指重新建立主体的核心性,首先改变的是基础,其次是扩大影响范围,同时影响原有的发展方向或者引起结构的巨大变动,最终颠覆原有的体质机制。就好比一个圆的中心,由于半径的改变,其位置、大小、周长、作用都发生了改变。国脉数据基因系统通过揭示数据的内在规则,形成数据管理和应用的工具产品,以有效支撑数据开发利用规范管理、共享开放和价值提升的数据生态系统建设,对于信息资源管理来说是一种筑基的革命性改变。


(一)重构建设基础:信息资源生产机制的颠覆性转变


优质的数据基因从构建数据标准化开始。大数据的本质、核心和基础是数据本身,所有的变革、作用和革命性影响都要依赖于信息的数量和质量。要真正充分利用大数据,核心问题是解决非结构数据的结构化。通常有两条路径:根据数据本身内涵的结合意义来做,或是根据应用来做,这两者都需要确定单元和标识,让数据按照定义的单元和标识进行结构化。


解决数据体系底层核心问题。国脉数据基因系统针对部门间信息源多头采集,重复采集,数据命名、类型、格式差异,数据定义不一致,技术多样化等问题,围绕信息资源采集需求,筛选出各部门共性、关键的主数据,建立涉及核心数据的字段池,对字段的命名、格式、长度等属性进行规范,依托数据元池进行信息资源信息项的编目,实现共性数据元的统一标准规范,使各部门在信息化建设中能够做到有章可循、标准统一,避免出现信息混乱、数据孤岛等现象,从底层上解决问题。其中,数据元标准以业务数据为出发点,经过详细的数据调研、访谈、设计、评审等严格的标准定义流程。


提供全生命周期数据标准服务。国脉数据基因系统为信息资源从采集、存储、使用提供全生命周期的标准化服务,可持续维护的策略避免数据标准停留在初始定义的状态下。当业务发生变化时或各部门、各应用系统中出现相同的、近义的数据字段,通过分析其频率、数据定义及数据相互之间关系(数据来源、数据流向等),同步修正或完善数据标准,辅助数据质量问题分析。


(二)扩大影响范围:信息资源管理能级的实力跃升


数据信息逐渐成为重要战略性资源,拥有的数据信息越多,能够挖掘分析获取的潜在价值就越丰富,信息化建设投资回报率就越大。在这过程中,需要把关好内外部数据的采集、管理、分析和应用过程,才能落到实处。


全面规范数据来源。国脉数据基因系统提供资源库模型设计功能,为基础数据库、主题库建设提供支撑,实现自主设计城市资源库结构、信息资源关联、库结构的展示及导出,重点是对核心数据提供数据模型实体、属性及其关系,对城市或企业运营管理和管理过程中涉及到的业务概念和逻辑规则进行统一定义,构建单一、准确、权威的数据来源。


提升信息资源管理能级。国脉数据基因系统提供目录管理功能,按照分类规范、数据元标准、元数据标准,对元数据、数据元、信息资源、业务信息进行动态化管理,实现信息资源管理的动态化、精准化、全面化、账目化,能清晰、动态、直观的掌握城市数据资源全局情况。围绕信息资源业务及相应的软硬件,构建城市信息资产清单,定位业务—信息资源—应用系统—服务器—机房(云)。同时结合信息资源,提供梳理服务、标准规范制定、绩效考核指标设计等系列咨询服务,全面助力资源管理能级的提升。


(三)改变发展方向:从信息集成者到资源价值挖掘者


传统信息体系以网络和系统为主,关注点集中在流程和业务逻辑再造。新型信息体系更关注数据流动性和数据价值利用,遵从信息流动的内在逻辑,提升数据采集和加工能力,发挥数据最大价值。依托国脉数据系统,数据管理机构的职责将不再是单纯的数据采集者,而是信息资源价值的挖掘者。


显著提高工作效率。国脉数据基因系统提供智能化配置服务,根据实际需求,可自定义设计数据元、信息资源的目录元数据,自配置相关选择字段的字典,同时提供相关基础库、主题的模型设计功能,实现不同应用场景下,通过信息资源的组合构建应用模型,围绕构建的模型可以实现快速构建应用系统数据表结构设计,实现不同场景下新应用服务,进一步深化对信息资源的使用,提高部门的工作效率,节省人力、物力和财力。


及时转化和发现价值等级。国脉数据基因系统提供数据元的频率分析、同义词分析、关联分析等功能,频率分析统计某个数据元的各个部门、信息资源使用频率,分析数据元之间同类项之间关系,同时对部门、信息资源数据元之间的关联进行分析,有助于提高部门管理和控制的能力,从而及时将信息资源本身含有的价值转化,或是通过提高部门的预测和决策能力,形成成熟的大数据解决方案,挖掘产生新的价值。


(四)破壁体制机制:大数据时代信息资源管理机构的自我颠覆


大数据带来了信息资源管理的新工具,信息资源管理机构作为主导者更应该高度重视,打破长期以来内部的条块分割,转变和创新服务理念,加强信息资源管理的统筹规划和协调推进,同时认识到仅依靠单方的努力是远远不够的,要逐步建立新的信息资源管理体制,采取一种渐进模式,实现信息资源从内部封闭式管理到社会化运作的转型,达到信息资源配置的最优化。


促进信息资源开放共享。国脉数据基因系统通过全面梳理城市或企业信息资源,实现信息资源的清单化管理,搭建起用户与系统、系统与业务、系统与系统之间信息沟通的桥梁,有助于解决数据权属问题,避免各部门“扯皮”,实现各部门能快速清晰掌握整个城市或企业的信息资源情况,为实现信息资源的交换共享开放提供支撑。


创新共生共赢合作生态。基于国脉多年来对政府、大型企业的咨询研究,国脉数据基因系统积累了大量(国家、地方、企业标准等)和自定义标准,汇聚了大量的通用的行业数据知识,以及信息资源模板,并对其进行标准化的管理。通过直接制作、导入、生成,以直接沿用或是自定义修改的方式对模板进行选择性的编目,达到信息资源快速梳理、信息资源体系快速架构的目标,也为标准的权威性、代码的收集、行业的经验提供了有效参考。


作者:国脉研究员朱娇娜


电子政务智库 ∣come2egov

客服QQ:3312614261

客服微信:echinagov-GM

合作咨询:13875718370

长按,识别二维码,加关注

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存