查看原文
其他

聚数成湖

墨子苏 泰伯网 2022-05-16
泰伯网 墨子苏 | 撰文


上一双鸟,林间一池泉。

柔和的光线穿过云层照进落地窗,伴随脚步赫然出现在眼前的,是掩映在茂盛绿植中的办公工位。直到一台D-Box光磁一体机将思绪从自然环境拉回科技社会,人们才意识到,这个被打造成绿色生态体的建筑,正是天津市津南区中国华录未来科技园的双创中心。

易华录构建数据生态体系的美好愿景在这里被直观地呈现出来。但作为城市级“数据湖”的探索者,易华录在实现“聚数成湖,联湖成海”的最终设想之前,也势必面临更多、更难的挑战。

01

变湖为沼的担忧

存不起、留不住、用难求。

面对大数据指数级增长,数据存储、流通难题已成限制智慧城市、数字政府的建设的瓶颈。与此同时,可集中存储、按需处理海量异构多源数据,无需提前定义数据模型的数据湖模式,正在逐渐被业界接受,国内外陆续有相关项目发布。

微软、AWS先后推出基于公有云的数据湖解决方案,今年上半年Databricks官方博客宣布开源DeltaLake项目,8月AWS又推出AWS Lake Formation数据湖全面管理服务。相关资料显示,易华录2016年在国内率先提出了“城市数据湖”的理念,目前已有多个城市级数据湖项目落地。易华录城市数据湖建设风生水起的同时,品高云上线了私有云数据湖,明析数据欲搭建工业数据湖平台……“数据湖”概念一时风头无两。

目前看来,易华录提出的“城市级数据湖”是一个特别的存在。

城市数据湖通过集中储存政务、工业、医疗、农业、教育、旅游、税务、交通、公安等数据,对其进行有效整合处理与分析并加以利用,改变以往的数据孤岛形态。2019年易华录半年报显示,上半年该公司营收13.74亿元,同比增长8.68%;归属于上市公司股东的净利润1.8亿元,较上年同期增长65.71%。上半年,数据湖业务同比增幅83.71%,营业利润4.22亿元,接近公司营业利润的七成。目前,易华录已有15个数据湖项目相继落地,数据湖成为其母公司华录集团央企转型的重要抓手之一。

然而,面对林林总总的“数据湖”项目,业界也不乏忧虑,最根本的担忧来自于“数据湖”变为“数据沼泽”的潜在风险。

业内人士介绍,数据湖模式对服务器及数据处理能力要求颇高。但除技术之外,影响数据湖项目落地运转的根本问题在于其整个生态系统的架构是否合理。以往公司层面的部分数据湖案例显示,汇集海量数据的数据湖必须通过合理、简化、高效的体系设计,才能避免数据不流通变成“死水”甚至“沼泽”,非常考验架构设计和管理者的智慧。

02

湖,是基础设施

难,但并非无路可走。

联合上下游企业,借力地方政府,易华录希望业内共同发力,构筑城市数据生态,促进数据流转。

2018年11月,易华录联手浪潮、金山云、360企业安全、启明星辰、深信服、九次方、格灵深瞳等100多家互联网、大数据、人工智能领域知名厂商、研究机构、资本方和产业运营商,共同发起数据湖生态联盟。近期,易华录又与华为、绿地、旷视、比特大陆达成合作,截至发稿,联盟成员单位已经达到了300多家,涵盖工业、农业、金融、医疗、交通、物流、环保、水利、安防、旅游等各行各业。

对于各大云商的智慧城市、数字政府项目,易华录更是表示“喜闻乐见。”

易华录认为,若将“云”看做是商业设施,“湖”则是整个城市数据建设的基础设施。相较传统的数据存储方式,易华录自有的蓝光存储设备具有低耗、安全、长寿命等特质,结合云计算、大数据、人工智能、区块链、光磁一体化存储等技术,可有效解决此前普遍的数据存储难题。而理想中的数据生态,应能借助数据湖这一汇集海量数据资源的基础设施,蒸腾活化为多朵“云”,并通过政府、民生、产业数据活动吸收冷却新信息,进一步汇聚成数据流,最终再度汇入“湖”,“湖云相栖”,形成完整的数据循环。从这个意义上讲,云越活跃,数据越多;云越繁荣,湖就越好。

天津·津南数据湖作为全国首个城市级“数据湖”项目,成为易华录在各地推广数据湖业务的模板。津南数据湖相关负责人向泰伯网介绍,目前津南区多个相关部门数据正在进“湖”,未来仅津南区政府数据预计将达到200-300PB,并为市级数据湖预留2000PB以上的光磁融合、冷热结合的存储空间。基于现有政府数据,易华录将联合数据湖联盟生态单位进行数据加工,在政务、经济、社会治理、生态文明、文化等方面开发应用,为相关部门提供决策参考,助力津南区产业升级转型。基于津南数据湖,今年津易公司将启动智能交通、智慧医疗、幼儿园三级监管、区一级视频会议、军地一体化平台等数个应用项目建设。

此外,汇集全市相关数据的天津“数据银行”项目,也在天津网信办支持和监管下开始试点建设运营。据悉,以津南数据湖为基础,“数字银行”将面向政府企事业单位及个人用户开展受托数据存储、治理、分析、应用、资产确权、价值评估等服务,打通数据变现“最后一公里”,从而形成数据湖生态中建湖、引水、水资源利用的生态闭环。

03

复制与蜕变

青岛、重庆、徐州、开封、泰州……天津的数据湖+产业生态的项目经验正在各地复制,更基于当地特色,完成着各自的蜕变。

易华录方面表示,津南数据湖是易华录的经典案例,但并非全国的数据湖项目全盘按照这一模式复制。数据湖这一新生模式目前仍在推广初期,各地会优先服务于当地政务部门需求,后期则会根据各地优势产业,发展出不同的优势产业服务方向,最终“联湖成海、繁荣共生”,打造全国联动的数据产业服务底盘。

潘德炉院士曾将大数据比作是“智慧海洋建设的灵魂”,认为数据将是人类认知海洋的基础。然而,虽然基于海洋的数据量不断增加,海洋大数据的体系建设却刚刚起步。据相关负责人介绍,海洋数据体量比较大,格式也非常复杂,对多源异构的海洋数据进行预处理时必须结合海洋的专业知识和模型。最让他们“头疼”的是,目前国内针对海洋大数据的管理模式仍不够成熟,从数据采集开始,海洋大数据就缺乏统一的行业标准,导致海洋大数据难以合理分类“入湖”。

由于海洋数据产业的特殊性,青岛数据湖率先为海洋国家实验室、中国海洋大学等涉海科研院所提供服务,并与海洋国家实验室联合对海洋大数据进行梳理分类,希望从源头理清海洋大数据的脉络,为物理海洋建设提供参考。未来计划基于物理海洋、海洋生物、海洋地质、工程材料等细分分类,分别设立文献库、数据、知识库、规格、算法、智能库等细分库。未来,青岛数据湖将不仅服务于青岛当地,还计划辐射全国海洋产业,为涉海科研院所、企业、创新创业团队等对象提供大数据服务。

重庆·南岸数据湖则在落地伊始基于易华录的传统行业优势,与公安部门展开了密切合作。

据了解,目前该公司已与重庆市南岸区公安分局建立了联合实验室,希望通过对交通数据的监测和分析,为智慧交通建设提供解决方案。王道静指出,智慧交通的建设将会涉及到对重点人群、重点车辆的管控,解决以往由于数据存储的局限性导致的公安监管信息不足等问题。未来,来自公安交管、交通运输等行业的海量数据将汇聚在这一占地42亩、存储能力达1000PB的“城市数据湖”项目中。基于海量政务数据,未来南岸数据湖还将根据实际情况,拓展更多行业的应用方向。

04 

且行且期待

城市数据湖建设如火如荼,但实际上,各地数据湖业务的拓展,也并非一帆风顺。
据介绍,部分地区此前已建设数据存储平台,并发文要求各部门统一将数据归集至该平台。但随着技术发展,能耗更低、使用更加方便的存储模式正在逐渐替代原有技术,此时,建设基于新技术的数据存储设施就与政府既定政策之间产生了冲突。为避免重复建设,落地之前地方政府势必需要时间综合考量,即使确定合作,也需要时间采取相关措施调整规划,出台新的规章制度,为各数据存储、应用部门提供行动参考。
事实上,数据壁垒仍然很难打通、各地数据存储政策存在差异、各部门需求难以协调统一......这些现实情况的存在,意味着易华录必然要在商务协调方面耗费更多精力,这对其各地数据湖的运转是一种不小的考验。而这些,也正是智慧城市数据底座建设面临的行业共同的问题,并非一朝一夕能够解决。
此外,在To G业务上经验丰富的易华录,在未来ToB、ToC市场的拓展中,并不占据明显优势。正因如此,各地数据湖项目虽然主攻产业方向有所差异,但盈利模式都以数据服务+物理载体收益+投资孵化的“组合拳”出击,这样,易华录在规避风险的同时,还能进一步扩大产业生态的聚集效应。
综合来看,易华录发展数据湖产业的确具备较难复制的独特优势:作为央企子公司,政府合作风险低;作为上市公司,融资渠道较为畅通;自有蓝光存储设备,成本低、低耗能;五是资本运作能力强,PPP经验丰富;作为国内数据湖DT理念的先行者,还具有舆论优势。
易华录若能真正打通数据壁垒,必将利好生态联盟内合作伙伴。再大胆些说,甚至可能一定程度上影响部分地区的大数据产业发展态势。
问题虽多、压力虽大,但未必不能破局。
凡此种种,可以说易华录的数据湖大盘才刚刚起步,前路如何,且行且期待。

——【加群提示】——

泰伯高校教师群

泰伯航空航天爱好者群

泰伯青年大学生交流群

泰伯全球读者交流群

泰伯新闻通讯群

泰伯微信开白群

入群请加泰伯小姐姐微信:17864105751

同时备注您想进的群。深入阅读|点击图片或标题

杭州云栖大会上,我想到了南半球的非洲兄弟

《精读》

我做测绘这30年

To B市场这一年:雷声大雨点小

马斯克&马云:隐藏在对话中的理想与命运

智慧城市的一体两面:东莞“数字政府”VS福州“城市大脑”

7分体验,10分思路,中国版“谷歌地球”问世

一场田间地头的数据“邂逅”

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存