查看原文
其他

什么才是运营商数据中台最大的竞争力?

傅一平 与数据同行 2021-10-16


这是傅一平的第295篇原创



作者:傅一平

个人微信:fuyipingmnb


有人问了我一个扎心的问题:“你们做数据中台似乎很起劲,懂点技术的人也许能理解你,但前端的人未必理解,他们都不知道你们在干嘛......”

跟一般的事物不同,数据技术是一种非常强调前期投入但又是边际成本很低的东西,就是说,你要做成前期得拼命的研发投入,但一旦做成了,后续效益的持续产出不需要等比的技术投入。

数据中台更是如此,很多技术架构的调整人家看不到,也看不懂,但事实上,没有前期技术上的末雨绸缪,未来业务上的很多东西是做不出来的,数据技术带来的很多改变是润物细无声的。

比如取数吧,写代码再快也快不过配置,很多企业在取数人员上的投入很大,可是做了10 年,生产效率却不会有什么质的提升,这就是问题。

作为运营商,新时期的转型是必然的,但业务转型没有这么容易,我们先不说组织、业务、机制、流程上的调整,就说说数据上的改变吧,运营商在数据上已经为数字化转型做好了准备吗?

不一定。

首先是用户管理,原来运营商是按照省、地市、县市等行政区域来管理用户的,随着精细化要求的加强,运营商需要将用户进一步划分到片区、乡镇/街道、村庄/社区,甚至到商务楼宇等等,但没有好用的位置数据是实现不了这个目标的。

运营商传统A口的基站数据其实差的很远,1 公里,5 公里甚至 10 公里的基站定位精度很难承担这个使命,特别是未来微格化、场景化的营销成为新常态后,更需要高精度位置数据的支持,比如你想进行XX社区营销,但却圈不准这个区域的用户,这是怎样一种体验......。

不仅仅是网格,还有外场摆摊,校园营销、漫入营销......等等,你会发现,这些都需要强大的位置数据支撑。

其次是业务发展,以中国移动的宽带业务为例,其运营中有太多的问题需要数据来解答,比如新建的小区用户在哪里,哪个小区才是宽带弱势区域,宽带用户的变动情况如何等等,假如没有高精度的位置数据,则只能靠人工排摸,效率之低可想而知。

现在很热的新零售也一样,比如这家店应该开在哪里,店前的道路经过的人流有多少,这些人流有多少人会进你的店,做个热力图很容易,但热力图大多解决不了具体的业务问题。

假如能针对营业厅门前道路各个方向的人流做更精确的统计和预测,也许运营商的渠道引流水平就能获得提升,而这在以前是很难做到的,现在则有了希望,下图是我们近期做的一个案例:



如果你去研究运营商的最新动向,会发现其提供的产品和服务越来越趋向于去满足人民对于美好生活的向往,而不再是简单的通道产品,无论是家庭电视、魔百盒、后视镜、儿童手表还是智慧安防等等。

但要搞清楚每个用户对于美好生活的具体向往,位置数据是最直接的,也是最有用的洞察武器,比如有了位置数据,你才能知道用户的家庭情况如何,是否有车,几口之家,出行特征等等。

最后是数据变现,现在运营商的大多数产品,还是以位置数据为核心的,无论是旅游、客流、交通还是广告等等,运营商变现收入中很大比例是直接或间接来自于位置数据的贡献,运营商现在很多变现业务做不动或者做不好,其实是位置数据不行。

应该来讲,运营商从来就没有现成的、高精度的、可以到用户级别的位置数据,粗精度的原始位置数据未来可能连支撑自己的业务转型都不够,运营商的大数据团队需要充分挖掘现有位置数据的潜力,通过建模等方式把较为精准的位置模型做出来,这是他们的使命。

以笔者的团队为例,大家花了 2-3 年时间去研究位置数据,现在才能够初步提供不同规格的位置精度模型,从而去满足各种场景的需要,当然有些场景的位置模型还是需要定制化的去做,毕竟没有一个模型能一劳永逸的解决所有问题。

比如高速公路车辆速度监测,对于位置数据的时间连续性要求就很高,而如果只是进行路网拟合,则可以降低时间连续性要求,但其又对数据的完整性有较高要求。

为了做准这个数据,建模人员前赴后继,从各种网络数据的引入和理解( A 口,S1-MME,MR,MDT,HTTP,话单等等),精准定位算法的研究(三点定位、指纹地图,融合模型,插值法等等),海量网络数据的引入(从每天 20 亿到现在的 2000 亿),行业位置模型的研究( OD、路网、区域模型、轨迹模型、常住地、工作地、公交识别、横截面、城规配套等等),再到数据架构的升级(从离线、准实时,实时再到实时中台,从 hive 到 stream 再到 flink ),付出的代价不可谓不大。

但即使是这样,现在做的常住地标签,一线人员还会说这个数据有时候会飘,但现在再飘也就飘 100-200 米,而 3 年前,这个距离可是 500 米、1 公里甚至 5 公里。

当然,光做位置数据是不够的,我们还有更大的挑战,那就是的运营商的另外一个核心数据:线上内容数据,在移动互联网时代,这个基础数据是如此重要却不可得。

为什么?

笔者以前专门介绍过运营商的行业知识图谱,就是说运营商当前管道内的任何线上数据只是一堆谁也看不懂的 bit,而只有将这些 bit 对应的业务含义找出来,也就是建立行业知识图谱,你才能真正理解用户的上网意图,运营商的线上数据才会有真正的价值。

现在我们已经拥有了几亿的行业知识数据,爬取了大量公开的数据,但由于种种原因,这些数据的可用性还是不够,比如还支撑不好异业的选品,但你不去做,永远不知道能做到什么程度,言必称 https 的其实小看了运营商的线上数据潜力。

比如APP识别原来只有 1000 个,当时完全没法用,但现在已经建立了一只运营团队,能识别主流 APP 几万个,同时为业务部门提供定制化的服务。

比如加强了对于上网数据的研究,正在基于AI的能力进行内容的识别和分类,但要有成果还需要一些时间,因为建立起运营商自身的NLP团队并进行应用并非易事。

比如自研了爬虫平台,每天爬取的数据量是巨大的,现在对几乎所有的非个人号码、位置、文章等等都打了标签,这在以前是难以想象的,现在缺的是一些应用场景。

但 3 年前估计很少有人会对用户级别的位置数据的精度提出要求,大多跟着现状走就可以了,也没人提出去建什么行业知识图谱,更别提去体系化的爬取外网的数据了,NLP对于运营商来说还是比较新鲜的东西。

而数据中台战略让团队有机会去思考一些更为长期的事情,因为我们发现:建立了大数据平台并不意味着拥有了大数据的能力,新瓶装旧酒是没用的,只有把位置和内容这两个运营商最核心的数据做扎实了,我们才可能做出一些不一样的东西。

不能说现在已经做的很好,但现在的数据中台的确比以前提供了更多的可能性,比如虽然每一次位置精度的升级大多人不知道,但现在一线人员会发现可以圈选到更多的目标用户了,或者突然发现某个模型更准了,又比如线上内容标签在对外变现中使用的比例越来越大了。

从数据中台的建设过程看,运营商大数据不是什么灵丹妙药,最多是一块有潜力的石头,得付出巨大的代价才能将其打磨成璞玉,而为了这块璞玉,运营商需要一大批数据工匠,掌握 DT 必须要掌握的技术,心无旁骛的去做一些基础工作,这样才能挖掘出这些数据不同以往的价值。

也只有基于这些差异化的价值数据,我们才能跟业务部门说,我有新的数据,可以为你提供新的解决办法,报表取数能解决的事情,根本不需要大数据。

也只有基于这些差异化的价值数据,才让初期推出的大数据工具对于种子用户具备了一定吸引力,然后逐步扩大范围,记得当年推广大数据平台的时候就特别苦恼,因为一线原来的 ORACLE 用得好好的,上什么大数据平台啊!

现在很难评估这些大数据为公司创造了什么价值,但只有先拥有了流量才有资格谈转化吧,评估企业的大数据的能力,得先看看你的一线有多少人在用什么样的大数据工具。

我们这个时期的数据人员,虽然也要去满足业务需求,但有一点是跟以前不同的,就是有机会把数据的底子做的更扎实些,这就是数据中台。当然数据中台的范畴不仅仅是数据,但位置和内容对于运营商来说是数据中台中最重要的东西。

为什么位置和内容是运营商最重要的数据?因为这两个数据的天花板就是运营商未来对于客户线上和线下生活理解程度的天花板,这是不言自明的,不懂客户没有未来。

阿里不小心做了件好事,就是提出的数据中台概念获得了很多人的理解,我想这也是我们的幸运,在它的庇护下,数据工匠才能心无旁骛的去做一些真正有竞争力的、能够沉淀下来的东西,从而为公司的未来提供新的动能,而这在以前是很难的。

如果你有想说的,或者有疑问,请加入傅一平的知识星球社区,我们可以更直接的进行互动交流,长按以下二维码加入。



作者:傅一平 (微信号:fuyipingmnb)





可能错过的近期精选文章(点击链接即可阅读)


从芝麻信用分透露的详细数据设计,我们能从中得到什么启示?

艰难的旅程,你的数据中台到底能为一线提供多少火力?

PPT,考验你的格局、能力和思维的方式,你得学会驾驭它!

如何避免成为一台取数机器?

哪些广为人知的数据挖掘案例其实是一地鸡毛?

数据的价值到底如何评估?

为什么我提交的数据分析报告总是被领导K?

我如何用统计学指导自己的生活?

从吴军的“算法的油水就那么多”说起!

中国移动集中化大数据平台起航了,意义深远!



一起成长,让我们与数据同行

忙完工作,偷得浮生半日闲,讲述自己的数据人生

大叔/电信博士/500强央企/大数据/人工智能/统计取数/数据挖掘/数据产品/数据管理/数据仓库/数据变现



视频 小程序 ,轻点两下取消赞 在看 ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存