破浪人丨找数据如何更准更快?这个95年小哥哥有奇招~
说在前面
在扬帆破浪的2022年里,有一批可爱的数帆同事在工作中、工作外凭热爱发光发热。
一个个小故事背后,呈现出他们在数字化技术与应用实践中,步履不停的探索和开拓进取的力量。
今天是「破浪人」栏目第1期。
试想下,我们处理杂物时,一股脑儿把所有物品塞进一个大容量储物柜里,但需要某件东西的时候,却翻箱倒柜都找不到?这是因为缺少了关键步骤:对放入柜子的东西进行统一分类和整理。
数据处理也是一样。为了减少每次“找东西”的时间,需要利用好数据标准。
国内市场上已有成型的数据标准产品,但是同时兼顾数据标准本身的标准化描述、灵活的标准模板、灵活的管理流程配置、多样化标准类型的产品非常稀缺。
去年,网易数帆的95后小哥哥,产品经理安阳和他所在的团队成功研发出满足以上需求的数据标准产品——有数数据标准产品,获得多位客户的高度认可。
安阳还凭借此获得2021网易数帆内部评选的爱迪生奖(这是奖励最具创造力员工的专设奖项)。
左一为安阳在颁奖现场
数据治理,标准先行
数据标准有这么重要吗?还真有。
在数字经济高速发展的今天,越来越多企业利用数字化技术提高运营效率,纷纷驶入数字化转型的“快车道”。
尽管如此,很多企业还存在诸多问题:数据标准还停留在文档管理阶段;未建立统一标准视图,需要花费大量时间成本去认识数据;数据标准共享能力差,查找周期长等。
例如,某企业需要对内部各业务系统的数据进行整合,但同一数据在不同系统中的不同描述,便是最大的“拦路虎”。比如对于“姓名”这个字段,可以叫name,也可以叫xm;对于性别编码,有的系统用0代表男,而有的系统则用1表示。
要筛选出有效数据,需要花费大量时间和人工成本,正确率难以保证。作为有着4-5年大数据行业经验的“老产品人”,安阳很早便注意到这一市场痛点。
那么,如何通俗地理解数据标准,其中又包含哪些内容?
安阳用工厂的流水化运作来形象类比。“假如把企业的数据平台比作一个数据治理的工厂,原始数据需要经过一系列提炼才能变为有价值的数据资产,数据标准就是定义每一步该怎么做?准入条件是什么、产出的要求是什么?”
不懂和客户交流的不是好产品经理
谈到有数数据标准有的优势,安阳娓娓道来:
“其一,标准度更高、灵活性更强。我们的标准载体是参考GB/T 18391标准规范制定的数据元,管理流程参考了信通院发布的数据标准管理白皮书,并支持自定义注册模板配置,灵活性更强;
其二,提供多种标准挖掘方式。提供多种标准挖掘方式。对于暂无发行标准的新型行业,会依据客户是否有明确的标准要求,提供两种不同的制定标准的方式;
其三,提供整包的发布方式。每次进行全量发布,方便批量进行影响分析,及时通知相关方进行整改,标准执行及适配效率也得以提升。”
标准产品在有数大数据开发及管理平台的位置
这一产品的顺利研发及投入使用,除了有自身的经验加持,还得益于安阳一次次跟客户的有效沟通。
去年11月,安阳和团队在上海与某证券客户讨论数据治理的相关需求,“那天一聊就是4个多小时,结束时双方都觉得意犹未尽。”
安阳也总结出心得:所有的设计规划都应先考虑真实的场景,让方案更大程度地契合客户需求,还要根据不同行业客户的实际情况灵活考虑。
“不将就”才能创造出好产品
在项目初期,安阳遇到一个难题:团队内大部分人对数据标准的理解还停留在概念阶段。
为此,他开展了多场培训课,详细讲解了构成数据标准的每一个关键组成部分并举例释义,直到大家弄清楚为止。
数据标准的发展路线
“在研发过程中,大家的求知欲、专业能力让我钦佩,良好的氛围也带动了我。我们多次讨论可能存在的风险,保证数据标准产品的正常上线。最终从规划、研发到首个版本上线,只用了短短3个月时间。”
生活中,这个95年的小哥哥也是个妥妥的“实干派”,平时喜欢研究心理学、文学甚至法语,阅读对他进行用户需求分析和撰写工作文档很有帮助。烹饪、摄影样样拿手,周末下下厨,探探店,也是他最爱的放松方式。
对于数据标准产品的未来规划方向,安阳表示,希望能够建立标准数据治理体系,以数据标准为核心指导数据治理全链路,从阶段标准化转变到流程标准化,真正提升数据治理效率。
往期回顾:
全球仅83人,网易有数技术专家燕青成顶级开源项目Apache Spark 新晋Committer