其他
如何做一款好的数据平台?
导读 本次分享的主题为如何做一款好的数据平台。来自腾讯的高级产品经理贺智超老师将分享他在数据平台相关工作中的一些思考和实践。
主要内容包括以下五大部分:1. 技术转产品的思考
2. 深度理解数据工作者的需求
3. 腾讯欧拉资产工场实践
4. 数据平台产品经理方法论
5. 问答环节
分享嘉宾|贺智超 腾讯 资深产品经理
内容校对|李瑶
出品社区|DataFun
首先是判断。从专业知识、好奇心、是否对负责任的事情操心、积极的心态、善于挑战目标、沟通能力等角度判断是否适合转型。并判断是否有足够好的机会,比如在同一项目内部进行转型就是一个比较好的机会。 第二尝试。在转型之前,是从产品的视角对需求进行思考,做一些思维上的简单训练和尝试。从简单的需求入手,进行原型图绘制,需求文档撰写等。 第三是学习。培养自身产品经理所需要的一些素养,提升自身产品力,太过于技术的思维方式会阻碍产品力的发展,如果总是考虑实现的难度就可能会丢失一些好的想法。
深度理解数据工作者的需求
通过 Presto 引擎将查询速度提升了,但产品体验也是决定工作效率的核心因素。 技术元数据更丰富,拥有了数据地图的检索能力,但业务元数据很难沉淀,找到表之后缺乏描述表业务信息的内容。 数据质量问题能被有效监控,但很难定位到根因。 数据管理、质量监控等能力在功能矩阵上新增了,但生产流程与管理流程依然割裂。
腾讯欧拉资产工场实践
角色得到进一步细分。比如有数据规划者由此能够把数据当作产品一样进行精益化生产,从而构建规范、更高质量的数据仓库,使得下游数据使用者更加满意。
重点打磨数据开发面板。增强团队内部协同效率,实现了配置化开发;强化了数据版本控制,把所有影响生产的内容,包括表结构任务的代码、调度配置、以及依赖了什么上游任务等等都当作代码,并对版本内容进行可视化;实现自动化上线,发布后同时上线 Hive 集群、调度平台和 Git 仓库;构建出正式环境与测试环境的简单隔离,智能解析上游依赖,自动抓取 Python 中的 SQL 等自动化能力。
随着时间的推移,业务数仓规模不断膨胀,运维压力加大,采取分层保障来提升数据质量,降低运维起夜率。对于大部分日常任务数据可以自动监控,保证基本正常运维。对于重点数据的内容进行质量监控,必要时设定强规则,在告警后可以阻断下游执行,避免污染下游更多数据。对更核心的数据,还提供及时性方面的基线保障,支持追踪监控整个上游任务链路,提前预测产出延迟风险。
除了平台上的设计落地外,还搭配与资产工场相关的课程体系。比如在数据工程职位上开设了《DataOps》,《SQL 代码规范》,《数仓设计》还有《数据测试》等四门必修课。策略产品职位则开设了《SQL 实操应用》,从而使提数据需求的产品经理对数仓和 SQL 的认识更深刻,从而方便他与 DE/DS 更好地沟通。通过这些课程,提升用户对资产工场的使用效果。
数据平台产品方法论
1. 平台创新方法论
2. 规范和效率如何兼顾?
3. 目标驱动
4. 用户运营层面讲究策略
5. 个人产品力的提升
05
问答环节
分享嘉宾
INTRODUCTION
贺智超
腾讯
资深产品经理
贺智超,腾讯资深产品经理。现任腾讯欧拉平台产品经理,本硕毕业于华南理工大学,前新加坡管理大学算法研究员,校招加入腾讯,先后从事后台与数据研发、产品设计等工作,深度参与了欧拉数据资产平台从 0 到 1 的搭建过程,在数据研发工具领域有丰富的落地实践经验。
往期推荐
点个在看你最好看