2023年已经过去,以下是我关于2024年数据工作的初步思考,包括企业数据一致性治理、业务对象建模、数据民主化、实时决策、业财融合、B端数据分析、数据治理变现及大模型应用等八项工作,特此分享。很多人在讲数据治理与业务的关系有点远,企业数据一致性治理则是直接呈现数据治理价值的一种方式,比如,解决用户订单和开通平台的数据不一致就会降低公司的经营风险,这种效益是非常直接的。但传统的通过一事一议项目化方式来解决领域间的数据不一致往往治标不治本,这就是企业数据治理体系能够发挥价值的地方。2023年我们在企业数据一致性方面做了初步的探索,将**业务的不一致数据量下降了**%,这是数据治理团队从后端走向前端的一种尝试。2024年将从顶层设计、组织保障、流程运营、平台支撑四个方面出发,将数据一致性治理纳入企业级数据治理体系,重点解决**等业务领域的数据不一致问题,并能形成长效机制。多年的实践告诉我,数据团队真正需要的是一只数据模型产品经理队伍,能够以业务对象为核心(不局限于领域)来进行数据模型产品的构建,能够为业务提供端到端的数据服务支撑,能够解决跨领域数据模型构建过程中出现的数据标准、数据质量、数据整合等问题,这是数据团队的核心竞争力。在数据开放问题解决后,我们迫切需要提升数据开放的质量,把跨域多源数据整合的复杂性留给自己,将简单留给使用人员。因为数字化的核心是流程重构,而流程重构的基础是跨域数据的贯通。在传统的数据仓库建模边际效益渐弱的时候,数据团队应打开视野,在数字化转型中某得一席之地。2023年团队以家宽为切入点进行了家宽业务对象跨域建模的尝试,拉通了家宽在市场营销、业务受理、安装施工、业务使用等多个领域的核心数据,构建起了17个数据统一视图,覆盖6大业务场景。2024年会进一步固化业务对象建模的方法,规范业务对象构建流程,将业务对象推送到数据开发、数据开放、数据使用等生产环节,推进业务对象的高效运营。同时进一步扩充业务对象的范围,不断夯实跨域数据服务的基础,该项工作也是企业数据一致性治理的基础。数据民主化是指让数据的访问和理解成为所有组织成员的权利和责任,而不是仅仅属于数据科学家或IT专业人员的专属领域。这个概念旨在打破数据孤岛,提高数据的可访问性,让不同背景的人都能利用数据进行决策和创新。事实上,数据民主化不是新概念,无论是数据仓库时代我们做的自助取数,自助报表及数据集市,还是数据治理时期的企业数据目录、企业数据开放平台、企业数据租户都是数据民主化的一部分。一方面,在数据民主化的低洼地带(针对某些有意愿的业务部门),通过开通租户、人员培训等方式去提升基本的数据处理技能,让大家体会到自己DIY数据的价值。这项工作任重而道远,因为不以你的意志为转移,但有了机会就一定要抓住。另一方面,推进大模型对传统以配置化为核心的自助取数、自助报表等分析引擎的替代,在特定的场景,实现一个领域级的ChatSQL/ChatBI。我认为ChatSQL/ChatBI这种通用性的产品在近几年是不可能成功的,但一定会在企业特定的业务和数据场景中获得突破。近几年有个趋势,实时/准实时决策正逐步成为各级管理者的共同诉求,最明显的现象就是,大家已经不太满意T+1的报表了,比如校园营销的时候,一定要按小时看放号量,以便随时调整政策,又比如现在的网格营销,网格长也需要实时知道业务发展情况,这是市场竞争的结果。而传统的经分系统,架构仍然是以离线数据支撑为核心的,虽然也能支撑一线实时需求,但实时模型还不够完善,在规模化支撑的时候,架构,性能呈现出瓶颈。2024年,将在规模化实时数据支撑方面做四个方面的工作,第一、建立实时数据从需求、采集、处理到开放的管理规范和流程,实时支撑规模化的前提是标准化。第二,实时数据采集引擎的重新规划和部署,针对不同的实时数据场景,采用DSG(秒级)、CDC(分钟级)、hadoop(小时级)三大引擎来分别实现,这是降本增效的需要,很多蚊子不需要大炮。第三、构建实时数据模型体系,开放实时数据服务目录,优化实时数据对外服务。第四,围绕重点业务推进核心报表和指标的实时化。高质量发展要求公司从粗放发展模式逐步过渡到精细化运营阶段,体现在财务上就是追求有利润的收入,有现金流的利润。财务指标要能成为衡量各类业务发展健康水平的风向标,这意味着所有业务不仅要明确计收,而且能够核算清楚每笔业务的成本,并且能映射到公司的最细粒度的经营单元上,即网格,从而将钱花在正确的地方。要做到这个,必须依托业财融合,这对公司的跨条线的数据管理能力提出挑战。2024年,一方面,利用组织优势(我同时负责着M域的系统建设),推进BI在M域的应用,通过汇聚BOMS财务相关数据,支撑财务条线的自助分析;另一方面,进一步推进财智看板的建设,实现针对分产品利润、分条线利润、分产品收入明细、分产品成本明细等报表指标的支持,为业务健康发展保驾护航。公司各类业务的发展阶段不一样,导致数据支撑水平也参差不齐。在C端,已经建立了相对完备的数据支撑体系,从经营分析、精确营销、再到精益服务。但在B端,很多数据分析能力还没建立起来。比如C端除了订购分析,还会围绕ARPU,MOU及DOU等指标进行用户、产品的行为分析,不仅关注发展规模,也关注发展质量。而B端的分析大多还停留在简单的发展规模的判断上,至于B端产品发展的好不好、产品有没有人在用,还缺乏相关数据的支撑,相比C端还有一定的差距。2024年,为了支撑B端产品的精细化运营,需要将B端行为数据进行全面的采集和解析,包括互联网专线、数据专线、IDC等使用数据,同时建立一套B端产品的健康度评估指标体系,从而准确把握用户感知,为B端产品的高质量发展提供指引。2023年在原有大数据变现产品支撑的基础上,我们尝试将公司对内的数据治理能力对外封装成产品和服务进行销售,探索数据要素变现的第二条曲线,并且完成了首单合同的签订。2024年,一方面要进一步增强用户上网、用户位置两大时空特征洞察能力,不断夯实大数据变现产品的数据底座;另一方面要加强数据治理变现商业模式的探索,构建好内部的协同模式,走通内外部的商业化流程,发布数据治理白皮书,针对重点产品和服务进行标准化升级,探索数据治理对外服务体系的建立。2023年是大模型的元年,我认同李彦宏的“大模型值得把企业的应用全部重构一遍”的论断,因此在多个场景开启了领域大模型应用的探索,打造了智乎、ChatBI、智典、智能核稿等多个大模型产品,积累了一定的建设经验。2024年,第一要做好智典、智能核稿等存量大模型产品的运营和推广,以用促治,不断提升产品质量。第二是在导航推荐、即问即办等场景做好切入,探索GPTs的新模式,以用户体验为第一要务来推进大模型的深度应用。第三是协同各方做好大模型技术发展趋势的跟踪,加强微调、部署、推理的技术研究,打造大模型的开发管理平台,尝试构建大模型数据集,不断提升大模型应用的开发效率。以上所有工作都颇具挑战,不仅需要业务的牵引,更需要资源、机制和流程的配合。当然只是我的初步设想,但不提出来就没有实现的可能,希望于你有所启示。
信息部门如何编写2023年度工作总结与2024年度工作计划 2645
数据团队如何编写2023年度工作总结与2024年度工作计划 4806
雷军2023最新演讲:别畏难,先干起来再说!
数据管理实战:我的一周工作纪实
Teradata,不仅是数仓的黄埔军校,更是数据分析服务的天花板!
数据治理体系完整指南(全)
查看全部文章
点击左下角“阅读原文”查看更多精彩文章,公众号推送规则变了,如果您想及时收到推送,麻烦右下角点个在看或者把本号置顶!