Hex:数据行业是否会出现“Figma” 的机会 ?
作者:Kefei、Zongqing
编辑:penny
排版:Scout
当前每家企业都在加大对数据的投入,企业内部数据参与者越来越多,企业开始要求非数据职能的员工也要具备数据素养,如产品、运营、财务人员等等,他们对数据分析和可视化的需求也在提升。然而,协同、共享和发布数据工作仍然复杂,数据行业仍然未出现像 Notion 之于共享文档,Figma 之于设计工具的以协同为核心的现象级产品。
Barry McCardel 基于上述痛点在 2019 年 10 月与其他两位 Palantir 前同事共同创立了 Hex。Hex 是一个数据协作平台,核心产品是 Notebook,核心价值是协同,支持多编程语言。Hex 以数据科学家为核心,向两头延伸至数据工程师、数据分析师、业务分析师、决策管理层等。为了实现“协同”这一核心价值,Hex 的前端设计得非常易用,在能支持数据科学家对复杂应用的需求的前提下,又能让更多非技术、非数据背景的用户参与进来。
Hex 叙事有三层,第一层先从数据科学家切入,第二层覆盖整个数据团队,第三层扩展至企业内部数据参与者。如果能顺利做到第三层,那么 Hex 将有机会成为连接整个数据链条上下游的企业数据观察层的重要玩家,并且在企业内部有网络效应。如果只做到第二层,Hex 也有机会成为以数据科学家为核心的数据协作平台。
但从目前的客户使用情况来看,除了少数几个客户有除了数据科学家以外的团队在使用 Hex 外,我们并没有看到用户群泛化的现象。如果仅聚焦在数据科学家,其数量尽管在快速增长,但总量依然很小。再加上 Hex 客单价很低,因此短期来看 Hex 并非处在一个大的市场,长期市场规模能否扩大还需要看公司的破圈能力。除此之外,Hex 还面临赛道竞争激烈等问题。
从业务表现看,公司仍处在很早期,判断 Hex 未来能否有机会成为大公司需要持续追踪客户情况,建议重点关注使用人群泛化迹象。
以下为本文目录,建议结合要点进行针对性阅读。
👇
01 行业背景
02 什么是 Hex?
03 客户与应用场景
04 市场与竞争
05 Thesis
06 关键问题与判断
01.
行业背景
随着企业可获取数据量的增加,以及数据驱动决策的观念越来越深入人心,企业都在加大对数据团队的投入。然而,协同、共享和发布数据工作仍然复杂,数据行业仍然未出现像 Notion 之于共享文档,Figma 之于设计工具的以协同作为核心价值的现象级产品。并且在过去,大部分数据产品仅支持单一的编程语言,这也阻碍了不同编程语言使用者之间的协作。
同时,越来越多的企业开始要求非数据职能的员工也要具备数据素养,如产品、运营、财务人员等等,他们对数据分析和可视化的需求也在提升。但是传统的数据工具上手难度较高,对于非技术用户并不友好。
Hex CEO Barry McCardel 毕业后一直在数据行业工作,Barry 发现上述痛点后,创立了 Hex。Hex 是一个数据协作平台,以数据科学家为核心,向两头延伸至数据工程师、数据分析师、业务分析师、决策管理层等等。Hex 核心产品是 Notebook,核心价值是协同,Hex 希望成为企业数据的观察层。
除了上述背景,Hex 成立的原因以及选择从数据科学家切入的原因还包括创始人看到了数据科学家这个群体正在快速增长。根据美国劳工统计局数据显示,截止 2022 年,美国有 168,900 个数据科学家职位,预计到 2032 年,这一数字将达到 228,200,2022-2032 年增速为 35%,这一增速远超其他岗位。从业人员数量的增长将直接带来相应工具和产品的机会。
source:美国劳工统计局
02.
什么是 Hex ?
产品
Hex 是一个数据协作空间和平台。Hex 从数据科学家切入,同时希望数据团队的其他成员,以及产品、运营、财务等企业内部数据使用者能够参与进来,一起在 Hex 平台上进行数据协作,完成数据处理、数据分析和可视化。Hex 的愿景是希望成为企业数据的观察层。
从使用流程上看,用户通常先将 Hex 连接到企业数据仓库,然后在 Hex 的协作式 notebook 中使用 SQL 或 Python 等语言进行数据处理和数据分析,再以可交互的形式将分析结果分享给团队成员。简单来说,Hex 围绕 notebook 这一核心产品展开。
Notebook
作为 Hex 的核心产品,Notebook 为用户提供了一个类似 Jupyter Notebook 的界面,在有效降低上手成本的同时也叠加了许多其他功能,重要功能如下:
• 支持多语言编程
在过去,数据科学家在各种工具、版本中进行切换是一种极其糟糕的用户体验,也很容易导致各项工作的孤立,难以进行协作。而数据科学家、数据工程师、数据分析师等各个角色所使用的语言也不相同,给协作带来了难度。Hex 支持多语言同时进行编程,比如用户可以在同一个 Notebook project 中先建立一个 SQL 语句用于数据的查询检索,再建立一段 Python 代码来分析数据、绘制图表,极大提升数据处理效率。
source:Hex 产品界面
• 以无代码的形式实现可视化
可视化一直是数据链条中重要的一环。考虑到 Hex 的目标用户除了数据科学家外,还包括产品、运营等非技术人员,因此 Hex 提供拖拽等无代码形式生成可交互的可视化图表的功能。一方面解决了传统可视化图表制作困难的问题,另一方面也解决了传统的以截图形式分享数据的无法交互的问题。同时,Hex 分享出去的可交互式图表会随着数据更新而自动更新图表数据。
source:Hex 产品界面
• AI 辅助的数据分析能力
2023 年 2 月,Hex 推出 Hex Magic,Copilot for data analysis。Hex Magic 直接集成在 Notebook 中,具体功能包括:1/使用自然语言编写代码;2/支持 bug 分析,协助用户 debug;3/帮助用户写代码注释。
source:Hex 产品界面
商业模式
定价方面,Hex 为大众用户提供了限量的免费额度;对专业用户或小型团队收取 36 美元 per seat /month,但部分功能依旧受限;对于企业用户价格为 75 美元 per seat /month;更大规模则提供销售谈判价格和更专业的服务。大部分企业客户购买价格为 75 美元 per seat /month 的方案。
source:Hex 官网
团队
Hex 于 2019 年 10 月在 San Francisco 成立,创始团队包括 Barry McCardel(CEO), Caitlin Colgrove(CTO)和 Glen Takahashi(Chief Architecture)。三位创始人之前是在 Palantir 的同事。Barry 和 Glen 在 Palantir 均担任 Forward Deployed Engineer,Caitlin 担任 Software Engineer,基本与他们在 Hex 中的分工一致。
Barry 本科毕业于西北大学,获得理学学位。在创办 Hex 之前曾在普华永道担任咨询顾问,任职 2 年,之后在 Palantir 工作将近 5 年,在 TrialSpark 工作 1 年,担任运营和战略高级总监。自工作以来,Barry 几乎一直与数据工作打交道,要么是数据分析师,要么是围绕使用和构建数据工具的产品角色,对数据行业存在的种种痛点有较为独特和深刻的见解。此外,业界普遍认为 Barry 的销售和服务能力较强,客户及合作方对 Barry 的评价都较高。唯一担心的方面是,有投资人和团队成员认为 Barry 在公司管理方面需要放下 ego,更虚心地听取别人的意见。
Caitlin 本科和硕士毕业于斯坦福大学的计算机专业。创办 Hex 之前,Caitlin 曾在 Palantir 工作了 6 年,后又在 Remix 工作 1 年。Remix 是一家小型交通规划软件公司,Caitlin 在 Remix 主要负责组建数据团队的工作,也是在那里看到了现代数据堆栈发展的雏形,开始与 Barry 一起讨论创业的计划。在 Palantir, Caitlin 担任产品前端小组的负责人,带领 5 名全栈工程师和 35 名工程师团队规划公司的计算产品。业界评价 Caitlin 的执行力和团队管理能力很强,在过往的工作经历中晋升速度非常快。
Glen 本科毕业于 UCLA,计算机专业。创办 Hex 之前,Glen 在 Palantir 工作 4 年,后与 Barry 一起在 TrialSpark 担任产品工程师,对产品和架构设计很有远见。
Hex 目前有大约 100 名员工,员工以非技术岗为主,产品、设计和销售人员超过 6 成,从组织架构上可以看出 Hex 是一家以产品体验优先而非技术优先的公司。
融资情况
03.
客户与应用场景
Hex 客户包括 Notion、Brex、Fivetran、Greenhouse、Opensea 等等,多以科技公司为主。截至 2023 年 3 月,Hex 有 450 家付费客户,客户数量相较 1 年前增长了10 倍,公司收入增长了 4 倍。
使用场景与人群方面,Hex 目前主要从数据科学家切入,长期规划是希望通过良好的协作体验和低门槛的上手成本让公司内部更多部门使用起来,包括产品、运营、财务等等,实现用户群体的泛化(目前已在少数客户公司中出现这一迹象)。我们整理了部分客户使用情况:
04.
市场与竞争
市场
我们根据 Hex 的战略规划将其可触达的用户分为 3 层:1/仅数据科学团队;2/数据团队(包含数据科学家);3/数据团队及其他数据参与者。下面是对每一层的 TAM 测算:
• 仅数据科学团队
根据美国劳工统计局数据,2022 年全美数据科学家数量为 168,900 名,该数字预计在 2032 年可达到 228,200 名,2022-2032 年增速为 35%,是全美增速最快的职位之一。假设 Hex 用户仅限于数据科学家,未赢得其他职能用户的情况下,2022 年 TAM 约为 1.52 亿美元(168,900 x $75 x 12 = $152,010,000),2032 年该数字预计为 2.05 亿美元(228,200 x $75 x 12 = $205,380,000)。
• 数据团队
Hex 目前的用户群体仍以数据科学家为主,有大约 30% 的客户使用群体从数据科学家延伸至数据团队里的其他成员,包括数据工程师、数据分析师等等。我们从 Snowflake、Databricks 等与 Hex 有 partnership 的公司那也了解到它们有越来越多客户在使用 Hex,Hex 用户泛化的情况正在发生。
根据客户访谈我们了解到,数据科学家在企业数据团队中的占比大约为 10%,因此如果假设 Hex 的用户群体为数据团队,TAM 则在 2.05 亿美金的基础上扩大 10 倍,即 2032 年 TAM 大约为 20.5 亿美金。
• 数据团队及其他参与者
Hex 最终想实现的是企业内部的数据参与者均能成为用户,数据参与者除了数据团队还包括管理层以及产品、运营、财务等其他职能中需要使用数据进行分析和决策的人。目前我们仅从 Notion 等少数几个客户(占总客户比不到 5%)中看到此现象,可以判断 Hex 短期内比较难走到这一阶段。
竞争
作为数据分析工具,产品需要解决的核心诉求是从海量信息中获取对企业发展的有效见解。而这一市场早已厮杀成红海,但数据驱动的需求使得越来越多非数据团队加入了数据分析的行列,这对分析工具的“低门槛”提出了新的要求;同时,AI 技术的爆发也给原本需要复杂代码编程的场景提供了新的想象力。
基于此,我们可以将 Hex 的竞争对手分为三类:
1. 基础数据处理和分析工具:Excel、Jupyter Notebook;
2. 专用的数据可视化工具:Tableau(Salesforce)、Looker(Google);
3. 数据分析及可视化工具:Deepnote、Mode。
其中,与 Hex 业务重合度最高、竞争最为直接的是 Deepnote 与 Mode。
• 传统数据分析工具
当前市场上大多数公司对数据处理和数据分析工具并没有太高要求。根据用户访谈,80% 的公司在考虑购买 Hex 或 Deepnote 的时候,更倾向于使用免费的 Jupyter Notebook 甚至 Excel 以维持现状。现有的数据分析工具已经足以解决他们的数据分析需求,只不过从流程和操作上较为复杂。
但是,也有相当部分的公司出于协作、低门槛或可视化等原因选择购买更专业的 BI 工具。而将两者进行比较时,可以发现 Hex 支持 SQL、Python 和无代码进行编程的特性以及协作开发的功能都更加适用于团队场景下的数据分析工作,同时相对 Jupyter Notebook 来说,Hex 支持多语言编程,降低了用户学习其他语言的成本,也大大降低了团队人才招聘的难度。对于 Jupyter Notebook 来说,最大的优势便是开源和免费,在企业预算紧缩的大背景下,仅凭这两点实际上已经可以拿下很多客户。
• 专用的数据可视化工具
Hex 长期将自己定位为企业数据的观察层。数据可视化一直是数据分析的重中之重,市场上很早就有很多优秀的公司来完成这项任务。在访谈中,很多用户也表示,Hex 的可视化功能并不是最好的,相比 Tableau 和 Looker 来说,Hex 的可视化功能仍然有待加强。
Tableau vs. Hex
Tableau 于 2019 年被 Salesforce 以 157 亿美元的估值并购,其在可视化方面的表现极其强大,有不少用户表示,即便购买了 Hex ,大家也可能考虑再购买 Tableau 作为补充。但是,单纯将 Tableau 作为一款数据分析工具看待时,他的 Notebook 使用体验并不好。此外,Tableau 的价格相比 Hex 极其高昂,最便宜的年度合同也需要 8 万美元,而 Hex 的单个席位的月度价格仅为 75 美元,哪怕是 Notion 这样已经将 Hex 拓展到 GTM 等团队的公司,每年为 Hex 支付的费用也不过 11 万美元。
Looker vs. Hex
Looker 于 2019 年被 Google 以 26 亿美元并购。同样作为企业级软件,Looker 具有最低合同规模,需要具体与供应商谈判。Looker 的可视化功能同样非常强大,但是配置也非常复杂,需要专业的数据科学团队来进行维护才能发挥出 Looker 的全部能力。同时,Looker 也不支持用户在同一个代码库上进行协同工作,因此他的用例更倾向于打造业务或运营场景的看板,比如查询每天的销售总额等等。而 Hex 则更为轻量级,云端部署好的环境不需要用户进行复杂的环境配置,基本可以达到上手即可用的状态,同时也更便于协作。但是也需要承认,在可视化方面,Looker 能够给予的上限的确高于 Hex ,这也是众多企业仍然在使用 Looker 的原因。
基于上述分析,Hex 与 Tableau 和 Looker 存在一定的竞争关系,但是在很多时候他们也可以形成互补的关系,用于配合完成不同的用例需求。
• 强调协同功能的数据分析及可视化工具
与 Hex 的产品形态最相似、最直接正面竞争的是 Deepnote 和 Mode,他们的基础信息如下表:
Deepnote vs. Hex
Deepnote 从功能角度几乎与 Hex 一致,但是在实际用户体验层面 Hex 仍占有一定优势。例如,相比 Deepnote ,Hex 的稳定性好很多,不会像 Deepnote 那样经常容易出现故障。同时 Hex 有一些小细节很受用户喜欢,比如变量的自动重命名,当重新命名一个功能时,其余部分会自动完成重命名。这些细节体验的堆叠,也是 Hex 能够在 Notebook 市场迅速跑出来的重要原因。
Mode vs. Hex
Mode 相较之下更加侧重于使用 SQL 语言来进行问题分析,其看板功能相较于 Hex 更加出色,但 Hex 也正在这方面迎头赶上。相较之下,Hex 对于 SQL 和 Python 混合支持的体验是十分吸引用户的特点。同时,在使用 Mode 的时候大家确定标准指标会面临很多问题,很多注释都难以解释。但是 Hex 可以清晰分享标准视图,例如确定“收入”的准确定义,Hex 极强的协作性使同事能够看到公司所建立的标准信息和数据集,这对公司整体的数据分析有非常大的帮助。另外,Mode 的定价普遍高于 Hex。根据用户访谈,Mode 的单席位费大约是 Tableau 的 1/4,这一价格仍旧超过 Hex 很多。
05.
Thesis
1. 数据科学家数量增长,话语权增强
数据科学家一直被认为是个不大的群体,但随着企业对数据的挖掘和利用越来越深入,对高级分析和机器学习的需求不断上升,数据科学家的数量在快速增长,数据科学家话语权也在不断增强。Hex 从数据科学家切入,进入了一个此前不大但实则在不断扩大的市场,切入点选得比较 sharp。
2. 数据使用人群在扩大,协同需求明显
当企业资产逐渐上云之后,协同变得可实现。文档协同几乎已经成为 "must",设计领域也跑出了 Figma,而数据领域的工具一直比较专业化,针对特定群体、特定环节有特定工具。但无论在哪个领域,只要参与者数量变多,协同的需求就会存在,因为协同的摩擦系数更小、也更高效。随着各个企业都在推动数据驱动决策,数据参与者不仅限于数据工程师、数据分析师、数据科学家,管理层、产品、运营、财务等等都需要依靠数据开展业务、进行决策,而这些职能之间也不是完全割裂的,业务协同、数据分析有重叠是常事,因此有一个可以把企业数据统一在一个工作流且低门槛、易用、低摩擦、可处理数据、可观测数据、可协同、可让更多人参与进来的平台变得重要。
06.
关键问题与判断
Hex 会成为什么?
乐观:连接上下游的 Data Observability Layer 的主要玩家,数据行业的中心平台之一。
正如产品和市场部分所介绍的,Hex 的叙事分三步,第一步先从数据科学家切入,第二步覆盖整个数据团队,第三步扩展至企业内部数据参与者。如果能够把这三步走完,那么 Hex 将有机会成为连接整个数据链条上下游的 observability 层的重要玩家,并且在企业内部有网络效应。
不过这里涉及到一个问题,数据分析和数据科学领域赛道已经非常拥挤,每个细分环节都有小龙头,observability 赛道也已经有 Datadog、Grafana 等玩家跑出来,是否还有 Hex 的发展空间?我们目前的判断是虽然比较艰难,但 Hex 的确有一个比较独特的点,它在把前端设计做到非常易用、非常低门槛、能让更多非技术背景的用户参与进来的前提下,又能支持数据科学家和数据工程师对复杂应用的需求,因此它可以覆盖的用户群非常广泛。但这其中的关键点还是在于协同的需求是否真实存在?Timing 是否已经到了?协同能带来多大的附加价值?如果这些问题的答案是 No,那么其实数据分析和数据科学的每个环节都有更好的工具可以使用,Hex 的故事就不成立。
中性:以数据科学家为核心的数据协作平台。
目前 Hex 的主要用户为数据科学家,从客户访谈可以看出,数据科学家对协同的需求还是比较明显,也认可协同的价值,对 Hex 的评价也较高。另外,由于 Hex 支持多编程语言,数据分析师和数据工程师也可以参与进来共同完成数据工作。并且由于 Snowflake、Databricks 等数据平台和 Hex 保持很紧密的合作,为 Hex 导入了不少 BI 用户。因此,以数据科学家为核心的数据协作平台可能是一个比较实际的、可实现的目标。
悲观:未能在数据科学市场获取较大份额。
最不理想的情况是 Hex 最后没有拿下数据科学市场,仅仅是少数人使用的小众工具。这种情况确实有可能发生,有两个信号值得注意:1/ 有不少数据科学家表示,Hex 的价值主要在于与其他职能协同,以及前端设计得非常容易操作,但兼顾多方体验,就一定会牺牲单方的最极致的体验,因此如果不考虑协同的价值,或用户群体仅限于数据科学家,那么针对数据科学家设计的比如 Databricks 的 notebook 可能是更好的选择;2/ 我们从财务数据看到一个危险信号是 Hex 的销售效率非常低,这其中有可能是销售团队的能力和人员配置问题,也有可能是产品本身的问题,有可能产品本身还没有实现 Product/Market Fit。
关键问题检查
1. 是大市场吗 —— 短期看不是,长期看破圈能力。
在市场与竞争部分我们大致测算过 Hex 的 TAM,如果用户仅限于数据科学家,那么到 2032 年 TAM 大约为 2.05 亿美金,市场空间十分有限。影响市场规模的原因主要有两个:1/ 数据科学家数量尽管在快速增长,但总数依然很小,例如 Hex 有的客户公司里就只有 1 个数据科学家;2/ Hex ACV 较低,目前 ACV 大约为 2.5-5 万美金,绝大多数客户每年在 Hex 上的花费不超过 10 万美元,哪怕是用户类型较广泛的 Notion 每年为 Hex 支付的年费也只有 11 万美元。背后的原因是 Hex 解决的更多是养点需求,并非绝对痛点;另一方面,传统玩家如 Jupyter Notebook 甚至是 Excel 已经可以解决 Hex 用户 80% 的需求,尽管绝大多数用户认为 Hex 比这些传统工具好很多,但很少有人愿意为传统需求之上的那 20% 的价值去支付较高的溢价。并且该赛道竞争十分激烈,更有平台免费提供与 Hex 相似的功能和服务,因此该赛道公司在定价上的主动权较弱。
上述两个原因中,价格提升难度较大,可以改变市场规模的核心更多在于用户群体的扩大,即从数据科学家泛化到数据团队以及公司内部的数据参与者。因此短期来看 Hex 并非处在一个很大的市场,长期来看市场规模能否扩大还得看公司的破圈能力。
2. 是优秀团队吗 —— 是。
Hex 创始团队配置非常优秀,三位创始人均来自数据行业黄埔军校 Palantir,创始人里有擅长思考长期路线的、有擅长思考产品和架构的、也有执行力非常强的,是一个能力相对完整和均衡的团队,团队经验丰富,想法清晰。
除此之外,我们认为 Hex 团队对公司发展和产品的思考比较深入,有一些很好的观点和洞察,比如:
• 抓住了协同这一痛点;
• 关于为什么从数据科学家切入:
1/数据科学家的数量在快速增长,是全美增速最快的群体之一;
2/数据科学家话语权在不断增强;
3/数据科学家是定义指标的人,也是产生数据 insight 的人,是数据 insight 的“发源地”。数据科学家上游连接着数据工程师,下游连接着数据 insight 的使用者,如管理者、业务分析师等。数据科学家所在的位置是数据链条的战略级位置,从数据科学家切入方便未来向上下游延伸。
• 关于为什么做 observability layer:
1/数据链条的重要环节已经完成了自动化,自动化完成后很自然的需求就是可观测;
2/ observability layer 参与人数最多。
• 关于为什么从 Notebook 切入:
Notebook 是数据科学家日常工作中使用最多、花时间最多的工具,也是最基础的工具。
3. 是赛道头部玩家吗 —— 有差异化特点,但无绝对优势。
在产品和竞对部分我们有介绍,Hex 相比于其他竞品有不少独特的优势,包括:1/更好的协同功能;2/支持多语言编程;3/与其他工具更好地合作与集成(且得到 Snowflake 和 Databricks 的投资与支持);4/更好的版本控制功能等等。其他方面我们也听说 Hex 的客服支持是全行业响应速度最快、最高效的,产品迭代速度也最快。
但这些都只是差异化特点,不足以支撑 Hex 成为赛道头部玩家,从实际情况看也是如此,Hex 并没有远远甩开其他竞争对手,甚至渗透率不如传统竞对高。
建议
从客户使用情况和财务数据看,公司目前仍处在非常早期,绝对估值不高,但 P/S 倍数很高。从投资角度看目前信心不足,尤其是对其所在赛道的市场规模和竞争格局有较大 concern。Hex 能否有机会成为大公司需要持续追踪客户情况,建议重点关注使用人群泛化迹象。
延伸阅读
Inceptive:指令药物时代的 AGI 编辑器
Character AI:如何把LLM变成人类想象力引擎?
Nile:前Cisco掌门人创立,用AIOps重构千亿企业网络
AI Agent的千亿美金问题:如何重构10亿知识工作职业,掀起软件生产革命?
Sambanova:前瞻的芯片能匠,软硬结合抢滩企业LLM Serving