查看原文
其他

Glean:AI+企业搜索,重塑知识工作的未来

硅谷科技评论 SV Technology Review 2024-04-14


麦肯锡的一项调查显示,典型的知识工作者有超过四分之一的时间花在信息搜索上。这里的问题显而易见,公司希望他们的员工花时间做能让企业成功的事情,而不是浪费时间找东西。


但实现解决方案很少,原因是这是一个很难解决的问题。首先,每个企业都不同,都有自己独特的信息、应用程序、技术堆栈和员工背景。其次,直到最近十年,大多数应用程序才支持 API。在此之前,尝试与消息应用程序集成非常困难,甚至不可能。


现在,由于人工智能的进步,像 Glean 这样的解决方案成为可能。Glean 是一家生产力初创公司,通过使用 100 多个 API 索引和理解数十种产品的文档上下文,开发了智能企业搜索助手。随着信息复杂性的增加,Glean 为知识工作者提供类似 Google 的体验,以更有效地搜索内容和员工能力。该公司正在彻底改变现代团队查找内部信息的方式。通过提供公司信息的集中存储库,员工可以快速找到工作所需的任何文档、信息或人员。其最新估值达到 22 亿美元,并得到 Kleiner Perkins、Lightspeed 和 Sequoia 等投资机构的支持。其客户名单包括 Databricks、Duolingo 和 Grammarly 等。





一、创立故事



与当今许多成功的科技公司一样,Glean 的诞生源于工作中经历的真正挑战。


Arvind Jain 是 Glean 的 founder 和 CEO,毕业于 Indian Institute of Technology, Delhi 和美国华盛顿大学。曾在 Microsoft 担任 Software Engineer,后在互联网蓬勃发展以及创业热潮中加入了初创企业 Akamai Technologies 担任了 3 年的 Architect。


在 Akamai 之后,Arvind 作为 founding engineer 加入 Riverbed Technology,积累了如何从零开始建立一家企业的经验。


Arvind Jain 自 2003 年起在谷歌工作了 11 年,担任 Distinguished Engineer,领导谷歌搜索、地图和 YouTube 产品团队。2014 年,Arvind 离开 Google,联合创立了 Rubrik,Rubrik 是云数据管理领域发展最快的公司之一。


在领导 Rubrik 时,Jain 和他的团队利用了由 300 多个云应用程序组成的技术堆栈。由于数据分散在如此多的软件中,贾恩发现自己的工作效率因查找正确信息所花费的时间而受到阻碍。在 Rubrik 的年度员工调查中,Jain 观察到,查找信息是人们生产力面临的最大挑战。


这成为Glean的灵感来源,2019 年,Arvind 创立了 Glean。


Glean 的创始团队很多曾在 Google 工作过。在那里,他们有幸使用了 Moma——一个定制的内部网,可以对 Google 内部使用的所有内容进行索引。


因此,Glean 要解决的问题也非常明确:在公司内部构建一个类似 Google 的搜索系统,可以集成数百个不同 SaaS 应用程序的信息。


Jain 招募的团队包括 T.R. Vishwanath 现任 Glean 基础设施团队的负责人,Tony Gentilcore 负责 Glean 产品工程团队的负责人,Piyush Pradladka 负责领导 Glean 的搜索工作。在加入 Glean 之前,Vishwanath 在 Facebook 担任了近十年的首席软件工程师,从事新闻推送排名、广告和开发者平台等领域的工作。Pradladka 在 Uber 工作了几年,在 Google 工作了十多年,曾长期在 Google 核心搜索排名团队工作。Gentilcore 在 Google 工作了十多年,帮助实现网络搜索界面的现代化并领导  Chrome’s Speed Team。


Jain 和团队于 2019 年在凯鹏华盈门洛帕克办公室的孵化空间中推出了 Glean,并选择秘密建设数年,然后于 2021 年正式推出。


二、公司产品



Glean 是一款统一搜索产品,可以对数十个应用程序进行索引,了解上下文、语言、行为和员工关系,从而找到问题的个性化答案。该产品建立在公司知识和内容的基础上,并考虑到许可和数据治理。Glean 是公司软件应用程序之上的一层,用户可以通过网络应用程序、新标签页、侧边栏搜索、本机搜索或 Slack 需求进行交互。为了提供其核心功能,Glean 在公司独特的知识库上重新训练语言模型,以培养对内容、语言、人员和关系的透彻理解。


得益于 Google 在开放领域提供的新 Transformer 技术和大型语言模型,Glean 团队可以做一些革命性的事情:生成嵌入并构建语义搜索。在 2019 年,这几乎是闻所未闻的。产品内部看起来是从根本上增强的用户体验和准确的搜索结果。因此,如果工作人员在 Glean 中输入“向我展示 X 的产品手册”,该技术将显示 X 的用户指南、X 的团队手册、X 的产品手册以及基于语义搜索匹配的任何其他内容,而不仅仅是关键字匹配。


这种革命性的知识检索方法使 Glean 比许多竞争对手更具优势,当时这些竞争对手通常使用基于 QR 的搜索和传统信息检索 (IR) 技术。


1、搜索



Glean 的技术根据用户的角色和关系呈现个性化结果。2023 年 4 月,Glean 推出了多项生成式 AI 功能来简化搜索结果,例如 AI answers,它可以针对查询生成一个简洁的答案。


2、助理



2023年6月,Glean推出了Glean助手,这是一个由ChatGPT驱动的聊天机器人,可以利用Glean用于搜索的现有企业知识图谱,为用户提供简洁的回答。Glean助手可以直接回答问题,也可以尝试作为Glean更广泛平台上搜索的一部分提供响应。


3、知识管理



Glean 可以整理信息集合,聚合经过验证的答案,并使管理人员能够创建和共享“转到链接”,以帮助员工导航到常见的资源集合。例如,公司可以组装“产品路线图”Go Link,以便用户可以轻松访问所有必要的内部资源来创建新的产品路线图


4、工作中心



Glean 建立了一个“主页”,作为员工查找人工智能生成的建议以供阅读的文档或具有相关知识的人员的首选地点。该主页包括公司公告、员工目录、日历和多个小部件,以帮助增强员工协作,例如相关人员、最近的工作和可以见面的时间。


5、Connectors 连接器



Glean 整合组织各种知识源的能力的关键是它与这些不同系统连接的能力。Glean 已为客户所依赖的不同系统构建了 100 多个连接器。如果产品无法从特定核心系统获取知识信息,Glean 扩展到更大组织的能力将受到极大限制。


三、市场格局


1、公司客户


Glean 首先瞄准了拥有 500 到 2,000 名员工的科技公司。举个例子,Confluence 是 Glean 的客户,其员工人数迅速从 250 人增加到 2,000 多人。Confluence 认为,Glean 使 Confluence 员工作为 Glean 用户每月可以节省 15,000 多个小时。


2、市场规模


2022 年,全球企业搜索市场规模估值为 42 亿美元,预计 2023 年至 2030 年复合年增长率为 8.9%。这种增长主要是由于打破组织内部信息孤岛的优先级越来越高,特别是随着每家公司内使用的应用程序数量都在增长。大语言模型的进步还可以进一步增强企业搜索的能力,从而显著增加潜在市场规模。随着越来越多的数据转移到云端,企业搜索预计将成为该市场中增长最快的部分。


虽然估计有 61% 的公司使用某种企业搜索功能,但最大的障碍是每种搜索工具的范围有限。大多数企业拥有多个知识数据库(例如Jira、Google Docs等),但搜索功能仅限于各个平台。


3、行业竞品


在生成式人工智能应用中,搜索是一个备受关注的市场,无论是对消费者还是对企业都很有吸引力。十多年来,搜索用户体验和行业格局几乎没有发生重大变化或颠覆。因此,创业公司试图优化和改变搜索方式,并占据市场份额。根据硅谷科技评论(svtr.ai)数据库,一年来在AI搜索领域,全球近10家初创公司获得融资,不少聚焦在垂直细分领域,包括地产、教育、视频等。



企业搜索的挑战一直是许多公司试图解决的一个既定问题,因此该赛道一直比较拥挤,主要玩家包括微软、Google、Amazon、IBM、Oracle 等大型科技企业,以及专注做企业搜索的公司,如 Coveo、Lucidworks、Glean、Mindbreeze 等,这其中有像 Glean 这样新成立的公司,也有像 Coveo 这样已经成立十几年的公司。



科技巨头


(1)微软

微软通过多种不同的解决方案继续展示了企业搜索领域的行业领先地位。SharePoint Syntex 于 2020 年推出,并于 2022 年向所有 Microsoft 365 用户提供。该产品将内容 AI 集成到用户工作流程中,以便自动添加标签并索引大量内容,以便用户可以有效搜索。与 Glean 不同,SharePoint 并不与公司内的每个信息源连接,从而限制了其对 Office 365 的访问。在 Microsoft 的 Azure 云服务中,该公司提供 Azure 认知搜索,这是客户 Web 应用程序和数据中的信息检索系统,用于内部企业用例和外部网站或电子商务搜索。


(2)谷歌云搜索

谷歌于 2017 年宣布推出谷歌云搜索,作为“跨 G Suite 产品的搜索平台,包括云端硬盘、Gmail、协作平台、日历、文档、联系人等”。最初,该产品的重点是跨 Google Workspace 应用程序无缝集成,但谷歌越来越多地推出了与其他企业搜索产品类似的与外部平台的连接。该产品包括与 GitHub、Confluence、Jira 和 Slack 等的连接。


(3)亚马逊

2020 年,亚马逊宣布发布 Amazon Kendra,这是一个企业搜索平台,使用户能够在亚马逊生态系统(例如 S3)和外部(Salesforce、Slack 等)内提出上下文问题并跨孤岛搜索相关信息。)亚马逊还提供 Amazon CloudSearch,这是一种基于云的搜索服务,主要关注网站或电子商务商店等外部用例,以及 Amazon OpenSearch 服务,源自 Elasticsearch,主要用于应用程序性能审查,而不是知识管理。


新兴玩家


(1)Elastic

由热门开源项目 Elasticsearch 的创建者于 2012 年创立,为开发人员、初创公司和企业提供软件产品,使大量复杂的结构化和非结构化数据变得可用。通过专注于可扩展性、易用性和集成性,Elastic 的产品用于实时搜索、日志记录、分析和安全性,为 Cisco、eBay、Goldman Sachs 和 Groupon 等组织的内部和外部应用程序提供支持。Elastic 于 2018 年 6 月上市,从 Benchmark、Index 和 NEA 等投资者筹集了总计 1.62 亿美元的资金。Elastic 主要工作在企业后端,为外部应用程序接口提供支持,而用户却没有意识到他们的搜索是如何执行的,并且尚未表现出与 Glean 成为内部公司数据搜索领域的 Google 的愿景竞争的愿望。


(2)Coveo

2005 年在加拿大魁北克成立,是一家面向电子商务、网站、客户服务和工作场所的人工智能搜索解决方案。与仅专注于内部企业搜索的 Glean 不同,Coveo 的产品套件还包括电子商务和网站产品。Coveo 于 2019 年 11 月筹集了 1.72 亿美元的融资,估值为 11 亿美元,由 Omers Capital Private Growth Equity Group 领投。该公司目前已从 Evergreen Coast Capital、FSTQ 和 IQ Ventures 等投资者手中筹集了超过 4.02 亿美元的资金。


(3)Vectara

由 Amr Awadallah 于 2022 年创立,他曾是 Cloudera 的联合创始人,前谷歌云和雅虎副总裁,斯坦福大学电子工程博士。Vectara 是一个生成式对话搜索平台,旨在为希望与内部数据互动的商业用户提供类似 ChatGPT 的体验。该公司于 2023 年 6 月筹集了 2850 万美元种子轮融资。


(4)Guru

成立于 2013 年,是一个企业知识管理平台,旨在充当员工内联网,指导组织内最重要的资源。该公司提供智能搜索、人工智能驱动的答案和自动化的上下文知识。该公司于 2020 年 4 月从 Accel 筹集了 3000 万美元的 C 轮融资,使其总融资额达到约 7100 万美元。


(5)Neeva

传统上,企业搜索公司专注于让用户能够在雇主的内部知识数据库中搜索信息。某些产品(例如 Azure Cognitive Search或 Amazon CloudSearch)专注于在现有云生态系统中启用搜索功能。Neeva 是一家此前专注于C端搜索的公司,后来于 2023 年 5 月 21 日宣布转向人工智能驱动的企业搜索。就在宣布转向三天后,Snowflake 宣布以未公开的金额收购了 Neeva。Neeva 预计将在 Snowflake 的云生态系统中提供更高质量的搜索功能。正如 Neeva 联合创始人 Benoit Dageville 所解释的那样:“团队准确发现正确数据点、数据资产或数据洞察的能力对于最大化数据价值至关重要。”



四、商业模式


Glean 商业模式为纯 toB 的模式,未向个人用户开放。Glean 通常为企业提供两种定价模型,一是 per-seat 的定价模型,每个 seat 每月 100 美金以内;二是针对企业级解决方案的个性化定价模型。


五、经营状况


2022 年,Glean 用户创建了 700 万次搜索,满意度为 85%。尽管 Glean 尚未公开披露收入数据,但它在 2023 年 5 月透露,它正在为 100 多家客户提供服务,其中包括 Uber、Extrahop、Grammarly、Outreach 和 Confluence 等知名公司。截至 2023 年 7 月,Zoominfo 估计 Glean 的收入目前为 1470 万美元。



六、公司估值


2019 年 3 月,在 A 轮融资中从 Kleiner Perkins 等投资者处筹集了 1.5 千万 美元。


2021 年 3 月,在 B 轮融资中从 General Catalyst 等投资者处筹集了 4 千万 美元。


2022 年 5 月,Glean 筹集了由红杉资本领投的 1 亿美元 C 轮融资,估值为 10 亿美元,现有投资者包括 General Catalyst 的 Quentin Clark、Kleiner Perkins 的 Mamoon Hamid、Lightspeed 的 Ravi Mhatre 和 Slack Fund 等。本轮融资使公司总融资额达到1.55亿美元。


2024年2月,完成2亿美元D轮融资,估值22亿美元。投资方为Kleiner Perkins、Lightspeed Venture Partners 、 Sequoia Capital、Coatue、ICONIQ Growth、IVP 和 Capital One Ventures。该公司累计融资约3.6亿美元。


七、总结


Glean 的基础建立在他们过去 4.5 年开发的搜索产品之上。它不仅为 Glean Chat(更多内容见下文)提供支持,还为企业希望创建的任何生成式人工智能应用程序提供支持。因此,Glean 无意中成为了标准的企业生成式人工智能平台,无缝整合了大量公司特定知识,并使其易于用于各种人工智能应用程序。


从技术上来说,Glean 的方法是独一无二的。他们利用较小的开放域模型,例如 Bard family,然后为每个客户定制这些模型。这种定制涉及在特定企业的数据体上训练模型,确保系统理解独特的公司术语、概念、代号和首字母缩略词。然后,这些经过微调的模型可用于语义相似性和同义词检测等功能。


对于面向用户的交互,Glean 采用超大型语言模型 (LLM),如 GPT-4、3.5、PaLM 或 Llama 2。这些 LLM 通过 API 集成,主要负责生成显示到最后的 AI 驱动答案-用户。由于他们的主要作用是总结和综合,因此无需进一步培训这些LLM。


Glean 正在尝试改革知识工作者查找和消费信息的方式。通过与企业内尽可能多的知识数据库集成,Glean 可以构建上下文知识图来了解哪些信息是关键的、信息存储在哪里以及公司中的谁拥有该信息的任何可能的附加上下文。随着 Glean 继续向更大的企业扩张,该公司将必须展示处理日益复杂的知识图谱的能力,以继续有效地为客户提供服务。



经过大半年运营,我们AI创投社区覆盖人数超过10W,其中AI从业者超过10000人,大都来自全球科技大厂、顶尖投资机构和高潜创业企业。


欢迎联系凯瑞(pkcapital2023),与一群志同道合的小伙伴一起探讨。

AI公司



+


OpenAI:

人工智能突破的前沿员工名册董事会营销团队GPT Store科技狂人马斯克地产生意经微软投资帝国婚礼产品生态系统


其他:

AdobeAnthropicAmazonCanva CohereDoNotPayFigmaGoogleHugging FaceMidjourneyNeuralinkPikaReplicateRedditReplite丨RunwayScale AISheinStability AIStripeVannevar LabsZapier


AI行业



+


工具:

写作编程客服法律医疗视频搜索企服Agent代理个人助手生产力


研报:

AI合成数据LLMOpsAI创始人全球高增长AI 50企业生成式AIAI +云计算Gen AI地理分布AGI巨头的AI战争欧洲AI创业地图AI+浏览器开源AI北美科技人才中心地图AI+电商AI+勘探AI+游戏化学习AI华裔创始人AI+安全Top 50 AI工具AI域名Product Hunt 年度最佳应用


AI创投



+



创业:

性格决定创业成败丨 创业方向CEO的薪水股权和头衔创业公司董事会GTM指南选择VC丨商业计划书(BP)公司估值创业合伙人商业模式


投资:

顶尖VC投了哪些AI公司中美AI创投异同如何评估AIGC初创公司海外投资人谈AI新趋势做通才还是专才风险投资人丨红杉资本如何做投资如何及早识别独角兽创始人如何避免7大投资陷阱合伙人是怎么炼成的Thrive Capital英伟达投资策略Souring的艺术精品基金VS超级基金

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存