Perplexity:挑战谷歌,站在AI搜索最前沿
从1990年第一个互联网搜索引擎Archie在麦吉尔大学创建,到1998年拉里·佩奇和谢尔盖·布林在斯坦福大学创立Google,搜索网络的方式三十多年来几乎没有改变。ChatGPT的横空出世,让很多人认为是下一代AI搜索引擎的开始。
与传统搜索引擎相比,AI搜索让信息的颗粒度从网页细化到信息本身,进而提升了信息获取的效率。这也是市场认为有可能重新洗牌目前由谷歌主导的价值 1100 亿美元的搜索广告业务的根源所在。
这家拥有 55 名员工,估值超过10亿美元的“答案引擎”(answer engine)独角兽Perplexity,正处于AI搜索新世界的前沿。作为AI新时代 Quora + Wikipedia,其股东阵营囊括了当今AI领域的知名人物和机构的半壁江山,投资人除了当前AI芯片领域的绝对龙头英伟达之外,还有Twitter副总裁Elad Gil、前GitHub 首席执行官 Nat Friedman、Meta 首席AI 科学家及图灵奖获得者 Yann LeCun、微软前总裁Bob Muglia、Open AI 创始成员Andrej Karpathy、Y Combinator 首席执行官 Garry Tan 、亚马逊创始人Jeff Bezos等。
Perplexity 使用本土大型语言模型 (LLMs)、第三方模型(OpenAI 的 GPT-4 和 Anthropic 的 Claude 2 等)和网络爬虫的组合来返回高度相关且严格引用的结果。Perplexity 的秘密武器是它采用检索增强生成 (RAG),人工智能可以在网络上找到正确的文档,帮助 LLM 创建关联度更高和更准确的答案。
用户可以在 Perplexity 的网站上输入查询,或在 Perplexity 的移动应用程序中说出查询内容,其 iOS 应用程序于 2023 年 3 月推出;Android 应用程序于2023年 5 月推出,目前下载量已超过 200 万次,并且正在响应每天超过 100 万次查询。
Perplexity联合创始人兼首席执行官Aravind Srinivas说:
一、创业故事
阿拉文德·斯里尼瓦斯 (Aravind Srinivas) ,Perplexity联合创始人兼CEO,自2022年8月开始创业,致力于创建最快获取任何问题答案的知识平台。同时自2023年1月起,兼任天使投资人,投资了多个人工智能相关的初创公司,包括Eleven Labs(AI语音)、Mistral(AI基础模型)、Cognition Labs(AI软件工程)、Pika Labs(AI视频)、Suno(AI音乐)、Groq(AI芯片)、Cartesia(状态空间模型)、Tab(AI可穿戴设备)、Julius(AI数据科学家)、Extropic(AI硬件)。此外,曾在OpenAI担任研究科学家,专注于语言和扩散生成模型的研究;在Google和DeepMind担任研究实习生,研究视觉领域的Transformer技术和大规模对比学习。曾就读于加利福尼亚大学伯克利分校,获得计算机科学博士学位。
在热情与理想的追逐中,有时候失败似乎比成功更具启发性。Aravind Srinivas,这位印度裔美国人的故事便是如此。Srinivas的求学之路并非一帆风顺,他在印度理工学院马德拉斯分校尝试转专业学习计算机时仅因一点微小的差距而失败。然而,这段挫折期间,他没有选择放弃,而是投身于在线学习,专注于提升自己的编程技能,特别是在 Python 语言上。他的努力没有白费,在学习过程中,他不仅精通了机器学习的各种技能,还在之后的学习和实践中证明了自己的实力。在加州大学伯克利分校的学习期间,Srinivas的才华得到了认可,不仅吸引了机器学习领域的顶尖科学家Yoshua Bengio的注意,还得到了他的推荐去攻读计算机科学博士。尽管麻省理工学院拒绝了他,但他成功被伯克利接纳,并在那里继续他的研究工作,最终在 Open AI 找到了实习机会,开启了他的职业生涯。
2022年,斯里尼瓦斯与三位合伙人Denis Yarats(CTO,纽约大学人工智能博士, 曾是Quora 排序算法的 Tech Lead)、Johnny Ho(CSO,2017年毕业于哈佛大学数学和计算机专业的华裔,在 Quora 待过一年,当时在 Denis 团队工作。之后成为了职业编程竞赛选手、量化交易员)和Andy Konwinski(加州大学伯克利分校计算机博士,Databricks 的 Co-founder)一起,尝试开发一种新的AI搜索方法。
他们最初研究将自然语言转换为数据库语言SQL的算法,但很快发现这种方法过于局限。随后,他们改为开发一种结合传统搜索索引和大型语言模型的新型产品,命名为Perplexity。
二、Perplexity AI 能做什么?
Perplexity自诩为“信息探索和好奇心的瑞士军刀”,但其本质是一个由人工智能驱动的搜索引擎。你可以把它想象成ChatGPT与Google搜索的结合体,虽然它并不能直接替代这两者。实际上,这正是Google试图通过Gemini实现的方向。
它像聊天机器人一样运作:你提问,它回答。但它还能无缝地整合近期网络上的信息。因为它每天都会对网络内容进行索引,因此你可以向它查询最新新闻、比赛成绩及其他常见搜索问题。
如果比较 Google、Bing 或其他传统搜索引擎回答同样问题的质量,你会发现 Perplexity 比典型的搜索引擎更好,可以快速为您提供答案,并且比聊天机器人更可靠,可以为您提供更有用的答案。
我们以“介绍下硅谷科技评论(svtr.ai)”这个问题为例,来看看传统的搜索引擎和AI搜索的不同表现。这其实是一个比较有挑战性的问题,因为我们成立时间不长,同时在网络渠道几乎没有公开介绍公司的具体信息。
首先传统搜索引擎Google和百度给出的结果如下:
我们会发现,无论是谷歌还是百度给都是给出了网页链接,不会直接告诉你答案,至于答案是什么需要你点开链接去寻找和判断。而且在提供的几十页链接里面,真正相关的链接可能只有前面几个。
我们看一下OpenAI的ChatGpt4给出的答案:
在这里,OpenAI直接给出了一个比较中肯和复合实际的结论,直接告诉你硅谷科技评论的业务和属性。同时还给出了一个相关链接,可以点击参考。
现在我们来看看Perplexity的反馈:
我们会发现perplexity与传统搜索引擎和OpenAI还是有很大的不同,它不仅给出了简明扼要,层次分明的答案,同时在信息来源上给出了5处信息的源头。此外,在答案下方,perplexity给出了我们所提问题的相关话题,而且抓住了硅谷科技评论最核心的数据库这一话题。我们选择“svtr.ai的数据库涉及哪些方面”点击后,反馈如下:
我们看到这次结果会更聚焦AI数据库,而且结合了我们最近在AI教育领域的孵化企业高考纸鸢,详细介绍了数据库里AI教育行业的情况。值得注意的是,Perplexity并不完美,这一次,在第4条他将计算机视觉任务和硅谷科技评论(svtr.ai)数据库搞混淆。
总体来看,由于LLM的强大支持,Perplexity具有几项超越传统搜索引擎的功能:
结合网络数据和LLM,可以直接给出更精确的搜索结果。
可以提出进一步的问题,或要求Perplexity调整其提供的答案。
可以上传文档和图片,或者基于其检索到的内容,生成所需的任何文本。
三、Perplexity AI 工作原理
Perplexity 依赖于许多不同的大型语言模型 (LLMs) 来提供其自然语言处理功能 - 具体包括 GPT-4、Claude 3、Mistral Large 和 Perplexity 自己的自定义模型。它使用这些 LLMs 来准确理解用户所问的内容并总结相关答案。
Perplexity 提供以下几种搜索:
快速搜索(Quick Search),旨在返回快速、基本的答案。免费使用。
专业搜索(Pro Search) ,根据用户的需求定制其响应,还会询问用户后续问题,以进一步调整其响应。每月 20 美元。
企业搜索 (Enterprise Pro),这是其本周推出的首款商业产品,将通过扫描网络和与平台共享的公司内部数据来加快团队的研究速度。起价为每账户每月 40 美元或每年 400 美元。这可能与企业搜索明星初创公司Glean直接竞争。目前Zoom、Bridgewater 和 Databricks 等公司已成为Perplexity客户。
无论使用哪种搜索,Perplexity 的工作方式都大致相同。它会接受用户的查询,尝试了解用户想要了解的内容,找到有答案的网站和文章,然后向用户提供摘要。
如果有用户有更多问题,可以像聊天机器人一样直接提问。Perplexity 会记住每个对话的上下文(它称之为“线程”),因此用户已经提供的任何信息都将被考虑在内。
最重要的是,Perplexity 为用户提供了它使用的参考文献列表,以及指示每个关键信息来自何处的脚注。这就是它可以作为常规搜索引擎的替代品的原因,因为用户仍然可以深入研究该主题,而不仅仅是依赖人工智能摘要。
四、公司壁垒
在生成式人工智能应用中,搜索是一个备受关注的市场,无论是对消费者还是对企业都很有吸引力。几十年来,搜索的用户体验和行业格局几乎没有发生重大变化或颠覆。因此,创业公司试图优化和改变搜索方式,并占据市场份额。根据硅谷科技评论(svtr.ai)数据库,近一年来在AI搜索领域,全球近10家初创公司获得融资,不少聚焦在垂直细分领域,包括地产、教育、视频等。
Perplexity AI 作为一家 Gen AI 应用层公司,模型或技术栈能力不是核心价值,根据其创始人的介绍,公司主要专注三个关键维度:实用性、准确性、迭代速度。
实时性方面,与ChatGPT等大模型依赖训练时的数据和语料获取信息不同,Perplexity基于底层传统搜索引擎开发而得,能够及时抓取最新的信息。
准确性方面,Perplexity做了两件事情:减轻幻觉和内容溯源。为了减少幻觉现象,Perplexity引入了RAG技术(检索增强生成),RAG的作用好比是给模型提供一本教科书,让它根据特定的问题去查找信息,通过关联外部知识来提高答案的准确性,有效减少了语言模型中出现的虚假信息,使得生成的回答更准确可信。
同时,Perplexity还对生成的每一句话都附有引用链接,在保证可靠性的同时便于用户溯源或深入研究。
不仅如此,Perplexity还对召回和排序环节的算法做了创新,保证内容的有用性及引用的精确程度。其中,“召回”指根据搜索指令从数据库中获取尽可能多的正确结果,“排序”指根据用户搜索内容的相关性对召回结果进行排序,决定了搜索引擎的精确程度和性能上限。
迭代速度上,Perplexity的优异表现在业内更是有目共睹。公司投资人Nat Fridman,Github 前 CEO 称赞 Perplexity:创立不到六个月,比很多公司全生命周期发布的产品迭代都更多。领导 Perplexity 第一轮融资的埃拉德·吉尔 (Elad Gil) 表示,Aravind给他留下了深刻的印象。
AI套壳这个话题在去年引起了广泛的争议,对于任何一个依赖第三方大模型,做AI应用的公司都要回答的问题是“ 如何看待AI 套壳产品的护城河”,Aravind Srinivas 的答案如下:
五、融资历程
在Perplexity找到当前的AI搜索模式之前,Aravind Srinivas实际上尝试过不少方向,比如 Text-to-SQL 生成器,还有支持搜索 Twitter 内容的 Bird SQL,最终是如何决定做搜索?其实这背后与公司的融资过程息息相关。
Aravind Srinivas在最近接受采访时表示:
Aravind最初向第一轮融资的领投人 Elad Gil 提出的创业想法是,既然想挑战 Google,不如设计一款智能眼镜,能用内置麦克风听取我们的问题,并通过 AirPods 回答。这个设想虽然好,但现实中还很难实现。
Elad Gil 的建议是,如果真心想做搜索,不妨专注于更细分的市场,例如数据库搜索,这块市场目前还没人做,一旦成功,B 端市场的潜力是很大的,因为许多企业都需要在自己的数据库、电子表格、Salesforce、Hubspot 等内部系统中进行搜索。
于是团队听从了Elad的建议做了一个最初的产品,找了几家公司谈。市场的反馈是这个产品很酷,但用处不大,因为 Hubspot 就能看到所有数据,只需要一次性输入完就会定期更新。
然后Aravind Srinivas又询问了投资顾问兼 DataBricks 首席架构师 Reynolds Shin的意见,他的看法和之前从市场得到的反馈差不多,因为 80% 赚钱的 SQL 代码其实都不是新写出来的,而是旧的代码反复定期去跑。至于那些新写出来的查询代码,其中至少 80% 的查询都并不需要用 SQL 了。现在像 Power BI、Tableau、Metabase 这种数据分析和可视化工具越来越普及,很多数据相关的任务都不再需要用传统的 SQL 编写,特别是数据查询和报表生成。这些工具提供了 GUI 和拖放功能,用户能直观地编辑数据、查询和图表,无需编写任何 SQL 代码。
Aravind Srinivas后来看了大量的 Tableau 和 Power BI 教程视频,也亲自上手用了这些软件,发现微软和 Salesforce 开发的这些工具真的非常好用,在这个领域重复造轮子实在没有必要。如果用户真的想要一个聊天界面的话,用户希望的应该是能嵌入到这些现有工具中。Aravind于是果断放弃了数据库搜索方向。
在早期的各种尝试中,公司有一个做的很对的就是爬取了 Twitter 的所有数据。同时还做了类似 SQL 编辑器这样的企业级工具,以及一个能够生成带链接摘要的搜索服务产品。产品一上线,第一天就有数千次查询,这让团队确信方向是对的,坚定了做搜索的信念,同时要面向消费者,因为这是切实存在的需求。
最终打造了Perplexity 雏形 Web Search Slackbot,随后公司的融资也走上了顺利的坦途。
2022 年 9 月,获得 310 万美元种子轮融资。Perplexity 吸引了诸多AI 领域的知名人物投资,包括前Twitter副总裁Elad Gil、前GitHub 首席执行官 Nat Friedman、Meta 首席AI 科学家及图灵奖获得者 Yann LeCun、微软前总裁Bob Muglia、Open AI 创始成员Andrej Karpathy 等。
2023 年 3 月,在 A 轮融资中筹集了 2560 万美元,估值 1.5 亿美元。投资方为Databricks Ventures,以及天使投资人等。
2023 年 10 月,完成5000万美元融资,估值达到 5 亿美元。投资方为 IVP 。公司已有1.5万个付费用户,每年的营收为300万美元。
2024年 1 月,完成7360万美元融资,估值5.2亿美元。投资方为IVP、NEA、Databricks Ventures、前Twitter副总裁Elad Gil、Shopify CEO Tobi Lutke、前GitHub CEO Nat Friedman、Vercel创始人Guillermo Rauch、Nvidia、Jeff Bezos。公司拥有1000万月活跃用户。
2024年 4 月,完成6300万美元融资,估值10.4亿美元。投资方为 Daniel Gross、亿万富翁 Stanley Druckenmiller、Y Combinator 首席执行官 Garry Tan 和 Figma Inc. 首席执行官 Dylan Field 等。目前公司拥有 55 名员工,在美国处理的用户查询数量接近 7500 万,比 2023 年全年还要多。公司在最近半年内收入突破 2000 万美元。
目前正在计划以25亿美元至30亿美元估值,进行2.5亿元融资。
六、公司的未来
无论在 A16Z 的 《2024年,面向C端用户 Top 50 GenAI 工具分析报告》,还是红杉的《福布斯 2024年 AI 50 强》,Perplexity在用户的流量端,和在投资机构的评价体系中,都是AI搜索引擎领域冉冉升起的新星。
Perplexity在本周宣布计划2.5亿融资之时,市场传言OpenAI 将要推出 Perplexity 的竞品 Sonic - SNC(SearchGPT)。作为一家AI应用公司,Perplexity除了面临谷歌和微软科技巨头竞争压力之外,另一位不容忽视的威胁就是OpenAI,这位几乎是所有AI应用领域创业者都要面临的潜在竞争对手。
硅谷科技评论(svtr.ai)正在全力打造覆盖美国硅谷和国内北上广深杭等几大城市的AI创投社区,如果您有兴趣成为我们的导师、顾问或是创业合伙人等,欢迎联系凯瑞(pkcapital2023),与一群志同道合的伙伴一起构建。
我们AI创投社区覆盖人数超过10W,其中AI从业者超过10000人,大都来自全球科技大厂、顶尖投资机构和高潜创业企业,文末扫码访问AI数据库和社群通讯录。
AI周报:
001 | 002 | 003 | 004 | 005 | 006 | 007 | 008 | 009 | 010 |
011 | 012 | 013 | 014 | 015 | 016 | 017 | 018 | 019 | 020 |
021 | 022 | 023 | 024 | 025 | 026 | 027 | 028 | 029 | 030 |
031 | 032 | 033 | 034 | 035 | 036 | 037 | 038 | 039 | 040 |
041 | 042 | 043 | 044 | 045 | 046 | 047 | 048 | 049 |
AI创投
+
AI行业
+
AI公司
+