编辑丨火狐狸
6月27日,初创公司Hebbia被曝已经筹集到近1亿美元的B轮融资,领投方为Andreessen Horowitz,Hebbia是一家利用生成式人工智能搜索大型文档并反馈答案的公司。就在Hebbia被曝融资的前一天,6月26日,诞生于国内的人工智能公司思维天空也公布了融资消息,IT桔子显示,思维天空此轮融资为天使轮,融资金额为数千万人民币,投资方并未有披露。思维天空的创始人王保平则有着阿里和字节工作的背景,其就职于淘宝期间推出过前端领域的大热框架SeaJS、KISSY,是阿里巴巴旗下语雀的创始人。2023年4月加入字节跳动担任飞书开放平台负责人,从飞书离职后,王保平在今年5月创办了思维天空。公开信息显示,思维天空主打AI原生在线办公应用。人工智能搜索是AI创业赛道的热门选择,将应用落地到在线办公领域,又是在整个大模型创业环境中寻求到的细分赛道商业化方向,整个市场的空间有多大?用户痛点又该如何切入和解决,我们在关注Hebbia和思维天空融资信息的同时,更多的思考方向在于,在线办公或者具体到文档搜索领域中,用户真正的痛点是什么,而当下又有相当多的大模型产品抢滩这块搜索的市场,什么样的AI搜索产品才是更适合办公场景的,才能成为用户的首选?
在关注Hebbia的时候,我们发现一个非常有意思的现象,就是这家公司在介绍自己产品的时候,内容表达表现出超高的自信,比如:我们拥有世界上最伟大的聊天机器人;Google仅索引了全球4%的数据。Hebbia正在释放其余96%的资源,使其成为知识工作者经济的中心平台。我们的使命是到2030年将强大的人工智能交付给10亿人。按照Hebbia在官网上对自己公司和产品的宣传,我们甚至可以理解为这是一个准备跟谷歌抢市场的企业,当然也就更好奇其底气何来。从发展历史来看,Hebbia早在2020年就诞生了,时间往前推4年,彼时,对于大多数普通用户来说,对于AI办公的了解都非常浅显,Hebbia算是在技术上有一定的先发优势。
Hebbia的上一轮融资发生在2022年9月,彼时,他们拿到了3000万美元的A轮融资,由Index Ventures合伙人Mike Volpi领投,全球几位知名的搜索和人工智能投资者也参与其中,包括雅虎创始人兼首席执行官杨致远(Jerry Yang),以及谷歌创始董事会成员兼首批投资者之一拉姆·施里拉姆(Ram Shriram)。另一位Alphabet董事会成员Marty Chavez、Stanley Druckenmiller、Kevin Warsh、Julius Genachowski、Alexandr Wang、Pieter Abbeel、Henrique Dubugras和Raquel Urtasun也在内。 不难看出,Hebbia在整个人工智能搜索领域还是备受瞩目的,而这种关注更多的还在于其团队在专业领域的行业数据和经验积累方面。Hebbia的产品主要目标客户是金融服务公司,包括对冲基金,投资银行,律所等,这些行业的一个共同特点是,从业人员需要在工作中处理大量的文件,并且针对文件内容进行信息筛选,总结,转而再输出新的内容。Hebbia的人工智能可以同时查看数十亿份文档,包括PDF、PowerPoint、电子表格和成绩单等,并反馈给用户具体答案。从基础功能来看,Hebbia的产品解决用户的第一个基本痛点是大量文件的基础信息搜索筛选能力。另一个问题在于,市场上已经有足够多的信息筛选和文档处理搜索工具,但人们很难说出,哪一个就做到了头部,做到了Hebbia梦想中的“10亿用户”,所以问题到底出在哪儿?在争抢10亿用户市场过程中,是什么困住了搜索工具的脚步?
专业性和理解能力,AI搜索绕不开也躲不掉的两个痛点
●搜索工具是否足够垂直的应用到专业办公领域,带来的搜索结果基于怎样的数据基础来实现,也就是说,搜索工具能否在办公领域提供更具专业性的检索筛选总结的能力。●搜索工具对于人类语言的理解能力,能否更精准的理解到人类表达的语义中的要求(甚至有时候这个语言表达结果相对模糊的情况下,搜索工具能否根据语境去延伸理解)。
这个问题,Hebbia的企业产品是非常具有典型意义的代表,其创始人George Sivulka是斯坦福的博士,在斯坦福读博期间,Sivulka身边的很多朋友都从事金融,并购等方面的工作,他们需要在每周的工作中处理上千份文件,在此过程中,识别出NLP可以解决的问题后,Sivulka着手构建智能搜索引擎,该引擎利用他的研究使组织能够安全地为创建、共享或协作的每个文档建立索引。基于与金融行业的朋友们工作中积累的经验和一些资源,Sivulka明确了其构建搜索引擎产品的目标痛点,并且细化到具体的金融领域,这样在数据采集,筛选,指令的优化等层面上,Hebbia相比于其他搜索产品来说具备相对更专业的搜索能力,对指令的理解以及对信息的处理也更贴近于金融行业专业性的需求。
第二个问题,涉及到搜索工具对于人类语言理解的问题。在理解这个问题的时候,可以跳出Hebbia这个产品本身,去看当下的搜索工具市场。无论是Chatgpt还是Gemini、Copilot等多种AI搜索工具,其给用户带来的都是大而全的信息检索支持,所以在这类产品层出不穷的过程中,就会迎来一次又一次的产品功能测试的比较,在此过程中,用户也就发现,这些产品在搜索能力上都不能做到尽善尽美,各有各的优点,也各有各的问题。而这也就衍生出另一个矛盾,当我们在使用AI搜索工具的时候,这个工具本身带给我们的是提高了阅读效率,还是增加了信息垃圾?当然,从开发者的角度,其目标固然是为了通过工具来成为人们的助手,包括现在整个AI创业赛道,很多企业的产品设计也都在向着AGI方向靠拢,让AI工具以助手的形式存在于用户的工作生活中。但因为技术,算力,数据等多种因素的影响,目前AI搜索工具面临到的一个尴尬问题就是,信息处理能力达不到更好的效果,对人类语言指令的理解过于片面等。介于此,这些在细分领域做垂直搜索的产品,才显得更有工具性价值,其在市场应用过程中的成绩也更具有参考意义。Sivulka曾表示:“理解人类语言的人工智能将成为未来十年最具影响力的发明,我们首先要改变金融服务业,但这只是开始。”从一些初创公司的动向来看,他们大多以一个垂直领域切入,比如Hebbia所涉及的金融行业,在这个行业做到更专业的信息搜索处理能力之后,再考虑将经验复制。这和市面上很多搜索大模型覆盖所有用户的模式是不一样的,但对于初创公司来说,这种由小赛道崛起再去拓展新领域的方式,是相对保守但更能获得优质效果的选择。当然,在类似的赛道,也有通过不同切入点而处理办公需求的工具。比如ChatPDF。单纯看名字就大概理解了这个工具的功能,就是跟PDF文件进行对话,延伸来讲,就是通过这个工具,导入任何PDF,可以在工具中根据PDF内容提问题并获得答案。同时,直接导入PDF之后,ChatPDF会根据PDF的内容进行分析总结,提炼关键要点。ChatPDF更针对于学生群体,比如导入一本书或者一部小说的PDF文件,这个工具可以帮助用户快速提炼文章要点。看起来,ChatPDF和Hebbia类似,也是针对比较特定的一些群体而服务的AI信息筛选工具,但使用ChatPDF的过程中我们也关注到一些问题,比如,其单纯的针对PDF类型的文件的信息筛选和检索,适用的文件类型过于单一。其次,在内容筛选总结之后,其提炼出的核心要点是否足够专业,比如一个学生利用ChatPDF分析一部文学作品,其获得出来的内容拆解结果是否会出现同质化,那么相应的,从学生用户的角度来说,他们想利用ChatPDF分析一部文学作品,也仅限于对这部作品的初步理解,但是要想表达出属于自己的观点,还是要深入到文学作品中去阅读。
近期ChatPDF网站流量情况(数据来源:similarweb)那么作为工具,类似ChatPDF也是针对垂直市场开发的,但是其弊端也非常明显,即PDF分析结果的同质化以及适用文件类型单一的问题。针对这些问题,也有人提出,ChatPDF这类过于垂直和小众的工具将来或许会被其他应用所取代。综合来看,在垂直领域赛道去做搜索工具,确实是一个不错的切入点,并且前提是,开发者团队具备对该行业信息数据的足够积累,以及对行业用户痛点的全面了解,要比用户本身对他们行业的理解更深入更专业。其次,垂直赛道是指在服务领域上的垂直,但是在工具支持的技术形态上,应该是更丰富的,否则,被其他AI工具所取代,是迟早的事。当然,就现在的AI搜索工具发展情况来看,对人类语言的理解能力做到不片面,更深入,才是搜索工具们最基本的目标,这个问题则需要长久的数据积累和技术迭代来解决。
7月4日,由扬帆出海、阿里云国际联合主办的《橙云出海丨AI驱动泛娱乐融合与创新沙龙》将于深圳市举办,点击下方小程序马上了解活动详情。