查看原文
其他

最新有趣的AIGC产品分析(上)

深思圈 深思圈 2023-05-07
前言
这是我首次尝试付费文章,为了感谢大家的支持,付费的朋友可以扫码加我微信,有机会线下见面交流,请您喝咖啡/茶。此外相信很多付费的朋友也同样在看AIGC领域的创业机会,既然是创业,融资就是很关键的因素,特别是在当下融资环境不好的时候,因此我特别准备了一份最近还在出手投资种子轮的全球投资机构名单(海外VC,非国内),里面包括了在11月份投资了100万美金以上种子轮的投资机构和具体投资人的联系方式,希望可以帮助到大家。



随着这波AIGC浪潮的兴起,就像之前红杉那篇翻译文章《红杉观点|生成式AI:一个创造性的新世界》里提到的,这是全新的一次应用层创业浪潮,许许多多AIGC相关的应用层产品开始涌现。因为我自己目前也在看这方向的创业机会,所以这两个多月来我在Twitter、Product Hunt、Reddit和Hacker News上花了大量时间来挖掘和体验这些新产品,并对这些产品的本质核心和长久发展做了深度思考和分析,最终整理成了这篇文章,接下去还应该会有2篇文章,来讲一讲更多最新产品。


这也是我首次尝试付费文章,为了感谢大家的支持,付费的朋友可以扫码加我微信,有机会线下见面交流,请您喝咖啡/茶。此外相信很多付费的朋友也同样在看AIGC领域的创业机会,既然是创业,融资就是很关键的因素,特别是在当下融资环境不好的时候,因此我特别准备了一份最近还在出手投资种子轮的全球投资机构名单(海外VC,非国内),里面包括了在11月份投资了100万美金以上种子轮的投资机构和具体投资人的联系方式,希望可以帮助到大家。


另外之前创建的深思圈信息分享群已经运行快3个月了,里面会实时分享最新有用和有趣的信息,特别是AIGC这块,群里的信息密度和新鲜度非常高,交流氛围也很好,大家一块在群内讨论和学习。目前1群已经满员,2群也已经接近满员,欢迎感兴趣的朋友可以后台回复关键词【信息】扫码入群



导语


本文主要涉及到了垂直工具、搜索引擎、信息提炼、插件和自然语言交互这五种类型的产品,文中提到的产品基本都还是在早期阶段,很多甚至还只有一个Demo视频,但我觉得这些产品在某种程度上代表了某一类新的产品范式和交互体验。我们目前还是处在AIGC行业非常早期的阶段,新的AIGC的产品范式究竟应该怎样,这是很多创业者和投资人关心的一个点。我希望通过这一系列文章,能够以海外最新的产品应用,带给大家更多启发和思考。在文章的结尾,是这两个多月跟很多投资人和创业者交流下来,对目前AIGC应用层创业的一些思考和总结。


另外在上一篇文章《一文带你了解生成式AI》里也提到了Antler调研了超过170家生成式AI相关的公司和平台,整理出了一张目前来看最全面的生成式AI行业图谱报告,同时还有一张统计表包括这些公司相关的信息数据,比如行业、地点、一句话介绍、成立时间、官网、最新融资轮次和数额、创始人姓名和投资人姓名等,想要了解更多AIGC产品的朋友可以看上一篇文章,获取相关图谱和表格。





01.


垂直工具


Tome(tome.app)

这是一款输入文字,自动生成幻灯片的产品。跟之前文章《种子轮融了700万美元,新一代革命性PPT来了》和《YC投了一款针对外部场景的新一代演示工具》中提到的Gamma和Journey很像,Tome也是基于网页方式展示内容,而不像传统幻灯片是PPT格式。这样的好处就是可以支持各种内容形态的展示和集成,比如3D渲染模型、视频和Figma、Twitter等实时动态信息等。Tome的两位创始人都是产品背景,分别来自Facebook和Instagram,在融资方面比Gamma和Journey都更胜一筹,已经拿到了630万美金的种子轮和2600万美金的A轮融资,分别由Reid Hoffman的Greylock和有老虎背景的Coatue领投。Tome核心的亮点在于用户可以更好地聚焦在想法和文字内容,而不需要担心排版等格式问题。其中比较有特色的功能是支持视频讲解录制,等于内置了一个Loom,用户可以边浏览幻灯片,边听录制好的视频讲解。在演示时,Tome还可以自适应各类屏幕大小呈现内容。



从使用场景上看,Tome在其官网列举了针对产品和设计演示、公司战略、客户教育、销售展示和创意分享等用途。我个人认为从整个生产工具发展趋势来看,PPT作为一种诞生于上个世纪的演示形式,确实到了需要创新变革的时候了。如果说Notion可以看作是Doc文档的进化,Airtable可以看作是Excel表格的进化,那么Tome、Gamma和Journey很显然就是对PPT幻灯片的进化了。这些新一代的工具基于云端化和协作化的新特点,在使用上都变得更加简单和方便,体验上则更加顺畅和精致美观,同时支持集成各种各样外部的数据源。



而Tome除了在呈现方式上做了革新,在生产制作方式上用到了AIGC的技术,来帮助用户更好的聚焦在文字内容和想法表达上,而无需去担心繁琐的格式排版等问题。就像上面视频演示的那样,实际上手体验了一下,在用户新建一个文档后,在输入框中输入相关的主题,Tome就会根据主题来自动生成相关的页面,生成的内容大致分为文字和图片,点击右侧按钮就可以看到生成图片对应的Prompt,并且用户可以修改Prompt来生成新的图片。Tome AI底层模型应该用的是GPT-3和DALL-E,目前每一次生成都需要花费相应数量的Credits,用户可以通过推荐朋友来获得更多的Credits。总体感觉上来说,目前生成的文档可以算是模版级的参考,并不能真正拿来直接用,但是可以提供一些样式和框架上的帮助。图片素材直接生成倒是一个比较实用的功能,不需要在上网找素材了,但这个能力有很多类似工具都可以实现,长期来看无法形成独特的价值点



当然,目前只是Tome刚刚推出的一个Beta测试版,相信在未来会有更多的功能,比如多种排版样式的选择以及更加精准的文字生成等。Tome背后蕴藏的核心底层逻辑是值得参考的,就是充分发挥AI代替人去做重复性、机械性的劳动。选择这样一个垂直场景,是一个不错的切入点。但这里面临的挑战就是现有的技术是否能够实现这一点,还是只能是在某些特殊场景下做demo,但生成效果的限制性很大,到了日常工作中无法真正实现效率的提高,这是我认为目前在这一领域做AIGC产品不得不思考的一个问题。


AI Canvas(kive.ai/canvas)

这款工具定位是AIGC时代的Figma,能够跟他人实时协作来共同通过Prompt生成图片,并在此基础上进行修改。它内置了多种不同的生成风格,方便用户快速选择自己想要的风格,而不需要再输入各种Prompt细节参数。此外它还支持替换生成图像的部分元素,再此基础上进行新的生成操作,并自动适配原有的图像,同时在此基础上,用户可以无限拓展图像的边界,每次新生成的部分都会跟原有样式做适配。



AI Canvas主要定位是一款团队协作的设计工具,可以帮助实现市场营销、设计、摄影和品牌等类型的视觉设计需求。这是一家2020年成立于瑞典的创业公司,其创始人是一位广告片导演,曾为Nike和Spotify都拍过广告。公司在成立之初拿到了150万欧元的种子轮,当时定位于视觉资产的管理库,通过AI来实现视觉资产的分类和组织管理。在今年春天,随着生成式AI浪潮的兴起,团队认为需要转变方向,重新Pivot到了创作这一环节,并在今年10月份完成了新一轮700万美金的融资。



简单上手体验了一下产品,目前来说产品功能还比较单一,主要以设计绘画艺术作品为主,还无法真正应用到生产工作环节中,离想要做AIGC时代Figma这一目标还有一些距离。这个产品未来的挑战也跟Tome一样,在于是否能够真正将AI能力融入到目标用户的生产工作流中,并带来实质性的效率提升。此外还有一家类似的公司,叫做Alpaca(getalpaca.io),但这家公司在产品形态上主要是以Photoshop插件的形式做切入。



Spellbook(spellbook.legal)

Spellbook是一款基于GPT-3的合同审查和修改工具,由合同管理平台Rally Legal推出。它主要定位是法律合同的Copilot助手,以插件的形式集成到了Word里,支持自动生成合同条款、总结合同内容、解释合同条款和术语和谈判要点等等功能,可以帮助提升用户至少3倍的效率。这是一个典型的在现有垂直SaaS工具或者平台的基础上,基于目前这一波AIGC浪潮,推出的新产品。Rally Legal原来就是一个针对合同管理的垂直行业SaaS平台,在其上面有大量的合同数据和现有用户,基于现有GPT-3的能力结合原来数据进行了fine-tune之后,就有了Spellbook的诞生。



这款产品算是SaaS借助AIGC实现第二曲线的典型样例,据其创始人透露他们的用户数量在11月份增长了32%。随着这波AIGC浪潮越来越火热,最近我也看到越来越多SaaS产品开始加入AIGC的功能,比如无代码开发平台Softr就新增了文案和图片素材生成功能,还有Notion、Canva和Craft等产品也纷纷增加了对应的生成能力。这也符合这一波AIGC创业真正的核心价值,模型即服务Model As A Service,基于底层大模型,依托于不同垂直场景的数据进行fine-tune来带给目标用户更好的体验,技术只有服务于具体场景和人群,才能带来长久的价值。





02.


搜索引擎


SciSpace(typeset.io)

定位于学术论文的Copilot,利用AI帮助你快速阅读并通过自然语言提问的方式来理解论文,此外还支持模糊搜索和查找相关的论文。SciSpace目前支持超过270万篇学术论文,具体功能有:

  • 高亮内容,得到该内容的进一步解释

  • 截图数学算式或者图表,得到相关的解释

  • 通过提问来获得论文内容,比如常见的论文概述、结论、实验方法等等,支持多轮对话。



用户无需注册,即可上手体验相关的功能,并且还支持上传你自己的PDF文档来进行阅读和提问。我上手体验了一下,SciSpace还支持中文来展示结果。此外还有一款类似产品叫做Elicit,网址是:elicit.org。这一类工具可以大大提高阅读论文的效率,同时对于非学术类的用户来说,也可以通过日常自然语言的输入来找到相关论文里的答案,在可信度上会高很多,并且遇到不懂的专业性问题也可以通过问答的方式来获取最通俗的解释,这是AI降低学习门槛的最佳实践。从大的类型上看,这一类产品可以归类为垂直搜索,并且借助AI实现了语义级的搜索体验,从而带来对话式的效果。



Huberman AI(huberman.rile.yt)

跟SciSpace很像,Huberman AI也是属于垂直搜索的产品。严格意义上来说这不算是一个完整的产品,属于一个小的Demo,但非常具有指导意义。该产品的开发者用Open AI的Whisper把Huberman的Podcast都转成了文字,再利用Open AI刚推出的嵌入模型embedding-ada-002对文本进行了处理,并存到Pinecone向量数据库中,最后利用text-davinci-003来实现语义级的搜索和问答。



用户可以通过自然语言的方式来进行提问,AI会把Huberman曾经在Podcast说过的内容经过整理以自然语言的方式进行回答。此外Huberman AI还支持关键词搜索,找到对应关键词的时间节点,点击即可收听相关的内容。非常有趣的demo,开发者接下去还准备上线基于Lex Fridman播客的问答产品,未来还可能支持用户自主添加相应的播客甚至其他内容,类似产品还有Podly.aiAnypod.ai



我个人认为AIGC目前比较可行的创业方向会有两条路,一是通过将AI能力融入产品之后,可以把原有解决方案的效率有数倍的提升。另一种则是因为有了新的AI技术,做到了原来没办法实现的功能。这两条路的核心本质都是打破了原有产品的价值链,通过技术上的迭代,使得原有产品的先发优势和壁垒不再存在,从而有了新的创业机会,这往往也是一轮大的平台级机会的典型标志。比如原来PC互联网时代很多产品优势和壁垒,到了移动互联网时代可能就不再有了,新的创业公司可以充分利用新技术来快速占领市场,关于这方面的更多内容可以看之前Index Venture的《这一轮AI会带来什么样的范式转移?》这篇文章。


Huberman AI这个产品就是很典型的例子,Podcast本身作为音频,很多内容就是不可被搜索的,但是这位开发者在Open AI提供的这些AI技术栈的帮助下,一个人只花了一天时间就完成了这样一个产品的开发工作。相信在未来会有更多基于各类内容的垂直搜索产品,特别是embedding-ada-002发布后,大大降低了使用费用,只需要40美金就可以处理10万的文本内容。这都是这一波AIGC技术发展,基于底层大语言模型带来的应用层创业机会



Perplexity AI(perplexity.ai)

这是一款基于AI大模型的搜索工具,定位于通用和垂直场景的搜索问答和数据筛选展示功能,在Twitter上被誉为是新一代的Wolfram Alpha。Perplexity发布于12月8日,在ChatGPT发布后不久,在当时Perplexity核心的能力就是基于OpenAI GPT-3.5的底层模型加上Bing的网络搜索功能,来给用户输入问题的直接答案,可以被认为是具备联网功能的ChatGPT。无需注册,用户就可以直接在搜索框中输入问题,回车之后就可以得到这个问题对应的直接答案,这个答案来自Bing搜索之后的信息源加上底层大模型的能力来生成的,并且在回答下面还会有引用信息源的链接。



而就在这两天,Perplexity AI又推出了Bird SQL的新功能,一个基于Twitter的

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存