查看原文
其他

“生成式技术”正在颠覆人类创作!

王启隆 CSDN 2022-12-08

整理 | 王启隆

在过去的半年里,AI 写小说、绘画和剪视频等热点新闻火爆全球,现在只需要在键盘上敲几个关键词,AI 就能在烧着我们显卡的同时画出一幅幅优美的图画,一个全新的应用世界向未来的初创公司敞开了大门。

人类现在拥有着一大批高质量、廉价、快速的 AI 模型,用以生成文本、图像、视频、软件代码、音乐、声音和 3D 建模,而这些 AI 模型都不存在版权和抄袭问题。这场契机,可能将引起自加密货币问世以来互联网最大的一次变化。

在过去的两年里,硅谷明星早期投资机构 NFX 的创始合伙人 James Currier 已经在这个领域投资了 4 家公司,并计划在未来的一年内进行更多的投资。本文便是以 James Currier 在 NFX 博客上发布的文章为基础,为所有跃跃欲试的创业者和对 AI 潜力感兴趣的开发者,介绍这场人机协作的新变革。

AI 的得奖画作。你喜欢人工智能的画吗?

 “生成式 AI”(Generative AI)或 “AIGC”(AI-Generated Content)这样的名字已经广为人知,但事实上,AI 只能构成这项技术的等式的一半。AI 模型仅仅只是这些堆栈的使能基本层,而它的顶层将是数千个甚至数万个应用程序,是整个成熟的生态。本文将用一个更宏观的概念—— “生成式技术”(Generative Tech),来命名这场变革。

2021 年 1 月 11 日,人工智能初创公司 Jasper 成立,该公司通过 AI 在博客文章、社交媒体帖子及网页等平台自动生成文字内容。在上市 18 个月后,Jasper 的营收达到近 1 亿美元,估值达到 15 亿美元。 

如今,世界各地陆续诞生了许多“生成式 AI 平台”,生成式技术行业的发展速度如此之快,以至于它已经得到了实际收入和高估值的验证。据传,支持 GPT-3 和其他 AI 模型的 Open AI 也在筹集资金,估值高达数十亿美元。另一家大型 AI 模型制造商 Anthropic 亦是筹集了超过 7 亿美元。

2022 年 9 月,投资网站 Signal 中加入了“生成式技术”作为新的投资类别,呼吁投资人或天使投资人加入这个新领域,鼓励勇敢的创始人立即在这个领域创建公司,以赶上技术采用周期的最佳部分。新的浪潮已经到来,所需的仅是无畏的投机者。


“生成式技术”有什么独到的创新之处?

图源:NFX

生成式技术是一种全新的互联网拓扑结构。

时至今日,互联网的特点还是以前的那一套:也就是先通过数据库查询,获取存储的旧内容,再从中心传递给处于信息网络边缘的个体。生成式技术会改变互联网现有的拓扑结构,因为它会先让独特性的内容在信息网络边缘生成,再通过个体的行为完成最终实现。

这是一个重大转变,能为初创公司带来无限的机会。如果说 Web1 是“只读”的、Web2 是“读写”的、生成式技术是“读-写-生成”的,那么 Web3 就是“读-写-生成-自有”的。生成式技术如今在与 Web3 并行发生,并且发展得十分迅速。

图源:NFX

人类活动因生成式技术发生变化。

生成式技术的存在,能让全球将近二十亿的知识分子提升自己的工作效率和质量。一些人可以因此去做自己以前不能做的工作,创造新型就业岗位。虽然必定会有一些工作被降级、威胁、取代——并在未来 36 个月内引起数千万工作者的恐惧和自我怀疑——但是,最终的结果必定是利大于弊,人类整体的能力、生产力和效率的扩大将远远超过损失,最终产生数万亿美元的价值。

对于知识分子和创作者来说,灵感是至关重要的。作家、学生、市场营销人员、程序员、建筑师、平面设计师、音乐家、摄像师、销售员、客服、剧作家……世界上有太多种类的职业工作者渴求灵感,而生成式技术可以提供源源不断的灵感,这个工具有助于他们的脑中产生“第一个想法”,实现从无到有的突破。

StabilityAI 生成的图像

在今天这个时代,软件一直被用来完善人类最初的灵感,负责灵感诞生后的生产和实现,将人类脑中的幻想变为现实。生成式技术可以让灵感的形成过程中也得到机器的帮助,再结合旧时代的软件,走完剩下的路。

这种从 0 到 1 的改变,是今天的软件无法实现的。但生成式技术,可以让人类从任何项目的起点就得到 AI 的帮助。

正是因为我们总会遇到创造性的时刻、遇到灵感的诞生,才让人觉得人类是如此独特和神秘,是我们生而为人的骄傲。如果机器人都能有思想了,那还需要我们人类做什么呢?这自然会引起许多不安。

当然,就像大多数人机界面诞生之初一样,人类最终会将克服一切困难并习惯它。在未来,AI 会从一件工具变成人类的合作伙伴,这将会是新的常态。

1980 年的时候乔布斯说过,苹果的 PC 是人类思维的自行车。那么,生成式技术便是人类思想的一艘火箭,这些 AI 模型的创造者甚至可能将其视为真实的头脑。

自五十年代以来,人类一直在讨论基于软件的思维的必然性。1997 年,IBM 的深蓝(Deep Blue)在国际象棋比赛中击败了卡斯帕罗夫(Kasparov)。2016 年,AlphaGo 在围棋比赛中完胜李世石,实现了一次重大飞跃。从 2022 年开始,生成式技术的问世会对未来的全球数十亿工作者产生深远的影响。


为什么生成式技术能够发展至今?

近期,Open AI 提供了专用于“生成式 AI 模型”的开源替代方案,让生成式技术在近半年内逐渐变得开源开放。2022 年 2 月, Eleuther.ai 发布 GPT-NeoX-20B,成为 OpenAI 的 GPT-3 生成式文本技术开源替代方案;又过了半年,2022 年 8 月,StabilityAI 推出了 Stable Diffusion,成为 OpenAI DALL-E 2 的生成式图像/视频的开源替代方案,不久前,Stable Diffusion 宣布融资 1 亿美元。

生成式技术已经逐渐吸引了多家公司入场,这些公司在价格、质量和便利性多方面展开竞争。作为反馈,在过去的两个月里,AI 生成图像的成本下降了 100 倍。在今天,经受训练的 Stable Diffusion模型,已经可以微调模仿出宫崎骏知名的吉卜力风格,达到以假乱真的地步。

StabilityAI 已经训练出宫崎骏动画风格的成熟模型

如此可见,AI 生成的文本、图像、代码、语音质量正在迅速达到人类的水平,其中有些作品甚至能让人误以为 AI 通过了图灵测试。艺术作品的质量通常很难进行量化的比较或客观的衡量,但当你看到一件艺术作品的时候,你会在潜意识立即对它做出反应,从而进行质量的判断。

正如 2021 年斯坦福大学人工智能指数所指出的那样,对于一些受限的应用,人工智能已经发展到“足够高的标准,人类很难区分人工智能合成和非人工智能合成的作品”。我们正朝着“万物皆可生成”的方向前进。

这是一场技术界的寒武纪大爆发。互联网的生态因生成式技术的诞生开始改变,信息产业浪潮将再次到来。生成式技术还处于早期阶段,但它已经从曾经科幻作品中的幻想逐渐演变为现实。生成式技术与自动驾驶汽车不同,因为生成式技术不用面临监管问题,更不需要担心交通事故和性命安全。生成式技术与虚拟现实不同,因为虚拟现实技术还需要找到有意义的应用方式,也不用普及硬件设备,生成式技术如今已经有着相当成熟的应用方式了——那就是创造灵感。

事实上,都不需要考虑成本和质量,几乎任何一种生成式技术内容都足够让一家公司发展起来:Podcast.ai 就是一家完全通过“生成式技术”运营的播客,2022 年 10 月 12 日,在 Podcast.ai 推出的第一集播客节目里,AI 模拟了已故的乔布斯,让美国知名播客主持人 Joe Rogan 和这位“AI 乔布斯”进行了一场长达 20 分钟的对话。

生成式技术如今所处的位置仍只是一个斜坡,还需要不懈地攀爬让它实现技术界的变革。在 AI 技术经历了 14 年的停滞之后,我们的大多数软件和人机界面可能会在未来 5 年内开始得到显著增强,并为创业者提供无尽的机会。


生成式技术产品都有哪些特点?

生成式技术产品一共分为两层:

底层自然就是它的 AI 模型。AI 模型能够吸收用户独有的想法,生成新颖的结果,例如 OpenAI 的 DALL-E 或 GPT-3,都是典型的 AI 模型。AI 模型的价格还在逐渐下降,早期还是高不可攀的 1 亿美元,现在下降到了千万级别,而开源的 AI 模型也如同雨后春笋般冒出,想必在未来也是触手可及。

顶层就是它的应用程序。应用程序是一切的结果,它能产生持久的业务,为公司创造价值。初创公司如果想要获得竞争优势,那么不仅需要独特的创意,还需要合格的包装与应用程序,二者缺一不可。

图源:NFX

生成式技术降低了很多领域的技术壁垒。一个人哪怕不是建筑师,也能知道什么样的房屋是适合自己的,并使用这项技术生成房屋改造图纸;一个人哪怕不是插画师,也懂得欣赏什么样的画是美的,并使用这项技术生成 AI 画作……在这一基础上,生成式技术公司可以被总结出三种核心特征:

1、从 0 到 1 ——从 0 到 10 !

前文提到,生成式技术可以解决人类纠结了几个世纪的灵感缺乏问题,AI 能帮助无数的创作类职业获取灵感,实现从 0 到 1 的突破;但是,从 0 到 1 还只是 AI 能做的第一件事,在提供灵感之后,你会发现连剩下的工作都能由 AI 完成,AI 将能提供从 0 到 10 的解决方案——换句话说,只要拥有对应的 AI 模型,产品将可以满足用户的全部需求。

既然 AI 可以生成灵感,那为什么不干脆让 AI 把剩下的工作也一起完成呢?

事实上,目前早就已经出现了这样的生成式技术项目,那就是 SALT。SALT 是世界上第一部 AI 创建的电影,完全由 AI 编写和配音,AI 以 70 年代的科幻电影为蓝本,使用生成式技术工具的组合来快速生成最终的视频(Stable Diffusion、MidJourney、DALL-E)、编写脚本(GPT-3)和生成角色声音(Murf、Synthesia)。

2、用创造取代策展。

所谓策展(curation),即策划、筛选并展示的意思。在千禧年之后的这二十年以来,人类一直通过策展来追求个性化;各类电子商务供应商、视频网站和音乐网站,每天日复一日从他们的中央数据库中为你提供你最有可能喜欢的精选产品,也就是所谓的“个性化推荐”和“大数据推送”。

策展是一种非常有限的个性化方法,它基于调用现有的数据,试图将人们的偏好融入到现有的产品中,而不是在创造最适合用户的新产品。

如今,生成式技术改变了这点,它正在以一种我们从未体验过的方式进行个性化。生成式技术用创造取代了策展,不需要复杂的数据库调用,而是由数据库进行训练,并生成全新的事物。

这些都是讲空话吗?事实上,目前生成式技术确切地影响了一些领域的发展,其中就包括音乐领域。现在已经出现了不少平台——Boomy、Amper、Aiva、Ecrett、SoundDraw——这些平台能让从未制作过音乐的人也可以在几秒钟内创作出原创歌曲,其中的 Boomy 平台还为创作者提供了分享和变现这些作品的工具,让歌曲能直接在 Spotify、TikTok、YouTube 和全球 40 多个其他平台上发布。

AI 正在逐渐改变我们的生活。在过去,我们可能会在自驾游的时候选择一个热门的歌单播放,或者是盲从“个性化推荐”和“大数据推送”听音乐;但在不遥远的未来,在生成式技术的世界中,我们将能根据自己所在的场合、当前的情绪、血压、心率,随时随地生成和聆听自己真正需要的歌曲。

3、无害而低摩擦的界面。

生成式技术工具最大的特点就是它的易用性,如此繁重的工作,全由 AI 模型完成,在创造过程中最大程度消除了摩擦。像 DALL-E 和 Stable Diffusion 这类主流 AI 模型,只需要简单的文本提示,就可以在 30 秒内生成令人膛目结舌的艺术品。

在未来,生成式技术还将会日常化,甚至自动化。试想未来的某一天,两个人走入虚拟社区中的一间房子里,生成式技术能根据这两个用户的个性不断地生成全新的东西——这些东西可以是艺术品、游戏、音乐和共同话题,而如果这两个用户打算交易买卖,那生成式技术还能自动产生 NFT,供他们进行挑选……

这将是人机协作的又一次革命,AI 从工具变成了人类的伙伴,在启发人灵感的同时,带来无限的惊喜。


生成式技术公司是做什么的?


既然一切都交给 AI 了,那生成式技术公司需要做什么呢?这是个很容易陷进的误区,因为使用生成式技术的每一个伟大创意,最终其实还是来自于操控 AI 模型的人。思考一下这么一种可能,如果将一个或多个基础层的 AI 模型结合起来,会怎么样?

图源:NFX

创新这件事挺难的,每年都有成千上万的文章教导创业者要如何创新、如何找到自己的优势、如何把握好机会……但是,用 AI 创新却相当简单。因为创业者可以直接去寻找一个已有的、仍未大规模使用 AI 的领域,直接领先还在手工业时代的同行们(这句话有点夸张了——不过,对于未来的 AI 来说,人类可能真的还处于手工业时代)。

抢占先机可以创建优势,但这种优势会随着大公司的入场、更泛用的 AI 模型问世以及商业竞争等原因迅速消散。这时候就进入主题了,生成式技术公司需要在这种时候发挥什么作用呢?

  • 思考如何让每个新用户都能为其他每个用户增加价值。

AI 模型那是谁都能用的,只需要敲敲关键词,你我都能用 AI 生成精美的图画。因此,生成式技术公司除了技术本身,最应该弄好的就是社区,社区能创造价值,创造更多的网络效应。

  • 思考如何让生成式技术融入企业或个人的生活中。

目前为止,生成式技术还都只是“图一乐”的阶段,还没有多少人真的拿它进行创作,让它帮助自己的生活更美好。生成式技术公司这就得起到一个引导的作用,让用户从长远来看不想离开 AI 模型的帮助。

  • 结合旧时代的发明。

AI 模型并不会真的取代现有的全部软件,我们每天还是离不开浏览器和应用程序的——所以,为什么不干脆把这些东西和新时代的 AI 模型结合起来呢?人不可能靠一个 AI 模型“一招鲜,吃遍天”,大众也不可能瞬间接受新时代的变化,因此最好的方法就是把 AI 模型融入到我们日常使用的这些软件中,起到潜移默化的作用。


创业者该如何抓住这次机会?


技术和市场宛如一道河流。这条河的有些部分运行得更快,有些部分运行得更慢,河中还有一些涡流,能让人在被卷入的同时不断倒退。这条河上出现的潮流,则是由技术、细分市场、语言、分销渠道、团队和信仰共同创造的。

作为创业者想立足于这场浪潮,就必须立即行动——不是在未来半年或未来 3 年,而是在这个月甚至这周。因为这条河实在是流动得太快了,让人不得不暂停自己正在做的事情,专注于思考它的问题。

在过去的两年里,硅谷明星早期投资机构 NFX 的创始合伙人 James Currier,已经在这个领域投资了 4 家公司,并计划在未来的一年内进行更多的投资。接下来以 Currier 投资的四家公司为案例,看看他是怎么应用生成式技术的:

  • 游戏公司 Latitude。

2021 年初,NFX 投资了游戏公司 Latitude,这家初创公司致力于开发由人工智能生成的《AI Dungeon》(AI 地下城)游戏,并在项目开始时宣布已经筹集到了 330 万美元的种子基金。

生成式技术将带来全新的游戏体验,我们以前常玩的经典文本冒险游戏不同,以前的游戏角色的对话完全由游戏设计师安排,并且玩家只能在几个选项里选择——而《AI Dungeon》里的角色,是可以回应玩家的任何命令的。 

生成式技术不仅能在以前的老游戏中为 NPC 添加对话,补足游戏作品的剧情缺憾进行同人创作,还能催生像《AI Dungeon》这样全新类型的游戏。凭借其新发布的 Voyage 游戏平台,Latitude 公司得以在 AI 游戏领域处于领先地位。这家初创公司已经在生成式技术的核心领域工作了 3 年,并计划与研究生成式写作技术的 AI21 实验室合作,进一步将自然语言处理技术集成到他们的平台中。

AI Dungeon 的游戏界面,在下方的框中输入文字就能和游戏角色对话

  • 法律索赔搜索服务 Darrow。

每一天,世界各地数以百万计的人都在无意识地遭受违法行为的伤害——导致癌症的空气污染、危及敏感信息的隐私泄露、偶尔吃到不符合食品安全的零食或饭菜、因汽车零部件缺陷导致的车辆事故、甚至是引发不可逆转损害的缺陷药物……曾经,想在海量数据中发现这些违规行为几乎是不可能的,更不用说围绕它们建立案例了,然而,AI 的诞生彻底改变了这个时代的数据搜索难度。

Darrow 会扫描来自网络各个角落的公开可用的真实数据,这其中有从社交网络和新闻媒体搞到的官方消息,也有诉讼来源和财务信息等等。然后,Darrow 的 AI 可以在这些信息上下文中连接所有相关数据点,以检测违法行为。最后,Darrow 将检测到的违法行为形成强有力的案例,解决上文所说的隐患问题。

  • 自动编程生成网站和页面的平台 The.com。

The.com 这个名字一听就是非常稀有的域名,而这个网站也和名字一样另辟蹊径,它不是搞 AI 艺术创作的,而是用网站来生成网站的。简而言之,The.com 是一个生成式平台,可以通过简单的数据库调用和轻量级的提示来编码和开发成百上千的网站。但是,开发网站这种事谁都能做,The.com 真正的大杀器是能集成其他网站,往你自己的网站添加上千个页面,扩大网站的流量。

The.com 的目标是实现网站建设的现代化,同时确保网络创建者的工作获得赞誉。该公司如今凭借 NFX 的 440 万美元种子资金脱颖而出,创建了所谓的“低代码网站构建平台”,旨在抛弃已成为行业标准的基于模板的方法。简单的模块化和开源自然是我们都喜闻乐见的东西,The.com 用户甚至可以在网站建设过程中相互协作并直接聊天,实现流量的共通。

  • 地产科技网站 Tailorbird。

世界上的每一家地产都是独一无二的,于是多户型改造这份工作,在管理利益相关者、预算、组织和实施之间往往会浪费很多时间;自从 2020 年开始,AI 和物联网热潮席卷全球,基础设施飞速发展,美国也开始兴起了一个全新的行业,使得美国地产格局发生了很大变化,这个行业就是地产科技(proptech)

所谓地产科技,就是指那些利用创新运营和科技在各类空间资产类别的买卖、租赁、营销、运营管理和金融方面创造效率和价值的公司。Tailorbird 就通过使用深度学习为那些希望进行装修的业主构建新的平面图。

这些平面图是从网络上拍摄的照片和平面图生成的,AI 会搜集这些数据,与远程 3D 测量相结合,以产生许多新的装修计划。这些 AI 快速生成的计划,能为设计师和业主提供很好的灵感和想法,并减少了与房屋改造相关的时间和成本。

看,生成式技术并不是只能用 AI 画画和写点小作文,这个领域仍处于襁褓期,拥有着无限的发展空间。创业者往往苦恼于如何让产品拥有独特性,在市场闯出一片天,但在如今这个时代,只需要将生成式技术加入到现有的产品中,就已经能使其与众不同。

这篇文章对我有什么用?

回顾世界历史,重大技术变革总是缓慢展开的:直到 2003 年,世界上的许多人仍然对互联网持怀疑态度,所以建立硅谷的第一批先驱者得以规避了激烈的商业竞争;从 1997 年到 2005 年,SaaS(软件即服务)耗费将近 10 年的时光才得到了业界的共识;苹果公司在发布 iOS 平台 18 个月后才向外部开发者开放……Web3,距今已经推出 10 年了。

但生成式技术不一样。几乎每一个看到 AI 创作新闻的人都会意识到一点:等技术成熟时,它可以直接改变现有的创作产业。无数的风投、初创公司、创业者、商业公司都发现了这个事实,那就是只要不断“喂养”AI 模型,生成式技术可能在明天就可以改变世界。

总而言之,对于创业者来说,现在时间紧迫。如果想在高速发展的生成式技术领域分一杯羹,那就必须立即行动;创业者现在就需要决定自己的目标客户是谁、分销渠道在哪、要用 AI 创造什么想法……如今,还有很多领域未被卷入 AI 时代的浪潮,选择还有很多。

伟大的生成式技术行业创始人都长什么样子?

他们看起来像你。生成式技术颠覆了人类创作史,在 AI 的时代,只要有想法就能创业

参考文章:https://www.nfx.com/post/generative-tech

☞微信新增图片、视频拖动一键发送功能;Google 称互联网的六成是重复内容;Angular 15 发布|极客头条
Meta发布 “科研者的福音”,上线仅三天被骂到撤退
☞华为开发者大会 2022 开发者主题演讲与技术分论坛干货分享(附课件)

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存