查看原文
其他

一张图看懂AI大模型产业链与背后的商机

柏粒先生 柏粒田 2024-04-11

2023年以来ChatGPT的火爆已经搅动了整个科技圈,作为一款聊天机器人软件,它强大的自然语言交互能力让人叹为观止。而且,随着GPT-4ChatGPT Plugins发布,AI技术的应用场景不断涌现,新的商业模式也层出不穷。无论是互联网时代的巨头还是创业公司,大量的资本、团队、人才都在加速涌入,2023年很可能是AI大模型产业链的爆发元年。

在我的身边,就有很多朋友(无论是科技圈还是其他行业的从业者)对AI技术的发展抱有浓厚的兴趣:有人想从中寻找创业的商机,有人想找到投资赚钱的方向,也有人想重新规划自己的职业。今天这篇文章,就从下面这张简单的图表出发,来谈谈AI产业链到底由哪些部分构成,以及背后潜在的商机。希望它能帮助你理解整个AI产业,并对你的未来产生一定的借鉴意义。

(来源:a16z)

(本文分为2部分,第一部分为产业链上中下游的拆解,第二部分为商业机会的讨论。如果你只对AI产业链的商机和终端应用感兴趣,也可以跳过第一部分的产业链拆解,直接阅读第二部分。)

一、AI产业链的上中下游

这张图要从下往上来看,最下方的两块是AI产业链的底层(或者说上游):以硬件与云计算平台为代表的基础层,中游是以大模型(Models)为代表的技术层,上游则是应用层(Apps)。简单说来,硬件与云计算平台为AI大模型提供芯片、算力、数据等基础设施的支持,大模型经过训练后可以被开发成各类应用软件,以应对终端用户的各种需求,下面我们分别来看。

1、下游-硬件与云计算

首先,以GPT为代表的大模型需要海量的算力支撑,GPT-3的模型参数就已经是1750亿,据美国媒体统计,训练成本高达1200万美元每次。而算力的关键在于芯片,特别是英伟达的GPU,是大多数企业做AI训练的首选,最近美国政府也禁止其向中国出售最高端的A100产品。

目前想要进行大模型的训练,业内的共识是至少具备10,000张A100芯片。中国很多企业最近都说自己也拥有类似ChatGPT的大模型在研发中,其实你只要问问他们手上有多少英伟达的GPU芯片,大概就能推算出他们家的AI大模型是否靠谱了。

除此以外,谷歌的TPU,还有国内的寒武纪等企业也有适合AI训练的芯片产品,但综合来看,英伟达的GPU还是占据该领域的主导地位。

其次,是云计算平台。云计算平台并不是AI产业所独有的新产业,它是从互联网时代就由亚马逊率先推出并已发展多年的基础设施。目前来看,无论是中国还是美国,云计算行业都由几家巨头主导,国外是亚马逊、谷歌、微软,国内则是阿里、腾讯、华为、三大通信运营商。而且由于行业强大的规模效应,已经构成了较高的进入壁垒,未来大概率是强者恒强的趋势。

因此,从AI产业链底层的基础设施层面来看,行业的技术、规模壁垒都较高,目前并不存在新的商业模式,潜在的商机更多会由现有的大玩家来瓜分。

2、中下游-大模型(Models)与应用(Apps)

下面谈AI产业链的中游和下游。这里面有3种不同的商业模式,我们从左到右来谈。

第一种,是全面覆盖技术和应用的一体化软件。典型的案例是Midjourney,它是目前最热门的AI作图软件之一。这样的企业,既要研发大模型的算法,也要开发应用,还要亲自负责大模型的维护和更新。

这种模式的弊端是:对团队的技术要求高、后期的管理和维护成本高。好处则在于:模型是自己的、数据是自己的、应用软件也是自己的,而且对特定领域的针对性更高。由于目前我们尚处于AI产业发展的早期,还达不到实现通用人工智能的水平,因此不同的领域可能需要更具针对性的大模型和算法。比如ChatGPT更擅长自然语言处理,Midjourney就更擅长图片处理(下图就是2022年8月在美国科罗拉多州博览会艺术比赛中由“Midjourney”创作而成的获奖作品《太空歌剧院》。可惜的是,3月30日外媒报道,因为新用户的大量涌入,Midjourney已暂停免费使用,建议你等到下次开放后也去亲自体验一下它强大的AI作图能力)。

第二种,是采取闭源方式的基础大模型,它们通过提供API接口对外调用,来实现流量的变现,ChatGPT就是典型代表。我曾写过“海外电商拥抱ChatGPT与潜在的失业危机”一文,详细阐述了海外电商网站Shopify通过付费的方式调用ChatGPT的API接口,将它的大模型应用到客服、数据分析、网站开发和撰写营销文案等领域,大模型的智能化大大提升了运营效率和客户体验。而且不同的开发者也可以在Shopify的软件平台上利用ChatGPT的API接口来开发新的应用App,供终端用户使用,这样也更有利于后期的维护、优化。

第三种,是采用开源大模型平台并提供模型库的商业模式。在这样的模式下,由平台企业提供开源的基础大模型(经过训练的),由于它是开源的,因此它允许其他的开发者根据这个基础大模型来调试甚至开发出不同的模型,由此形成一个模型库(Model Hubs)。而想要做应用的企业就可以根据模型库中的各种模型来研发自己需要的应用App,最终面向终端的客户。

这3种模式的核心区别在于,在第一种模式中,一家企业全面掌握大模型的研发、管理与维护,并直接推出终端的应用App;第二种模式,则是由一家企业开发并管理一个闭源的大模型,其他企业通过API接口来研发App,但无法更改这个基础大模型;第三种模式,则采取开源的方式,由一家平台企业来开发基础大模型平台并建立一个模型库,外部的开发者既可以利用现有模型来制作应用,也可以对模型进行再次开发。

如果拿移动互联网来做对比的话,苹果公司既有自己的操作系统也有自己的APP,那就是第一种模式;但苹果公司允许外部开发者在自己的平台上开发APP,那就是采取了第二种模式;而安卓操作系统就是典型的第三种开发模式,它提供了一个开源的操作系统,其他手机厂商和外部开发者都可以在这个开源的基础上再次开发新的操作系统和App,比如小米就研发了自己的MIUI操作系统,腾讯也推出了自己的应用商店(应用宝)。

综合来看,第一种方式的稳定性更高、针对性更强,但缺少了一定的灵活性,也难以建立起活跃的生态。第二和第三种模式则因为有外部开发者的加入而更具有灵活性,也更有利于生态的建立。

二、AI产业链背后的商机

在这里再次附上产业链的图谱,从前文我们得知,在上游的基础设施层面,其实对创业者和普通人来说并没有太多参与的机会。无论是支持算力的芯片还是云计算行业,高昂的技术和规模壁垒,注定了大部分市场份额会由现有的巨头们所瓜分。但如果你是一位投资者,可能反而是一个好消息,因为在这一领域投资的确定性是最高的,不太可能会有新玩家进入。

至于中下游层面,无论是3种模式中的哪一种,基础大模型都是核心中的核心。由于大模型的训练需要海量的数据和算力,训练大模型的成本依然十分高昂,而且对算法的研发也需要极具技术实力的团队,目前大部分参与者都是实力雄厚的大企业,例如海外的微软/OpenAI、谷歌、Meta,和国内的百度、华为、京东、阿里巴巴、字节跳动等公司。像是Midjourney那样的初创企业,虽然已经推出较为成熟的大模型和应用,但在面临大量用户时也不得不暂停使用,以缓解自身的运营压力,可见研发出独立的大模型对一家企业的要求之高。

(来源:长江证券研究所)

因此,在这张图谱上,其实只有右上方的那个方块,才是大部分中小企业和普通人可以切入的领域。虽然乍看之下,它只是整个产业链中的一小部分,但未来,随着行业的基础设施逐步完善,闭源和开源的大模型生态逐步成熟,下游的应用端必然会迎来爆发式的增长。

你可以设想一下移动互联网的发展,Iphone的诞生可以看成是移动互联网的开端,后来安卓操作系统开源,其他手机企业也相继推出各自的智能手机,硬件和软件层面的基础设施逐步完善,外部的开发者可以开发App供用户使用。后来又出现了微信这样的超级App,它又将自身作为一种超级平台,搭建出微信商店、公众号、小程序等不同的生态,进一步降低了开发者、商家和用户的门槛,新的应用场景和商业模式不断涌现(甚至孕育出拼多多这个电商领域的超级黑马)。

(来源:艾瑞咨询

因此,如果你是一位创业者或普通的打工人,我建议你从现在起,一定要密切关注国内外各大企业在大模型上的研发和更新进展,特别是针对你所在和感兴趣的行业的应用场景。这场AI革命注定会带来生产力和效率的大幅提升,未来随着AI大模型的基础设施和平台生态的逐步完善,开发者、商家和用户的应用门槛也会不断降低,这里面将涌现出越来越多的应用场景的商业机会(可参考上面来自艾瑞咨询的图表:目前,已经有众多巨头和初创企业在各种行业中尝试拓宽AI的应用场景)。最终,社会上的大部分人都会融入到这些生态之中,未来你的工作、生活、学习、交际都离不开这些AI大模型和相关应用,就像现在的你无法离开智能手机和App一样。

可能你会觉得自己不是程序员,不会开发软件,这些好像和你没有关系,无论AI大模型未来如何发展你也只是一名潜在的用户罢了。请千万不要这么想,这次AI革命和过去的信息技术革命最大的不同点就在于ChatGPT的大模型实现了自然语言的智能交互,未来编程、开发软件的门槛会大大降低:你只需要用自然语言告诉AI你的需求,编程和开发的工作会自动完成。人人都成为开发者的时代将很快到来。

所以,请记住这一点:AI不会取代你,但一个使用AI的人会取代你。要想在新的时代有所作为,你就要花些心思去理解AI,这样才能成为AI的主人,并让自己有更大的概率进化成新一代的人类。

附录

在文章的最后,我将附上最近在AI领域新观察到的一些应用场景供你参考,或许就有你所在和关心的行业和领域,希望也能对你有所帮助。

1、金融领域-摩根士丹利:

摩根士丹利已经开始使用ChatGPT-4来管理和处理数据、并生成内容。他们通过GPT建立了一个聊天机器人,它通过阅读大量经济领域的研究报告来进行自我训练,以此来辅助财富管理部门员工的研究工作,在服务客户时能提升查询资料、回答咨询、生成内容方面的效率。

2、金融领域2-BloombergGPT:

BloombergGPT是由Bloomberg(彭博社,美国知名的财经咨询服务提供商)结合GPT4.0创立。由于彭博社天生在财经领域具有广泛的数据源,BloombergGPT已具备500亿参数的训练规模(可能是现今最大规模的细分领域的数据集)。近期的反馈也表明,BloombergGPT在财经领域的反馈要明显强于基础大模型,从侧面验证了特定领域的数据集训练对基础大模型的正面作用。

3、医疗领域-ChatDoctor:

ChatDoctor是海外研究者所发表的一篇论文,他们针对的是医疗领域,是一款在ChatGPT基础上进行再训练的应用。该研究将医疗领域的特定数据(包含700多种疾病的基础诊断方式和推荐用药信息,以及5000多次医患对话的数据)对原有的大模型进行微调。

经过调试后的新模型,在与患者沟通的场景下更能理解患者的需求,并能提供更准确的治疗建议。(有兴趣的读者可参考论文链接:https://arxiv.org/abs/2303.14070)

4、语言学习-Duolingo Max:

Duolingo是一款在线的外语学习应用。他们结合了GPT-4.0并推出了Duolingo Max订阅服务,它具备2项新功能:Explain My Answer和Roleplay。

Explain My Answer(解释我的答案):通常学员在做完练习题后会有疑惑,这时可以通过这个功能与Duolingo Max进行聊天,询问自己到底错在哪里,还可以让AI举例做进一步的解释,直到自己弄明白这个知识点。

Roleplay(角色扮演):是让用户和Duolingo Max通过角色扮演的方式进行聊天,模拟在外语使用时可能遇到的场景,比如去餐厅点餐、去超市购物、或者和外国同事沟通工作的对话场景。

5、在线教育-Khan Academy可汗学院:

可汗学院利用GPT-4.0创立了Khanmigo,它是一款智能助教。有趣的是,它也采用角色扮演的方式。目前已经有的案例是扮演古希腊哲学家苏格拉底,Khanmigo按照苏格拉底的风格来教育孩子:不直接给答案,反而是带着学生一起思考、讨论,通过更多的互动来激发学生的学习动力。

过去教育界最大的弊端之一就在于好的教师资源匮乏,以至于个性化、针对性的教育方式难以实行,而Khanmigo正是为了解决这一问题。

全文完,感谢您的耐心阅读。如果文章对您有点滴帮助,欢迎转发或在末尾右下角点击“在看”,谢谢!
相关文章:
一张图看懂世界经济的发展史
过去与未来--一张图看懂中国经济发展模式的转变
Don't Panic-如何从容地面对AI的冲击
周鸿祎聊AI:硅基生命的觉醒、年轻人的机会......(含解读)
为什么世界充满了不确定性?这要从猫和蝴蝶说起
ChatGPT凭什么能替代医生、律师、程序员?
“世界唯一不变的是变化,必须更新认知才能应对熵增的混沌。人生最大的敌人是自己,唯有磨炼心性方能战胜心中的魔王。”--欢迎点击下方链接关注本号,提升认知、磨炼心性。

备注:图片来自网络

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存