说明:ChatGPT发布后,笔者第一时间体验了它的对话、翻译、编程、写作效果。随着一行行绿色的字快速地跳出来……一种触发了神秘力量的感觉,我预感到,一个更高维的庞然大物出现了。这样的现象级事物,可能对各行业都影响巨大,即使盲人摸象,也值得摸一摸吧。遂陆续收集了国内外150+文章和报告,趁春节假期稍微整理,分享给大家~ 目前已经发布《背景+技术篇》,这是《产品+商业篇》,此系列未来还会陆续更新,enjoy~
所有重大科学革命都有一个共同点,那就是它们都把人类的傲慢从一个又一个先前坚信我们是宇宙中心的信念基座上拉下来。——西格蒙德·弗洛依德
1. AIGC(AI Generated Content/人工智能自动生成内容)的市场前景
ChatGPT本身的商业化,目前看起来会和微软深度绑定,比如接入搜索引擎必应、办公全家桶Office、云计算平台Azure。本篇把视角放得更广一些,以ChatGPT为代表的AIGC或生成式AI,试着探讨这波AIGC的产品和商业化。2022年9月,红杉资本官网发表了一篇题为《Generative AI: A Creative New World》的重磅文章,把分成两类:分析型AI(Analytical AI)和生成式AI(Generative AI)。人类擅长分析事物,而机器在这方面甚至做得就更好了。机器可以分析一组数据,并在其中找到许多用例(use case)的模式,无论是欺诈还是垃圾邮件检测,预测你的发货时间或预测该给你看哪个TikTok视频,它们在这些任务中变得越来越聪明。这被称为"分析型AI(Analytical AI)",或传统AI。但是人类不仅擅长分析事物,我们也擅长创造。我们写诗,设计产品,制作游戏,编写代码。直到最近,机器还没有机会在创造性工作上与人类竞争——它们被降格为只做分析和机械性的认知工作。但最近,机器开始尝试创造有意义和美妙的东西,这个新类别被称为“生成式AI(Generative AI)”,这意味着机器正在生成新的东西,而不是仅限于分析已经存在的东西。生成式AI正在变得不仅更快、更便宜,而且在某些情况下比人类创造的更好。从社交媒体到游戏,从广告到建筑,从编程到平面设计,从产品设计到法律,从市场营销到销售,每一个原来需要人类创作的行业都等待着被机器重新创造……生成式AI可以处理的领域包括了知识工作和创造性工作,而这涉及到数十亿的人工劳动力。生成式AI可以使这些人工的效率和创造力至少提高10%,它们不仅变得更快和更高效,而且比以前更有能力。因此,生成式AI有潜力产生数万亿美元的经济价值。目前有两种版本的市场格局分析比较值得关注(如果你发现了其他有意思的分析框架,快快分享给我:),一种是美国知名投资机构A16Z给出的框架,一种是OpenAI 创始人Sam Altman给出的框架。分为基础设施层(代表是英伟达的芯片、AWS/Azure云计算平台),模型层(代表是这种非开源基础模型,还有Stable Diffusion 这种开源基础模型,以及Hugging Face这种模型托管平台),应用层(Jasper为代表的开放合作派——不拥有自己的模型,以及Midjourney这种拥有自己模型的自力更生派)。2.2 Sam Altman(OpenAI CEO)版市场框架以下出自Sam Altman和领英创始人Reid Hoffman的访谈:Reid Hoffman:既然大家都可以通过API使用大型模型,作为AI企业,怎样才能使自己脱颖而出,开辟自己独特的商业路径?
Sam Altman:将来会出现几个大的基础模型,开发人员都基于这些基础模型研发AI应用。但目前的情况依然是某一家公司开发出一个大型语言模型,然后开放API供他人使用。我认为,将来在基础模型和具体AI应用研发之间会有一个中间层:出现一批专门负责调整大型模型以适应具体AI应用需求的初创企业。能做好这一点的初创公司将会非常成功,但这取决于它们能在“数据飞轮”上走多远。(注:数据飞轮,指使用更多数据可以训练出更好的模型,吸引更多用户,从而产生更多用户数据用于训练,形成良性循环。)我对初创企业训练模型的能力持怀疑态度,将来承担模型训练角色的不会是初创公司,但它们可以在上述的中间层角色中发挥巨大价值。
这是我根据Altman的思路画的框架图,目前看,中间层还没有大量出现。
3.2 红杉资本版生成式AI图谱_V2.0
3.4 狮子座资本(Leonis capital)版生成式AI图谱:4. AIGC风险投资情况(from PitchBook)“在一代人的时间中总有一种产品的出现,它将工程技术从昏暗的地下室、书呆子们臭气熏天的卧室和爱好者们孤独的洞穴中发射出来,变成了你的祖母Edna都知道如何使用的东西。早在 1990 年就有网络浏览器,但直到 1994 年Netscape Navigator(网景浏览器)的出现,大多数人才发现了互联网。2001 年 iPod 问世之前就已经有了 MP3 播放器,但这些播放器并没有引发数字音乐革命。2007 年苹果推出iPhone之前,也有了智能手机,但在 iPhone 之前,没有智能手机的APP……2022 年 11 月 30 日,AI迎来了 Netscape Navigator 时刻。”
我们大概可以理解大名鼎鼎的图灵奖得主杨立昆(Yann LeCun)为何说ChatGPT没有革命性技术了。革命性时刻往往落后于技术研究,在象牙塔之外,甚至落后于最早一批的产品,并且充满争议……这一切,确实都会让技术先驱者很不服气。押注文本(Always bet on text):文本生成图像或者视频很酷,但我个人不太看好。文本本身更好。按照奥卡姆剃刀原则,文本是表达、存储、传播、接收信息最高效的路径。在更大的时空尺度下,现在如火如荼的短视频、播客只会是昙花一现——承载了少量信息传递,却消耗了比文本多出指数级倍的资源。就像Rust创始人Graydon Hoare说的:“所有的文学和诗歌、历史和哲学、数学、逻辑、编程和工程都依靠文本编码来表达它们的想法,这不是一个巧合”。关于AI超越人类的视角:我们其实不必恐慌于AI比我们写文案写的更好,编程和翻译更快,画画比我们更好。这样的事情早就发生过了,比如拖拉机比我们体力更强,汽车和飞机比人类奔跑更快,计算器比人脑计算更快……未来还会有更多。关于AI不如人类的视角:比如能耗方面。人类大脑每秒可进行1.5的18次方运算。单个GPU每秒可执行10的13次方运算,因此,需要10万个GPU才能接近大脑的运算能力。还有一个关键点,即人类大脑消耗的功率大约为25瓦,而一个GPU的消耗是人脑的10倍,即250瓦。电子的效率是生物的一百万分之一。和浩瀚的太空一样,人身体内部的微观世界对人类而言,还几乎是一个秘密。"如果一切顺利的话,人类历史才刚刚开始。人类大约有二十万年的历史。但地球还将保持数亿年的可居住性——为数百万的后代提供足够的时间;足以永远结束疾病、贫穷和不公正;足以创造今天无法想象的繁荣高度。如果我们能够学会进一步深入宇宙,我们就会有更多的时间:数万亿年,探索数十亿的世界。这样的寿命使人类处于最早的婴儿期。一个巨大而非凡的成年期正在等待着我们。" ——By 托比-奥德,《悬崖》
关于AIGC的市场规模:后代很难想象,2022年之前的我们,需要从头开始做的很多“工作”是多么耗时耗力:比如写一篇营销文案、编一段程序实现一个功能、修一个图,拍一段视频……就像2022年的我们,很难想象几个世纪前的某些职业如此低效一样:复制一本书需要一个抄书人劳动几个月,穿一双皮鞋需要鞋匠手工长时间的手工缝制、送一封信需要邮差快马加鞭好几天……AIGC成熟后的世界,数以亿计的白领脑力进一步释放,配得上万亿级的市场规模。目前为止发现了3个”ChatGPT杀手“项目:GPTZero(普林斯顿大学的学生Edward Tian)、Detect GPT(斯坦福大学,论文见附录)、GPT-2 Output Detector(OpenAI和哈佛联合开发)。GPTZero更接近商业化, 原理是检测文本的「困惑度」(Perplexity)和「突发性」(Burstiness)这两项指标,并分别对其打分,判定文本是AI还是人类写的。打败魔法的只有魔法,确实应该提升AI的透明度。关于数字生命的想法:假期正好看了《流浪地球2》,最为震撼的是跨越2500年,100代人的流浪地球计划。想起刘慈欣获得克拉克奖的致辞:从长远的时间尺度来看,在这无数可能的未来中,不管地球达到了怎样的繁荣,那些没有太空航行的未来都是黯淡的。我期待有那么一天,像那些曾经描写过信息时代的科幻小说一样,描写太空航行的科幻小说也变得平淡无奇了,那时的火星和小行星带都是乏味的地方,有无数的人在那里谋生;木星和它众多的卫星已成为旅游胜地,阻止人们去那里的唯一障碍就是昂贵的价格。但即使在这个时候,宇宙仍是一个大的无法想象的存在,距我们最近的恒星仍然遥不可及。浩瀚的星空永远能够承载我们无穷的想象力。
我期待着,ChatGPT这样的数字能力,不是让我们成为滞留地球的人肉电池,而是帮助人类走出自己的摇篮——地球,去探索浩瀚的太空和宇宙。
在普遍的工作重压下,如果我们还能重拾儿时最大胆的想象力,把日常工作关联到一个至少一代人时间尺度的愿景,会是多么幸运的一件事。One more thing,福利:
1、有6个比较值得研读的AIGC报告,在本公众号后台回复“chatgpt”可下载;
2、建了一个AIGC/ChatGPT产品交流群,欢迎入群交流。如群二维码过期,可加笔者微信:jeusmypower
AIGC:AI Generated Content ,人工智能自动生成内容 NLP:Natural Language Processing,自然语言处理 LLM:Large language model,大语言模型 AGI:Artificial general intelligence,通用人工智能 Prompt:提示词 Fine-tuning:模型调优 ML:Machine Learning,机器学习 DL:Deep Learning,深度学习 GPU:Graphics Processing Unit ,深度学习用的显卡 BERT:Bidirectional Encoder Representations from Transformers”,双向编码器表示 RLHF:Reinforcement Learning from Human Feedback,基于人类反馈的强化学习 |
红杉资本:生成式AI,一个创意新世界 https://www.sequoiacap.com/article/generative-ai-a-creative-new-world/Generative AI is here: How tools like ChatGPT could change your business https://www.mckinsey.com/capabilities/quantumblack/our-insights/generative-ai-is-here-how-tools-like-chatgpt-could-change-your-business 基于ChatGPT的项目:https://www.zhihu.com/question/570189639/answer/2793888150谁主导生成式AI平台?https://a16z.com/2023/01/19/who-owns-the-generative-ai-platform/AIGC市场趋势和创投机遇 https://www.leoniscap.com/blog/generative-ai-technological-trends-and-startup-opportunities利用概率曲率检测文本是否为大模型生成(论文) https://arxiv.org/pdf/2301.11305.pdfThe inside story of ChatGPT:https://fortune.com/longform/chatgpt-openai-sam-altman-microsoft/ |