如何成为初代 AGI 产品经理?
似乎有点标题党,我自然也没有资格讲初代 AGI 产品经理,但和关注 AGI 的大量朋友交流后,发现似乎现在也很少人讲,于是在一位资深科技媒体编辑的怂恿下,把近期自学心路历程写下来,抛砖引玉。
本文主题为产品经理入门,之前还做过一次 LLM 分享,覆盖话题更广:一个产品经理的大模型观察、反思与预测
经典的三问应该是:什么是AGI、什么是AGI产品经理?为什么要学习成为AGI产品经理?如何成为AGI初代产品经理?
这些问题当然有价值,但既然大模型的一切都未知——绿洲资本张津剑有一句很漂亮的话,「新世界没有地图,只有发令枪」——我们也可以不按常理出牌。
本文主要话题:
为什么大语言模型如火如荼的今天, Killer App 还没跑出来?
大模型时代的产品经理,应该首先理解大模型的产业链和技术原理
大模型产品经理如何学习技术?方法、材料和心态
大模型时代的产品设计革命
注:
1、本文写作时间为9月初,作为阶段性思考的记录,部分观点后续再更新;
2、全文超过1万字,欢迎收藏阅读;
3、如果你感兴趣:文末有我的微信和AI交流群二维码,欢迎交流。
一、为什么大语言模型如火如荼的今天, Killer App 还没跑出来?
先聊另一个话题:为什么大语言模型(LLM)如火如荼的今天,大模型 Killer App 还没跑出来?
任何一个稍微了解互联网和移动互联网时代的人都应该不难想到,这至少是一个价值十亿美金的天问。
首先我们应该警惕:真的会有吗?很多人怀疑LLM是布满泡沫的一时风口,认为C端没有需求。这当然是一个有价值的怀疑,也和历史上所有群体狂热与科技泡沫一样, 是一个无法过多争辩的信仰问题,值得另起一文。
硅谷风投机构 a16z 在今年年初写道:
许多热门的科技趋势在市场迎头赶上之前就被过度炒作。但生成式AI的繁荣伴随着真实市场的实质性增长,以及真实公司的实质性发展。类似 Stable Diffusion 和 ChatGPT 这样的模型正在创造用户增长的新记录,而且有几个应用在上线不到一年的时间里就实现了1亿美元的年化收入。测试也发现大模型在某些任务上的表现比人类好了几个数量级。所以,有足够的早期数据表明正在发生大规模的变革。我们不知道的是,现在已经成为关键问题的是:生成式AI将在何处发挥价值?
Kevin Kelly 说:趋势是可以预测的,但是具体在这个趋势中会发生什么、出现什么产品,是没有办法预测的。
总之,我更倾向于:最终会有Killer App的。
那为什么killer app还没跑出来?篇幅所限,简单说一下我理解的原因:
首先是技术周期:
模型层还在突飞猛进,中间层蓬勃发展,应用层所倚赖的条件尚不成熟;
算力成本(芯片)居高不下,高昂的成本抑制了对需求的满足;
对创业公司、新产品而言:只有一层「薄」应用的公司,因为壁垒不够强+模型层突飞猛进,就算跑出来,也会很快被吃掉。比如Jasper.ai,金沙江创投主管合伙人朱啸虎曾认为,Jasper的价值或将很快归零,根本守不住;
对大厂而言:监管、现阶段基础模型开发高优于应用、大厂尤其是产品经理缺少对AI的独到/深刻认知;
总而言之,无论是大厂还是小厂、还是创业者,大家(尤其是产品经理)还在消化底层模型的能力,一边提升认知,一边想着怎么跟业务深度融合。
当然,我个人对于这个问题,除了商业价值上的思考,还有智识或者专业上的考虑:如何探索AGI时代的产品?此处先按下不表,文末展开。
落到实处就是:如何首先成为AGI时代产品经理?AGI产品经理第一课应该学什么?
作为一个在移动互联网尾声入门、刚刚自学入门AGI的产品经理来说,写下这一课,不是够胆教人,是对自己过去摸索学习的总结,万一能对其他人有启发,自然再好不过。
二、大模型时代的产品经理,应该首先理解大模型的产业链和技术原理
1、路径依赖的困境
人习惯于线性思维,总有路径依赖。沿着移动互联网产品设计的思维,很多产品经理和业务负责人面对汹涌而来的LLM,本能反应是:
我应该如何将ChatGPT融入到当下的产品中?把大模型的能力「接进来」?
「调用大模型能力」做一个对话机器人?要开一个新Tab吗?
交互形式是跟ChatGPT一样对话吗?
看似很厉害但实际体验起来却很麻烦?
……
于是我们可以看到当下互联网人尤其是产品经理的焦虑:所有人都知道ChatGPT改变了世界,几乎所有人都相信微软CEO Satya Nadella 说的要 Povit the Company——微软每个产品都必须用大模型为先的思路重做一遍,以及百度CEO李彦宏说的「所有产品都值得用大模型重做一遍」
——但怎么做?
在实际参与了部分成熟产品「结合AI的创新功能探索」并毫无意外受挫,以及和大量产品经理交流后,结合LLM学习体会,我的结论是,和过往互联网和移动互联网不同,在想象具体的产品交互之前,应该先退一步:
2、大模型时代的产品经理,应该首先理解大模型的产业链和技术原理
为什么首先需要理解大模型的产业链?为什么应该理解大模型的技术原理、而不是上来就开始想象交互的事情?
因为大模型带来的,首先是大的范式变革,然后才是具体的产品设计思路,交互体验,开发模式等等——这一切都要重新思考和探索,但首先需要理解并思考范式变革。
大模型,或者说生成式AI,和以往互联网和移动互联网时代有什么不同?
3、大模型产业链
互联网建立在TCP/IP的协议之上,移动互联网有相对独立的系统层、应用层(基础架构、平台、软件),和它们不一样的是,大模型更复杂——这其中有大模型本身的原因,也有当下尚在技术周期初期的阶段性原因:
首先,我们都比较熟悉的是,大模型有模型层、中间层、应用层,而且由于大语言模型本身的复杂性(复杂算法、大算力要求、海量数据等),模型层和中间层的复杂度要远超以往。
模型层和应用层好理解,前者是大模型本身,后者是基于大模型的应用。所谓中间层,是指要将大模型融合到应用,中间所需的一系列工程能力、算法能力,以及基于此的「工具栈」——如开发工具链(如 Langchain)、模型工具链(做数据标注、向量数据库、分布式训练等)。
以下是风投机构 Antler、Sequoia Capital 和 NfX 从不同视角给出的生成式AI全景图,比较清晰地展示了生成式AI创业方向、明星公司和技术栈,可以看到,在NfX的框架里,「模型层」还可以细化,进一步拆分为「通用模型、垂类模型、本地模型」。
其实,「模型层、中间层、应用层」的分发,虽然复杂,但仍然只是聚焦到大模型本身。实际上,如果我们把视野扩大到整个生成式AI,会发现 a16z 总结的技术栈更为全面。除了应用层、模型层,还有底层的基础设施,包括云平台,以及最核心的:芯片,或者说英伟达。
Cohere 的 Jay Alammar 在上述框架的基础上进一步细化,描绘了应用层玩家在这波生成式AI行业全景图中的位置:
这里大费周章介绍,是为了说明,虽然应用开发者实际上并不投身上述大部分工作,但在「只有发令枪,没有地图」的生成式AI大航海时代里,清楚自己在船队中的位置,能让你更可能发现新大陆。
4、大模型产品经理必须了解技术
既然要在AGI时代成事,产品经理就必须知己知彼,既要了解大语言模型的产业链,也要了解技术。
为什么产品经理要了解大语言模型的技术原理?
如上所述过去的互联网和移动互联网时代,产品经理完全可以在不懂TCP/IP协议、HTML、Swift语言等技术的基础上设计产品(虽然如果不懂事瞎提需求的话,多少要被研发喷,但大体如此吧?)
但LLM时代不同了,由于LLM如此强大到几乎无所不能,以至于看起来能无差别地满足所有需求(只是看起来),结果就是,如果不理解LLM的技术原理、局限性,作为产品经理,你将无法提出有价值的产品洞察和解决方案:还有什么是LLM不会的?还有什么是我可以做的?甚至有大厂AI产品经理说,以后产品经理可以不写PRD,但一定要去搞数据:给LLM训练的优质数据集。
这是我认为LLM时代的产品经理必须理解技术原理的原因。这也是微软CTO Kevin Scott在微软 Build 2023上对开发者表达的意思。
当然,产品经理学习技术原理,不是为了真的和大模型博士们去搞大模型研发,而是为了更好理解LLM,知己知彼,不求百战不败,只求一胜,为了最终开发出一个好用的大模型应用。
曾在 Google 工作了17年、和无数最优秀的产品经理打过交道的 Character.ai 创始人 Noam Shazeer 说:
让工程师、而不是产品经理来决定产品怎么做很重要,因为真正了解大语言模型能力的工程师才有能力确定产品的方向。大部分产品经理对大语言模型技术的能力并不足够了解,例如,他们可能会认为产品需要专注于某些垂直领域(场景),但对于大语言模型来说,只是专注某些垂直领域是完全错误的策略,因为大语言模型自身的优势就在于它的通用性。在真正将大语言模型产品化并投入使用之前,我们无法靠想象去判断它会有什么能力。
5、不了解大模型,你就是拉天线的
如果按原来移动互联网的线性思维,产品经理就只是把大模型当成黑盒,调模型API做产品——那不过只是从天上接电线装灯:灯亮了,你很开心,灯闪了,你不知道怎么处理,灯灭了,你两眼一抓黑,歇菜。
为什么拉电线价值有限?只需要看看年初风头一时无两的GPT套壳应用Jasper的裁员新闻就够了。
事实就是:不了解大模型,你就是个拉电线的。
但模型不是天线,是地基,盖好了,夯实了,知道哪里是承重墙哪里是排水管,才能建好上头的摩天大厦和三室两厅。
极客公园几个月前去硅谷调研就发现,相比中国「百模大战」的狂热,美国创业者们更冷静、思考也更深入:训练大模型本身的算法、算力、数据成本高昂,是巨头而非创业者的游戏,「美国现在是中间层在繁荣,已经几乎没有新的创业者要做下一个OpenAI了。」
其次,产品经理这个工种本身,就是「胶水」。因为现在模型层没有真正ready,导致产品经理在实际产品研发过程中,还需要做大量连接和胶水作用,技术科普、技术理解与讨论、产品补位、PMO……这些都需要你深入了解技术原理。
顺便说一下,PM这个岗位,有人觉得是产品经理,有人干成了项目经理(甚至最近Airbnb宣布取消产品经理岗位),还有人认为是CEO——CEO是最大的产品经理,总之,都在说一件事:冠以经理之名,其实就是要成事的,名可名非常名,叫成事经理也行。
三、别说自己不懂技术,记住你是最好的用户
上面主要说了大模型产品产品经理为什么需要懂技术——问题来了,如果你不是LLM相关专业背景(大概率不是),那只要稍微花时间去了解过大模型的技术原理,就自然会碰到问题:这些最聪明的博士们研究的问题、发表的论文,压根看不懂怎么办?
更关键的:不但读不懂,还很容易在LLM的世界里丢失了自己的认知优势、怎么办?
如何学习和理解技术?不丢掉自己?
1、别说自己不懂技术,记住你是最好的用户
怎么理解呢?
首先用户是不懂技术的,但不懂技术不是用户的原罪,而是理所当然。
产品经理当然需要理解技术、理解产品设计、理解开发……理解为了满足用户需求而需要干的所有事情——但是,这些都是手段,为了实现服务用户目标的手段。
产品经理最核心的,是理解用户需求(比如所谓3秒变成小白),而用户是不懂技术的。现在大部分需要用户大量学习成本、学习如何写Prompt的产品体验都是不合理的,应该敏锐地察觉到这种不合理,并想办法解决它。作为产品经理和资深用户,你应该学习这些技术,但不应该丢弃小白用户的心态。
补短板不应该丢了长板,这是个过于浅显易懂但实践起来非常难的道理,因为要克服的是你从小积累的刻板印象和潜意识,就像学习游泳,脑子跟上了还不够,身体还得一点点适应。
别说自己不懂技术,记住你是用户。
比如 prompt engineer 不合理,谁最先长出来,谁就是 killer app,谁就会定义AGI的新范式
比如技术与产品、业务的结合:在理解 llm 技术原理的基础上,将对用户和对产品、业务的理解融合起来思考。
2、如何学习?
那应该从哪里入手,了解LLM技术原理、从而入门大模型产品经理呢?
大家仍然容易下意识反应:有哪些推荐的学习材料?
但其实,真正的问题从来不是缺乏学习材料,而是学习材料太多了:单单机器学习几大公众号、Founder Park,每天就完全看不过来了。
3、大模型时代的媒介素养
我一直认为大语言模型带来了真正的知识民主化时代(虽然印刷术、互联网的发明都引发了类似效果),知识都开源、都可以学到——只要你花时间。
怎么理解呢?首先,大语言模型的相关知识唾手可得:从论文,到开源社区,再到各类自媒体、新产品;从最专业最前沿,到最实操最落地,再到最通俗最科普最实际——只要你花时间,都可以了解到。
但你没时间没精力?不知道如何开始?
所以真正的问题是:LLM时代应该如何学习?信息过载时代,时间应该花在哪里?或者更准确地说,LLM时代的媒介素养应该是怎样的?
所谓媒介素养 Media Literacy,维基百科解释:是指在各种环境中以适合自己的目的和需求的方式取用(access)、分析(analyze)、评估(evaluate)及制造(create)媒体信息的能力。
作为一个严重信息焦虑症患者,我一直尝试在信息过载的LLM时代提出一些应付方法:
1)以主动提问和文字输出来倒逼输入,可能是解决信息过载和FOMO的最好路径。
2)信息的角度,比信息本身更重要;知识的角度,比知识本身更重要。
和大部分人一样,我也曾每天被LLM新闻刷屏,疲于奔命,但又感觉一叶障目、不识泰山,因为FOMO而看新闻,因为看新闻而更FOMO。
直到有一天突然看到王建硕的一个观点:研究AI新闻不是研究AI。从更长的时间维度看,你是否早一天或一周知道一个AI新闻,影响很小。王建硕建议少看新闻,直接上手研究产品、做产品。
顺着王建硕的思路,我发现也许更好的关注视角是两头抓:
一方面,关注最宏观:AI会灭绝人类吗?人类如何和AGI相处?看几本最好的书——技术哲学的视角。
另一方面,关注最实际上手的:直接体验产品、直接写更好的prompt、直接去学如何调用api写app——用户视角、产品经理视角、研发视角。
中间的技术演进适当关注即可——哪个大模型又进化了、哪家创业公司又融资了——简单浏览即可,不用每天花太多时间在追踪热点新闻上,研究AI新闻不是研究AI。
3)多读好内容,自然会分辨。
以饮食来比喻,胃口是有限的,坚持多吃好的,自然而然不想吃垃圾,并且最终你会发现,只吃好的,更能补足营养。
4、读最好的材料,跟最好的老师,善用工具
最好的材料,两个层次:最好的入门材料、最专业的材料。
最好的入门材料
好的开始,是成功的一半,好的入门材料:
Learning Prompt 课程 By Jimmy Wong https://learningprompt.wiki/zh-Hans/
Prompt Engineer,是入门 LLM 产品的必经之路。但大部分 Prompt 的教程是英文,所以英语不好首先成了很多人学习 LLM 的拦路虎。于是一直努力让更多的人用上 AI 的Jimmy 制作了这份免费的中文 Prompt Engineering 教程,包含 ChatGPT 和 Midjourney 教程。Jimmy 是我前同事,自称「一名工具产品爱好者、产品设计师」,实则是横跨设计、产品、研发的学习高手。
OpenAI Platform https://platform.openai.com/overview
OpenAI 官方说明文档,可能是写得最详实、最深入浅出的一份技术说明文档。OpenAI 不但集结了最好的 LLM 研究员,还汇聚了最好的 LLM 布道师,从最基础的概念,到循序渐进的 Prompt Engineer 、API 使用说明书、最佳实践,还手把手教你如何基于大语言模型开发插件、应用。
好的材料,以一敌百,官方下场,好上加好。比如相比市面上鱼龙混杂的 Prompt Engineer 教程,OpenAI 官方提供的六种策略明显更简单有效:
OpenAI Cookbook https://github.com/openai/openai-cookbook
同样是官方推出的使用OpenAI API的示例和指南,包含了具体代码
OpenAI 官方推荐的第三方资源:
提示指南Prompt Engineering Guide:展示许多技术的Prompt Engineer指南(有中文版)https://www.promptingguide.ai/zh
learnprompting.org:Prompt Engineer 的入门课程 https://learnprompting.org/
Brex's Prompt Engineering Guide:Brex对语言模型和Prompt Engineer的介绍 https://github.com/brexhq/prompt-engineering
OpenAI烹饪手册:提高可靠性的技巧:一篇关于激发语言模型技术的回顾 https://github.com/openai/openai-cookbook/blob/main/techniques_to_improve_reliability.md
Lil'Log 提示工程:OpenAI 研究员对提示工程文献的评述 https://lilianweng.github.io/posts/2023-03-15-prompt-engineering/
视频课程
ChatGPT Prompt Engineering for Developers by 吴恩达DeepLearning.AI:为开发者提供的关于Prompt Engineer 的简短课程 https://www.deeplearning.ai/short-courses/chatgpt-prompt-engineering-for-developers/
Prompt Engineering by DAIR.AI:一小时的视频,介绍各种Prompt Engineer技术 https://www.youtube.com/watch?v=dOxUroR57xs
最专业的材料
《State of GPT》,只用半个小时,有人能讲明白GPT的技术原理、训练过程,还教你怎么用好GPT吗?有,OpenAI 联合创始人 Andrej Karpath 甚至还有时间加彩蛋,实在是了解LLM不得不看的精彩演讲 https://www.youtube.com/watch?v=bZQun8Y4L2A
《Attention is All You Need》,提出 Transfomer 架构的必读论文,LLM 开山之作:https://arxiv.org/abs/1706.03762
GPT 1-4论文、技术报告
GPT-1论文《Improving Language Understanding by Generative Pre-Training》,Generative Pre-Train Model 就是GPT名字的由来 https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf
GPT-2论文《Language Models are Unsupervised Multitask Learners》https://cdn.openai.com/better-language-models/language_models_are_unsupervised_multitask_learners.pdf
GPT-3论文《Language Models are Few-Shot Learners》https://arxiv.org/pdf/2005.14165.pdf
GPT-4技术报告《GPT-4 Technical Report》https://cdn.openai.com/papers/gpt-4.pdf
B站Up主「跟李沐学AI」的AI论文精读系列视频,如果你读不懂英文LLM论文,那就跟着前 AWS 资深首席科学家、美国卡内基梅隆大学计算机科学博士李沐精读论文吧:
《GPT,GPT-2,GPT-3 论文精读》https://www.bilibili.com/video/BV1AF411b7xQ/?spm_id_from=333.788&vd_source=0a7349493c5d70149efefa88eac70de1
《GPT-4论文精读》https://www.bilibili.com/video/BV1vM4y1U7b5/?spm_id_from=333.337.search-card.all.click
《Wolfram Alpha What is ChatGPT?》,伊利诺斯大学物理学、数学和计算机科学教授、「第一个真正实用的人工智能」搜索引擎WolframAlpha发明人 Stephen Wolfram ,用这本小书(其实是一篇长文)讲透了GPT的原理及未来,连 OpenAI CEO、ChatGPT 之父 Sam Altman 都感叹「这是我见过的对ChatGPT原理最佳的解释」的神作。
《Sparks of Artificial General Intelligence: Early experiments with GPT-4》,微软154页GPT-4研究报告,结论是GPT-4让人看到了AGI的火花 https://arxiv.org/abs/2303.12712
最好的老师
真格基金 f.chen 整理过一份No.1 - 关于 AI 的 107 个人,61 个工具和 28 个通讯,很全,可以按需关注。
这里列一些我自己读得比较多的作者,凭记忆写,不全,且动态更新:
LLM技术
Andrej Karpath
Sam Altman
Ilya Sutskever
Greg Brockman
Kevin Scott
Geoffrey Everest Hinton
Yann LeCun
Yoshua Bengio
Jim Fan
Yao Fu 符尧
Andrew Ng 吴恩达
创投
Paul Graham
陆奇
拾象科技-海外独角兽
张津剑
中文盗火者
宝玉
木遥
web3天空之城
王建硕
语言学家、认知科学家、科幻作家……
丹尼尔·卡尼曼,《思考快与慢》
Douglas Richard Hofstadter 侯世达,《哥德尔、埃舍尔、巴赫--集异璧之大成》《我是个怪圈》《表象与本质》
特德·姜,「ChatGPT 是网络上的一个模糊的JPEG 文件」
善用工具
工具是人的延伸,学AI必须用好AI工具,首先克服英文不好、技术不行的心理障碍,其次提高信息消费效率,主要有两类,不展开:
翻译工具:沉浸式翻译、火山翻译、Google Translator、网易有道翻译等
学习工具:ChatGPT、Claude、Perplexity等
四、学习心态和思路
上面介绍了一些具体的学习方法、材料和工具,下面讲讲学习心态和思路。
1、要空杯心态,新世界不看旧船票
为什么新世界不能看旧船票?
为什么创业公司找成熟业务负责人的做法,大概率不会奏效?为什么在新世界寄希望于老将军们的做法,很可能碰壁?
旧世界的业务负责人/产品经理们忙于应付旧世界的问题——那是眼下杠杆率最高的事情,无可厚非——自然而然地:
他们大多没时间研究AI,基础的认知不一定能跟上,比如最基本的几篇论文没读过、GPT的基本技术原理不了解、模型能力没概念、模型层中间层应用层的关系不清晰、甚至最基本的LLM产品体验不多,不一而足。
更关键的:旧世界的经验往往是新世界的桎梏,旧世界的 Legacy ,是新世界的 Burden。绿洲资本张津剑的这句话,可谓一剑封喉,虽然他指的是美元基金。
怎么理解呢?
以产品经理举例,产品规划、设计、项目管理等能力,自然是必备的基本功,但除此之外,在旧世界(比如移动互联网)越成功,越容易带着所谓「旧世界的成功经验」去探索新世界。
「旧世界的成功经验」,或者说「成见」,叠加上面说的基础认知跟不上,自然容易在新世界搁浅。
——这甚至都无可厚非,路径依赖,人性如此。
那么,启发是什么?
2、要学会跳出自己总结的经验、教训
首先,必须要学会从亲身经历中总结经验、吸取教训。
进一步,要学会跳出自己总结的经验、教训。
重新学习AGI应用,保持原来移动互联网和互联网的优势,又要放下成见,重新学习AI Native应用应该怎么设计。
最重要的,要亲自上手体验产品
百闻不如一试,百试不如一用。要真的像移动互联网一样,变成小白用户去使用,去感受。
现在有哪些好的产品?有哪些好的体验、好的理念?有哪些不尽如人意的产品?做case分析
ChatGPT、Claude、Pi
Character.ai、Perplexityai、Midjourney、Poe
New Bing、Bard、Jasper……
未来有什么理想的产品体验?
Her?贾维斯?Apple Vision Pro?
五、大模型时代的产品设计哲学革命
在技术这个大前提下,交互设计是下一步。如果我们把视野放大到整个产品或技术周期,就可以很轻易总结出一个新产品的发展轨迹:
新技术萌发→技术浪潮发展/基础条件具备→新产品想法爆发→新产品设计尝试/迭代→新产品诞生新体验、吸引早期尝鲜用户→产品跨越鸿沟进入大众市场……
粗略预估,我们现在大概在新产品诞生前夜,所有人都在疯狂进行新产品设计尝试、迭代,而回顾历史,我们会发现,新的技术周期,往往带来新的设计范式的变革,比如初代苹果电脑 Macintosh 带来的图形交互界面革命,比如iPhone 带来的移动互联网革命,颇有点「天不生乔布斯,万古长如夜」的意思。
这也是为什么在LLM的新技术浪潮面前,越来越多人开始谈论大模型时代的产品设计哲学,探索AI Native产品应该怎么做。
大模型时代的产品设计哲学
这是一个很重要、且必须在了解LLM技术原理的基础上才可能展开的宏大话题,我在另外一篇文章里写过,篇幅所限这里简单写下主要思考:
大模型带来的人机交互范式的转换将彻底改变产品设计思路。
因为大模型本质上带来的是人机交互范式的转变,我们将从图形用户界面( GUI )转向自然语言用户界面( LUI )。
所有人都必须思考:大模型已经很强大了,还能新增哪些能力呢?用户还需要它新增哪些能力?这些能力要如何获得?
LLM时代的产品设计革命:大模型带来的人机交互范式的转换是如何影响产品设计的?
六、如何探索AGI?
本文主要讨论如何成为AGI产品经理,抛砖引玉,但最后我想稍微放飞一点:当我们讨论AGI产品经理的时候,我们在讨论什么——如何探索AGI。
为什么伟大不能被计划?
最近 OpenAI 的前研究员 Kenneth Stanley 和 Joel Lehman 出了一本新书,叫《为什么伟大不能被计划》,书里讲了他们从研究人工智能中得到的启发:大部分的事情需要目标和计划,但对于伟大的事情——比如探索AGI——目标和计划可能是束缚,它们会限制你的视野。
书里介绍,算法研究里,针对某个特定的问题或目标,会有一个搜索空间——绝大部分的问题,答案往往藏在搜索空间内,但对于「伟大的」问题,答案也许在搜索空间之外。如果你过于专注在具体问题或目标上,按照计划寻找,结果可能永远找不到答案。
我的理解是:AGI 明显是伟大的事情,要有原则,有理念,有哲学,但不要有太明确的计划。
对于大模型产品经理和从业者来说,要广泛而快速地尝试,要允许犯错,允许重来,允许没有阶段性明确产出,允许模型颠覆自己,推倒重来,在新的搜索空间里,实现伟大。
AGI Killer App的探索,是对人类美好未来的探索
最近越来越多的人问,你看好哪个方向?哪个产品?或者你有什么产品方案吗?
我当然知道大家为什么关心这个问题,很简单,Killer App 的问题,是个起码价值十亿美金的问题。
我也当然不知道怎么回答,但我似乎更关心的是,Killer App 的探索,除了商业上的价值,更重要的,其实是智识上的价值,对人类的价值。
以史为鉴,可以知兴替,我们可以停下来看看,历史上面临类似问题时,前人是怎么做的?
比如,当面对早期个人电脑的技术浪潮时,巨人们是怎么思考的?
上面提到1984年,乔布斯率领苹果用 Macintosh 开启了图形交互界面革命,Macintosh 集合了当时最新的交互元素,比如图形用户界面(GUI)、图示(Icon)、个人桌面(Desktop),并且用鼠标操作。
但鲜为人知的是,Macintosh 的图形界面,灵感来源于一个1960年代的系统,oN-Line System(NLS),它的发明者,是道格拉斯·恩格尔巴特(Douglas Engelbart)。
1968年12月9日,现代个人电脑之父道格拉斯·恩格尔巴特在旧金山召开的计算机协会暨电气电子工程师学会(ACM/IEEE)秋季联合计算机会议上,进行了一场具有里程碑意义的计算机演示,后被人称为「所有演示之母」(The Mother of All Demos)。也有人称1968年12月9日为现代个人计算机(PC)诞生的日子。
现场的90分钟演示,恩格尔巴特介绍了一个完整的计算机软硬件系统NLS,第一次公开展示了现代计算机单一操作系统几乎所有的基本要素:窗口,超文本,图形,高效导航和命令输入,视频会议,鼠标,文字处理,动态文件链接,版本控制和实时协作编辑器,这些我们受益至今的伟大创举,几乎都来源于恩格尔巴特的这次演示。
这次演讲产生了巨大影响,在1970年代早期催生了施乐帕罗奥多研究中心的类似研究项目,在1980-1990年代,影响了苹果麦金塔操作系统和微软Microsoft Windows的图形用户界面。
恩格尔巴特和他发明的鼠标
后世只知乔布斯、比尔·盖茨,鲜有人知恩格尔巴特,因为他发明鼠标和一整套个人计算机操作系统的目的,不是赚钱或制造产品,只是希望「通过计算机,让世界更美好」。
a16z、网景公司创始人马克•安德森(Marc Andreessen)这样谈及恩格尔巴特及其同事:恩格尔巴特那样的发明家最大的与众不同之处在于,他们心目中最注重的是对人类的影响,这是一种今天已不复存在的理想主义。
我当然知道,在今天言必称「脚踏实地」「活下来再说」的商业环境里,追求所谓智识的价值、对人类的影响,是天真的一厢情愿——但人类技术进步的历史,不从来都是由这些天真、固执的理想主义者们推动的吗?
参考资料:
a16z:Who Owns the Generative AI Platform? https://a16z.com/2023/01/19/who-owns-the-generative-ai-platform/?ref=txt.cohere.com
Cohere:AI is Eating The World https://txt.cohere.com/ai-is-eating-the-world/
陆奇:我的大模型世界观https://www.bilibili.com/video/BV1mM4y147qw/?spm_id_from=333.1007.tianma.1-2-2.click&vd_source=0a7349493c5d70149efefa88eac70de1
微软CTO Kevin Scott: The era of the AI Copilot | KEY02H https://www.youtube.com/watch?v=FyY0fEO5jVY&t=1459s
The Mother of All Demos https://en.wikipedia.org/wiki/The_Mother_of_All_Demos
老钱文集:硅谷传奇:现代个人电脑之父——道格拉斯•恩格尔巴特:http://lao-qian.hxwk.org/2014/12/19/%E7%A1%85%E8%B0%B7%E4%BC%A0%E5%A5%87%EF%BC%9A%E7%8E%B0%E4%BB%A3%E4%B8%AA%E4%BA%BA%E7%94%B5%E8%84%91%E4%B9%8B%E7%88%B6-%E9%81%93%E6%A0%BC%E6%8B%89%E6%96%AF%E2%80%A2%E6%81%A9%E6%A0%BC/
1968 "Mother of All Demos" with Doug Engelbart & Team https://www.youtube.com/watch?v=UhpTiWyVa6k
张无常:
我是Hayes海庚,一个关注AI的大厂产品经理/战略,最近打算和更多人交流,如果你也关注这轮AI浪潮,希望和包括字节、百度、阿里、腾讯和一线大模型创业公司同学一起交流讨论,欢迎扫码进群。如果二维码失效了,请在公众号后台回复「茶水间」或加微信hayeszhang13,麻烦备注【称呼-公司/学校-职位-来意】。