查看原文
其他

如何成为初代 AGI 产品经理?

张海庚 张无常 2023-12-21

似乎有点标题党,我自然也没有资格讲初代 AGI 产品经理,但和关注 AGI 的大量朋友交流后,发现似乎现在也很少人讲,于是在一位资深科技媒体编辑的怂恿下,把近期自学心路历程写下来,抛砖引玉。

本文主题为产品经理入门,之前还做过一次 LLM 分享,覆盖话题更广:一个产品经理的大模型观察、反思与预测


经典的三问应该是:什么是AGI、什么是AGI产品经理?为什么要学习成为AGI产品经理?如何成为AGI初代产品经理?


这些问题当然有价值,但既然大模型的一切都未知——绿洲资本张津剑有一句很漂亮的话,「新世界没有地图,只有发令枪」——我们也可以不按常理出牌。


本文主要话题:

  • 为什么大语言模型如火如荼的今天, Killer App 还没跑出来?

  • 大模型时代的产品经理,应该首先理解大模型的产业链和技术原理

  • 大模型产品经理如何学习技术?方法、材料和心态

  • 大模型时代的产品设计革命


注:

1、本文写作时间为9月初,作为阶段性思考的记录,部分观点后续再更新;

2、全文超过1万字,欢迎收藏阅读;

3、如果你感兴趣:文末有我的微信和AI交流群二维码,欢迎交流。






一、为什么大语言模型如火如荼的今天, Killer App 还没跑出来?


先聊另一个话题:为什么大语言模型LLM)如火如荼的今天,大模型 Killer App 还没跑出来?


任何一个稍微了解互联网和移动互联网时代的人都应该不难想到,这至少是一个价值十亿美金的天问。


首先我们应该警惕:真的会有吗?很多人怀疑LLM是布满泡沫的一时风口,认为C端没有需求。这当然是一个有价值的怀疑,也和历史上所有群体狂热与科技泡沫一样, 是一个无法过多争辩的信仰问题,值得另起一文。


硅谷风投机构 a16z 在今年年初写道:

许多热门的科技趋势在市场迎头赶上之前就被过度炒作。但生成式AI的繁荣伴随着真实市场的实质性增长,以及真实公司的实质性发展。类似 Stable Diffusion 和 ChatGPT 这样的模型正在创造用户增长的新记录,而且有几个应用在上线不到一年的时间里就实现了1亿美元的年化收入。测试也发现大模型在某些任务上的表现比人类好了几个数量级。所以,有足够的早期数据表明正在发生大规模的变革。我们不知道的是,现在已经成为关键问题的是:生成式AI将在何处发挥价值?

Kevin Kelly 说:趋势是可以预测的,但是具体在这个趋势中会发生什么、出现什么产品,是没有办法预测的。


总之,我更倾向于:最终会有Killer App的。


那为什么killer app还没跑出来?篇幅所限,简单说一下我理解的原因:


首先是技术周期:


  • 模型层还在突飞猛进,中间层蓬勃发展,应用层所倚赖的条件尚不成熟;

  • 算力成本(芯片)居高不下,高昂的成本抑制了对需求的满足;

  • 对创业公司、新产品而言:只有一层「薄」应用的公司,因为壁垒不够强+模型层突飞猛进,就算跑出来,也会很快被吃掉。比如Jasper.ai,金沙江创投主管合伙人朱啸虎曾认为,Jasper的价值或将很快归零,根本守不住;

  • 对大厂而言:监管、现阶段基础模型开发高优于应用、大厂尤其是产品经理缺少对AI的独到/深刻认知;


总而言之,无论是大厂还是小厂、还是创业者,大家(尤其是产品经理)还在消化底层模型的能力,一边提升认知,一边想着怎么跟业务深度融合。



当然,我个人对于这个问题,除了商业价值上的思考,还有智识或者专业上的考虑:如何探索AGI时代的产品?此处先按下不表,文末展开。


落到实处就是:如何首先成为AGI时代产品经理?AGI产品经理第一课应该学什么?


作为一个在移动互联网尾声入门、刚刚自学入门AGI的产品经理来说,写下这一课,不是够胆教人,是对自己过去摸索学习的总结,万一能对其他人有启发,自然再好不过。






二、大模型时代的产品经理,应该首先理解大模型的产业链和技术原理



1、路径依赖的困境


人习惯于线性思维,总有路径依赖。沿着移动互联网产品设计的思维,很多产品经理和业务负责人面对汹涌而来的LLM,本能反应是:


  • 我应该如何将ChatGPT融入到当下的产品中?把大模型的能力「接进来」?

  • 「调用大模型能力」做一个对话机器人?要开一个新Tab吗?

  • 交互形式是跟ChatGPT一样对话吗?

  • 看似很厉害但实际体验起来却很麻烦?

……


于是我们可以看到当下互联网人尤其是产品经理的焦虑:所有人都知道ChatGPT改变了世界,几乎所有人都相信微软CEO Satya Nadella 说的要 Povit the Company——微软每个产品都必须用大模型为先的思路重做一遍,以及百度CEO李彦宏说的「所有产品都值得用大模型重做一遍」


——但怎么做?


在实际参与了部分成熟产品「结合AI的创新功能探索」并毫无意外受挫,以及和大量产品经理交流后,结合LLM学习体会,我的结论是,和过往互联网和移动互联网不同,在想象具体的产品交互之前,应该先退一步:


2、大模型时代的产品经理,应该首先理解大模型的产业链和技术原理


为什么首先需要理解大模型的产业链?为什么应该理解大模型的技术原理、而不是上来就开始想象交互的事情?


因为大模型带来的,首先是大的范式变革,然后才是具体的产品设计思路,交互体验,开发模式等等——这一切都要重新思考和探索,但首先需要理解并思考范式变革。


大模型,或者说生成式AI,和以往互联网和移动互联网时代有什么不同?



3、大模型产业链


互联网建立在TCP/IP的协议之上,移动互联网有相对独立的系统层、应用层(基础架构、平台、软件),和它们不一样的是,大模型更复杂——这其中有大模型本身的原因,也有当下尚在技术周期初期的阶段性原因:


首先,我们都比较熟悉的是,大模型有模型层、中间层、应用层,而且由于大语言模型本身的复杂性(复杂算法、大算力要求、海量数据等),模型层和中间层的复杂度要远超以往。


模型层和应用层好理解,前者是大模型本身,后者是基于大模型的应用。所谓中间层,是指要将大模型融合到应用,中间所需的一系列工程能力、算法能力,以及基于此的「工具栈」——如开发工具链(如 Langchain)、模型工具链(做数据标注、向量数据库、分布式训练等)。


以下是风投机构 Antler、Sequoia Capital 和 NfX 从不同视角给出的生成式AI全景图,比较清晰地展示了生成式AI创业方向、明星公司和技术栈,可以看到,在NfX的框架里,「模型层」还可以细化,进一步拆分为「通用模型、垂类模型、本地模型」。



其实,「模型层、中间层、应用层」的分发,虽然复杂,但仍然只是聚焦到大模型本身。实际上,如果我们把视野扩大到整个生成式AI,会发现 a16z 总结的技术栈更为全面。除了应用层、模型层,还有底层的基础设施,包括云平台,以及最核心的:芯片,或者说英伟达。



Cohere 的 Jay Alammar 在上述框架的基础上进一步细化,描绘了应用层玩家在这波生成式AI行业全景图中的位置:



这里大费周章介绍,是为了说明,虽然应用开发者实际上并不投身上述大部分工作,但在「只有发令枪,没有地图」的生成式AI大航海时代里,清楚自己在船队中的位置,能让你更可能发现新大陆。



4、大模型产品经理必须了解技术


既然要在AGI时代成事,产品经理就必须知己知彼,既要了解大语言模型的产业链,也要了解技术。


为什么产品经理要了解大语言模型的技术原理?


如上所述过去的互联网和移动互联网时代,产品经理完全可以在不懂TCP/IP协议、HTML、Swift语言等技术的基础上设计产品(虽然如果不懂事瞎提需求的话,多少要被研发喷,但大体如此吧?)


但LLM时代不同了,由于LLM如此强大到几乎无所不能,以至于看起来能无差别地满足所有需求(只是看起来),结果就是,如果不理解LLM的技术原理、局限性,作为产品经理,你将无法提出有价值的产品洞察和解决方案:还有什么是LLM不会的?还有什么是我可以做的?甚至有大厂AI产品经理说,以后产品经理可以不写PRD,但一定要去搞数据:给LLM训练的优质数据集。


这是我认为LLM时代的产品经理必须理解技术原理的原因。这也是微软CTO Kevin Scott在微软 Build 2023上对开发者表达的意思。



当然,产品经理学习技术原理,不是为了真的和大模型博士们去搞大模型研发,而是为了更好理解LLM,知己知彼,不求百战不败,只求一胜,为了最终开发出一个好用的大模型应用。


曾在 Google 工作了17年、和无数最优秀的产品经理打过交道的 Character.ai 创始人 Noam Shazeer 说:

让工程师、而不是产品经理来决定产品怎么做很重要,因为真正了解大语言模型能力的工程师才有能力确定产品的方向。大部分产品经理对大语言模型技术的能力并不足够了解,例如,他们可能会认为产品需要专注于某些垂直领域(场景),但对于大语言模型来说,只是专注某些垂直领域是完全错误的策略,因为大语言模型自身的优势就在于它的通用性。在真正将大语言模型产品化并投入使用之前,我们无法靠想象去判断它会有什么能力。


5、不了解大模型,你就是拉天线的


如果按原来移动互联网的线性思维,产品经理就只是把大模型当成黑盒,调模型API做产品——那不过只是从天上接电线装灯:灯亮了,你很开心,灯闪了,你不知道怎么处理,灯灭了,你两眼一抓黑,歇菜。


为什么拉电线价值有限?只需要看看年初风头一时无两的GPT套壳应用Jasper的裁员新闻就够了。


事实就是:不了解大模型,你就是个拉电线的。


但模型不是天线,是地基,盖好了,夯实了,知道哪里是承重墙哪里是排水管,才能建好上头的摩天大厦和三室两厅。


极客公园几个月前去硅谷调研就发现,相比中国「百模大战」的狂热,美国创业者们更冷静、思考也更深入:训练大模型本身的算法、算力、数据成本高昂,是巨头而非创业者的游戏,「美国现在是中间层在繁荣,已经几乎没有新的创业者要做下一个OpenAI了。」



其次,产品经理这个工种本身,就是「胶水」。因为现在模型层没有真正ready,导致产品经理在实际产品研发过程中,还需要做大量连接和胶水作用,技术科普、技术理解与讨论、产品补位、PMO……这些都需要你深入了解技术原理。


顺便说一下,PM这个岗位,有人觉得是产品经理,有人干成了项目经理(甚至最近Airbnb宣布取消产品经理岗位),还有人认为是CEO——CEO是最大的产品经理,总之,都在说一件事:冠以经理之名,其实就是要成事的,名可名非常名,叫成事经理也行。







三、别说自己不懂技术,记住你是最好的用户


上面主要说了大模型产品产品经理为什么需要懂技术——问题来了,如果你不是LLM相关专业背景(大概率不是),那只要稍微花时间去了解过大模型的技术原理,就自然会碰到问题:这些最聪明的博士们研究的问题、发表的论文,压根看不懂怎么办?


更关键的:不但读不懂,还很容易在LLM的世界里丢失了自己的认知优势、怎么办?


如何学习和理解技术?不丢掉自己?



1、别说自己不懂技术,记住你是最好的用户


怎么理解呢?


首先用户是不懂技术的,但不懂技术不是用户的原罪,而是理所当然。


产品经理当然需要理解技术、理解产品设计、理解开发……理解为了满足用户需求而需要干的所有事情——但是,这些都是手段,为了实现服务用户目标的手段。


产品经理最核心的,是理解用户需求(比如所谓3秒变成小白),而用户是不懂技术的。现在大部分需要用户大量学习成本、学习如何写Prompt的产品体验都是不合理的,应该敏锐地察觉到这种不合理,并想办法解决它。作为产品经理和资深用户,你应该学习这些技术,但不应该丢弃小白用户的心态。


补短板不应该丢了长板,这是个过于浅显易懂但实践起来非常难的道理,因为要克服的是你从小积累的刻板印象和潜意识,就像学习游泳,脑子跟上了还不够,身体还得一点点适应。


别说自己不懂技术,记住你是用户。


比如 prompt engineer 不合理,谁最先长出来,谁就是 killer app,谁就会定义AGI的新范式


比如技术与产品、业务的结合:在理解 llm 技术原理的基础上,将对用户和对产品、业务的理解融合起来思考。



2、如何学习?


那应该从哪里入手,了解LLM技术原理、从而入门大模型产品经理呢?


大家仍然容易下意识反应:有哪些推荐的学习材料?


但其实,真正的问题从来不是缺乏学习材料,而是学习材料太多了:单单机器学习几大公众号、Founder Park,每天就完全看不过来了。



3、大模型时代的媒介素养


我一直认为大语言模型带来了真正的知识民主化时代(虽然印刷术、互联网的发明都引发了类似效果),知识都开源、都可以学到——只要你花时间


怎么理解呢?首先,大语言模型的相关知识唾手可得:从论文,到开源社区,再到各类自媒体、新产品;从最专业最前沿,到最实操最落地,再到最通俗最科普最实际——只要你花时间,都可以了解到。


但你没时间没精力?不知道如何开始?


所以真正的问题是:LLM时代应该如何学习?信息过载时代,时间应该花在哪里?或者更准确地说,LLM时代的媒介素养应该是怎样的?


所谓媒介素养 Media Literacy,维基百科解释:是指在各种环境中以适合自己的目的和需求的方式取用(access)、分析(analyze)、评估(evaluate)及制造(create)媒体信息的能力。


作为一个严重信息焦虑症患者,我一直尝试在信息过载的LLM时代提出一些应付方法:


1)以主动提问和文字输出来倒逼输入,可能是解决信息过载和FOMO的最好路径。


2)信息的角度,比信息本身更重要;知识的角度,比知识本身更重要。


和大部分人一样,我也曾每天被LLM新闻刷屏,疲于奔命,但又感觉一叶障目、不识泰山,因为FOMO而看新闻,因为看新闻而更FOMO。


直到有一天突然看到王建硕的一个观点:研究AI新闻不是研究AI。从更长的时间维度看,你是否早一天或一周知道一个AI新闻,影响很小。王建硕建议少看新闻,直接上手研究产品、做产品。


顺着王建硕的思路,我发现也许更好的关注视角是两头抓:


一方面,关注最宏观:AI会灭绝人类吗?人类如何和AGI相处?看几本最好的书——技术哲学的视角。


另一方面,关注最实际上手的:直接体验产品、直接写更好的prompt、直接去学如何调用api写app——用户视角、产品经理视角、研发视角。


中间的技术演进适当关注即可——哪个大模型又进化了、哪家创业公司又融资了——简单浏览即可,不用每天花太多时间在追踪热点新闻上,研究AI新闻不是研究AI。


3)多读好内容,自然会分辨。


以饮食来比喻,胃口是有限的,坚持多吃好的,自然而然不想吃垃圾,并且最终你会发现,只吃好的,更能补足营养。



4、读最好的材料,跟最好的老师,善用工具


最好的材料,两个层次:最好的入门材料、最专业的材料。


最好的入门材料


好的开始,是成功的一半,好的入门材料:


  • Learning Prompt 课程 By Jimmy Wong https://learningprompt.wiki/zh-Hans/

    • Prompt Engineer,是入门 LLM 产品的必经之路。但大部分 Prompt 的教程是英文,所以英语不好首先成了很多人学习 LLM 的拦路虎。于是一直努力让更多的人用上 AI 的Jimmy 制作了这份免费的中文 Prompt Engineering 教程,包含 ChatGPT 和 Midjourney 教程。Jimmy 是我前同事,自称「一名工具产品爱好者、产品设计师」,实则是横跨设计、产品、研发的学习高手。


  • OpenAI Platform https://platform.openai.com/overview

    • OpenAI 官方说明文档,可能是写得最详实、最深入浅出的一份技术说明文档。OpenAI 不但集结了最好的 LLM 研究员,还汇聚了最好的 LLM 布道师,从最基础的概念,到循序渐进的 Prompt Engineer 、API 使用说明书、最佳实践,还手把手教你如何基于大语言模型开发插件、应用。

    • 好的材料,以一敌百,官方下场,好上加好。比如相比市面上鱼龙混杂的 Prompt Engineer 教程,OpenAI 官方提供的六种策略明显更简单有效:


  • OpenAI Cookbook https://github.com/openai/openai-cookbook

    • 同样是官方推出的使用OpenAI API的示例和指南,包含了具体代码


  • OpenAI 官方推荐的第三方资源:

    • 提示指南Prompt Engineering Guide:展示许多技术的Prompt Engineer指南(有中文版)https://www.promptingguide.ai/zh

    • learnprompting.org:Prompt Engineer 的入门课程 https://learnprompting.org/

    • Brex's Prompt Engineering Guide:Brex对语言模型和Prompt Engineer的介绍 https://github.com/brexhq/prompt-engineering

    • OpenAI烹饪手册:提高可靠性的技巧:一篇关于激发语言模型技术的回顾 https://github.com/openai/openai-cookbook/blob/main/techniques_to_improve_reliability.md

    • Lil'Log 提示工程:OpenAI 研究员对提示工程文献的评述 https://lilianweng.github.io/posts/2023-03-15-prompt-engineering/


  • 视频课程

    • ChatGPT Prompt Engineering for Developers by 吴恩达DeepLearning.AI:为开发者提供的关于Prompt Engineer 的简短课程 https://www.deeplearning.ai/short-courses/chatgpt-prompt-engineering-for-developers/

    • Prompt Engineering by DAIR.AI:一小时的视频,介绍各种Prompt Engineer技术 https://www.youtube.com/watch?v=dOxUroR57xs



最专业的材料


  • 《State of GPT》,只用半个小时,有人能讲明白GPT的技术原理、训练过程,还教你怎么用好GPT吗?有,OpenAI 联合创始人 Andrej Karpath 甚至还有时间加彩蛋,实在是了解LLM不得不看的精彩演讲 https://www.youtube.com/watch?v=bZQun8Y4L2A

  • 《Attention is All You Need》,提出 Transfomer 架构的必读论文,LLM 开山之作:https://arxiv.org/abs/1706.03762

  • GPT 1-4论文、技术报告

    • GPT-1论文《Improving Language Understanding by Generative Pre-Training》,Generative Pre-Train Model 就是GPT名字的由来 https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf

    • GPT-2论文《Language Models are Unsupervised Multitask Learners》https://cdn.openai.com/better-language-models/language_models_are_unsupervised_multitask_learners.pdf

    • GPT-3论文《Language Models are Few-Shot Learners》https://arxiv.org/pdf/2005.14165.pdf

    • GPT-4技术报告《GPT-4 Technical Report》https://cdn.openai.com/papers/gpt-4.pdf

  • B站Up主「跟李沐学AI」的AI论文精读系列视频,如果你读不懂英文LLM论文,那就跟着前 AWS 资深首席科学家、美国卡内基梅隆大学计算机科学博士李沐精读论文吧:

    • 《GPT,GPT-2,GPT-3 论文精读》https://www.bilibili.com/video/BV1AF411b7xQ/?spm_id_from=333.788&vd_source=0a7349493c5d70149efefa88eac70de1

    • 《GPT-4论文精读》https://www.bilibili.com/video/BV1vM4y1U7b5/?spm_id_from=333.337.search-card.all.click

  • 《Wolfram Alpha What is ChatGPT?》,伊利诺斯大学物理学、数学和计算机科学教授、「第一个真正实用的人工智能」搜索引擎WolframAlpha发明人 Stephen Wolfram ,用这本小书(其实是一篇长文)讲透了GPT的原理及未来,连 OpenAI CEO、ChatGPT 之父 Sam Altman 都感叹「这是我见过的对ChatGPT原理最佳的解释」的神作。

  • 《Sparks of Artificial General Intelligence: Early experiments with GPT-4》,微软154页GPT-4研究报告,结论是GPT-4让人看到了AGI的火花 https://arxiv.org/abs/2303.12712



最好的老师


真格基金 f.chen 整理过一份No.1 - 关于 AI 的 107 个人,61 个工具和 28 个通讯,很全,可以按需关注。


这里列一些我自己读得比较多的作者,凭记忆写,不全,且动态更新


LLM技术

  • Andrej Karpath

  • Sam Altman

  • Ilya Sutskever

  • Greg Brockman

  • Kevin Scott

  • Geoffrey Everest Hinton

  • Yann LeCun

  • Yoshua Bengio

  • Jim Fan

  • Yao Fu 符尧

  • Andrew Ng 吴恩达


创投

  • Paul Graham

  • 陆奇

  • 拾象科技-海外独角兽

  • 张津剑


中文盗火者

  • 宝玉

  • 木遥

  • web3天空之城

  • 王建硕


语言学家、认知科学家、科幻作家……

  • 丹尼尔·卡尼曼,《思考快与慢》

  • Douglas Richard Hofstadter 侯世达,《哥德尔、埃舍尔、巴赫--集异璧之大成》《我是个怪圈》《表象与本质》

  • 特德·姜,「ChatGPT 是网络上的一个模糊的JPEG 文件」



善用工具


工具是人的延伸,学AI必须用好AI工具,首先克服英文不好、技术不行的心理障碍,其次提高信息消费效率,主要有两类,不展开:


翻译工具:沉浸式翻译、火山翻译、Google Translator、网易有道翻译等


学习工具:ChatGPT、Claude、Perplexity等







四、学习心态和思路


上面介绍了一些具体的学习方法、材料和工具,下面讲讲学习心态和思路


1、要空杯心态,新世界不看旧船票


为什么新世界不能看旧船票?


为什么创业公司找成熟业务负责人的做法,大概率不会奏效?为什么在新世界寄希望于老将军们的做法,很可能碰壁?


旧世界的业务负责人/产品经理们忙于应付旧世界的问题——那是眼下杠杆率最高的事情,无可厚非——自然而然地:


他们大多没时间研究AI,基础的认知不一定能跟上,比如最基本的几篇论文没读过、GPT的基本技术原理不了解、模型能力没概念、模型层中间层应用层的关系不清晰、甚至最基本的LLM产品体验不多,不一而足。


更关键的:旧世界的经验往往是新世界的桎梏,旧世界的 Legacy ,是新世界的 Burden。绿洲资本张津剑的这句话,可谓一剑封喉,虽然他指的是美元基金。


怎么理解呢?


以产品经理举例,产品规划、设计、项目管理等能力,自然是必备的基本功,但除此之外,在旧世界(比如移动互联网)越成功,越容易带着所谓「旧世界的成功经验」去探索新世界。


「旧世界的成功经验」,或者说「成见」,叠加上面说的基础认知跟不上,自然容易在新世界搁浅。


——这甚至都无可厚非,路径依赖,人性如此。


那么,启发是什么?



2、要学会跳出自己总结的经验、教训


首先,必须要学会从亲身经历中总结经验、吸取教训。


进一步,要学会跳出自己总结的经验、教训。


重新学习AGI应用,保持原来移动互联网和互联网的优势,又要放下成见,重新学习AI Native应用应该怎么设计。


最重要的,要亲自上手体验产品


百闻不如一试,百试不如一用。要真的像移动互联网一样,变成小白用户去使用,去感受。


现在有哪些好的产品?有哪些好的体验、好的理念?有哪些不尽如人意的产品?做case分析


ChatGPT、Claude、Pi


Character.ai、Perplexityai、Midjourney、Poe


New Bing、Bard、Jasper……


未来有什么理想的产品体验?


Her?贾维斯?Apple Vision Pro?








五、大模型时代的产品设计哲学革命

在技术这个大前提下,交互设计是下一步。如果我们把视野放大到整个产品或技术周期,就可以很轻易总结出一个新产品的发展轨迹:


新技术萌发→技术浪潮发展/基础条件具备→新产品想法爆发→新产品设计尝试/迭代→新产品诞生新体验、吸引早期尝鲜用户→产品跨越鸿沟进入大众市场……


粗略预估,我们现在大概在新产品诞生前夜,所有人都在疯狂进行新产品设计尝试、迭代,而回顾历史,我们会发现,新的技术周期,往往带来新的设计范式的变革,比如初代苹果电脑 Macintosh 带来的图形交互界面革命,比如iPhone 带来的移动互联网革命,颇有点「天不生乔布斯,万古长如夜」的意思。


这也是为什么在LLM的新技术浪潮面前,越来越多人开始谈论大模型时代的产品设计哲学,探索AI Native产品应该怎么做。



大模型时代的产品设计哲学


这是一个很重要、且必须在了解LLM技术原理的基础上才可能展开的宏大话题,我在另外一篇文章里写过,篇幅所限这里简单写下主要思考:


大模型带来的人机交互范式的转换将彻底改变产品设计思路。


因为大模型本质上带来的是人机交互范式的转变,我们将从图形用户界面( GUI )转向自然语言用户界面( LUI )。


所有人都必须思考:大模型已经很强大了,还能新增哪些能力呢?用户还需要它新增哪些能力?这些能力要如何获得?


LLM时代的产品设计革命:大模型带来的人机交互范式的转换是如何影响产品设计的?






六、如何探索AGI?


本文主要讨论如何成为AGI产品经理,抛砖引玉,但最后我想稍微放飞一点:当我们讨论AGI产品经理的时候,我们在讨论什么——如何探索AGI。



为什么伟大不能被计划?


最近 OpenAI 的前研究员 Kenneth Stanley 和 Joel Lehman 出了一本新书,叫《为什么伟大不能被计划》,书里讲了他们从研究人工智能中得到的启发:大部分的事情需要目标和计划,但对于伟大的事情——比如探索AGI——目标和计划可能是束缚,它们会限制你的视野。


书里介绍,算法研究里,针对某个特定的问题或目标,会有一个搜索空间——绝大部分的问题,答案往往藏在搜索空间内,但对于「伟大的」问题,答案也许在搜索空间之外。如果你过于专注在具体问题或目标上,按照计划寻找,结果可能永远找不到答案。


我的理解是:AGI 明显是伟大的事情,要有原则,有理念,有哲学,但不要有太明确的计划。


对于大模型产品经理和从业者来说,要广泛而快速地尝试,要允许犯错,允许重来,允许没有阶段性明确产出,允许模型颠覆自己,推倒重来,在新的搜索空间里,实现伟大。



AGI Killer App的探索,是对人类美好未来的探索


最近越来越多的人问,你看好哪个方向?哪个产品?或者你有什么产品方案吗?


我当然知道大家为什么关心这个问题,很简单,Killer App 的问题,是个起码价值十亿美金的问题。


我也当然不知道怎么回答,但我似乎更关心的是,Killer App 的探索,除了商业上的价值,更重要的,其实是智识上的价值,对人类的价值。


以史为鉴,可以知兴替,我们可以停下来看看,历史上面临类似问题时,前人是怎么做的?


比如,当面对早期个人电脑的技术浪潮时,巨人们是怎么思考的?


上面提到1984年,乔布斯率领苹果用 Macintosh 开启了图形交互界面革命,Macintosh 集合了当时最新的交互元素,比如图形用户界面(GUI)、图示(Icon)、个人桌面(Desktop),并且用鼠标操作。


但鲜为人知的是,Macintosh 的图形界面,灵感来源于一个1960年代的系统,oN-Line System(NLS),它的发明者,是道格拉斯·恩格尔巴特(Douglas Engelbart)。



1968年12月9日,现代个人电脑之父道格拉斯·恩格尔巴特在旧金山召开的计算机协会暨电气电子工程师学会(ACM/IEEE)秋季联合计算机会议上,进行了一场具有里程碑意义的计算机演示,后被人称为「所有演示之母」(The Mother of All Demos)。也有人称1968年12月9日为现代个人计算机(PC)诞生的日子。



现场的90分钟演示,恩格尔巴特介绍了一个完整的计算机软硬件系统NLS,第一次公开展示了现代计算机单一操作系统几乎所有的基本要素:窗口,超文本,图形,高效导航和命令输入,视频会议,鼠标,文字处理,动态文件链接,版本控制和实时协作编辑器,这些我们受益至今的伟大创举,几乎都来源于恩格尔巴特的这次演示。



这次演讲产生了巨大影响,在1970年代早期催生了施乐帕罗奥多研究中心的类似研究项目,在1980-1990年代,影响了苹果麦金塔操作系统和微软Microsoft Windows的图形用户界面。


恩格尔巴特和他发明的鼠标


后世只知乔布斯、比尔·盖茨,鲜有人知恩格尔巴特,因为他发明鼠标和一整套个人计算机操作系统的目的,不是赚钱或制造产品,只是希望「通过计算机,让世界更美好」。


a16z、网景公司创始人马克•安德森(Marc Andreessen)这样谈及恩格尔巴特及其同事:恩格尔巴特那样的发明家最大的与众不同之处在于,他们心目中最注重的是对人类的影响,这是一种今天已不复存在的理想主义


我当然知道,在今天言必称「脚踏实地」「活下来再说」的商业环境里,追求所谓智识的价值、对人类的影响,是天真的一厢情愿——但人类技术进步的历史,不从来都是由这些天真、固执的理想主义者们推动的吗?




参考资料:

我是Hayes海庚,一个关注AI的大厂产品经理/战略,最近打算和更多人交流,如果你也关注这轮AI浪潮,希望和包括字节、百度、阿里、腾讯和一线大模型创业公司同学一起交流讨论,欢迎扫码进群。如果二维码失效了,请在公众号后台回复「茶水间」或加微信hayeszhang13,麻烦备注【称呼-公司/学校-职位-来意】。

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存