一个新的入口正在诞生,一个新的生产力革命正在我们眼前发生。 |
文|寒武创投创始合伙人 韩冰封面来源|视觉中国在这波由GPT引发的AI热潮中,创投圈迅速焕发生机,大厂全面参与,短短一个月内便推出了30多个大模型。同时,创业天团纷纷涌现。然而,对于专注于垂直领域的AIGC方向的创业者来说,这是福音还是忧虑尚不得而知。AI的这波机遇是只有大厂、大佬们才能把玩的东西吗?对于小团队、初创团队、非AI领域的团队来说,它们的胜算又是几何呢?让我以一个刚刚涉足AI领域不到两个月的初学者亲身经历来谈谈我的看法。正是因为GPT带来的变革,让我现在敢于发表对AI领域的看法。在GPT问世之前,由于知识匮乏,我不敢称自己了解AI项目。真正的高科技、高门槛领域,若非具备深厚的专业背景,不仅是我,几乎任何人在谈论AI时,都是道听途说、人云亦云。国内投资圈能够深入了解AI底层原理的人寥寥无几。由于之前不敢涉足,诸如神经网络、对抗学习、无监督学习、RLHF、fine-tune和embedding等概念从未涉猎。然而,自ChatGPT发布的那一刻起,一切都发生了变化。尽管我依然不甚了解,但在那一刻,全球各大学,无论是斯坦福、MIT这样的名校,还是中国某个偏僻地区的普通院校,都回到了同一起跑线。因为LLM的出现让学术界重新洗牌,所有人都从零开始学习。既然所有人都是从头学起,那我可就不困了。现在,当别人和我谈论AI时,我不再讨论技术,而只关注应用。只要问一问,就能知道他们是否真正使用过:GPT-4和GPT-3.5有何区别?Langchain能实现哪些功能?如何使用AutoGPT?Midjourney(简称MJ)如何确保一致性?为什么Stable Diffusion(简称SD)的1.5版本用户比2.1版本多?手势识别问题解决了吗?是否能生成中文?如何训练Lora?在哪里下载chilloutmix?(停)正因为我亲自动手实践过这些,所以有了一手的体验,敢于讨论。在GPT的帮助下,我这个编程小白都已经编写了好几个可运行的程序。我相信任何有想法和行动力的人,只要稍微动手尝试,都能大幅提高产能。但这一点小小的行动,正是1%与99%之间的差距。作为一个AI初学者、观察者和思考者,让我来谈谈在这一个多月的学习中的心得体会。不谈大模型,不谈技术,只谈实际应用的机会。AI与普通创业者究竟有何关联?对于普通人来说,GPT意味着什么?
GPT对什么人的帮助最大?
首先,GPT对我的帮助非常大,但并非最大。我进行了一个简单而有趣的思想实验,得出了意外的结论。在这波AI浪潮中,主要受影响的是脑力劳动者。在AI所能影响的领域,我将行业从业者的能力分为两大类:一类是思考力、创新力、战略性、前瞻性;另一类是行业通识、执行力、基本功。基于这个分类,我将人们分为四类,思考力占20分,基本功占80分。目前,AI对前者的影响相对较小,而对后者的影响较大。根据这个分类,可以形成四个团队:假设目前AI仅对人类脑力劳动的基本功产生影响。
当GPT的能力不如人类团队时,人类团队更倾向于使用自己的能力;当GPT超越人类能力时,则可以直接利用GPT的能力。
我将GPT的能力按照0、30、50、100、200分进行比较,看看它们分别会对这四个团队产生什么影响?结论简单而出人意料,颇具趣味,如下图:
在开始阶段,四个团队的差距极大。基本功强的团队,无论是否具备思考力,都遥遥领先。但随着这种超级生产力工具的普及,他们的优势逐渐减小。原本处于末尾的C和D团队分别提高了上限和下限,变得与AB团队一样出色。(当然,那些不愿拥抱GPT的团队与拥抱GPT的团队之间的差距会变得更大。)总结起来就是:在AI浪潮中,原本只擅长动脑而不擅长动手的团队这次机会最佳,而那些什么都不擅长的团队收获最丰富。这正是所谓的技术平权。GPT大大降低了技术壁垒,是一种普惠性技术。虽然这个实验相当简陋,但它阐述了一个非常清晰的道理:AI极大地提高了人类的动手能力。对于那些基础较差的团队来说,他们更应该积极拥抱AI,因为这是他们少有的可以拉近与优秀团队、卓越团队距离的机会。经过亲身体验,我从未觉得自己拥有如此强大的动手能力。相信我,你和GPT加起来很强大。
应用GPT的首要问题:玩具or工具?
因此,在面对GPT时,我们首先要问自己一个问题:我们是把它当作玩具还是工具?这将决定我们如何更好地利用它。有一个简单的判断方法:当我们使用GPT时,是希望尽快找到答案、用完即走,还是享受使用它的过程?这两者之间的区别体现了我们对待时间的态度。帮助人们节省时间的具有工具属性,而帮助人们消磨时间的具有玩具属性。比如Google和百度,它们具有典型的工具属性,从不宣传用户停留时间这个指标。它们希望用户尽快找到答案并离开,花费的时间越长说明搜索结果越不准确,这个工具越难用。而视频、文学、动漫和社交领域则强调用户停留时间,希望让用户尽可能长时间停留。再比如男女在对待电商网站的态度上,男性往往以目标为导向,使用搜索直接找到商品,了解各种数据,购买后立即离开,把电商网站当作工具。而女性可能漫无目的地逛,以逛为主,用一个滑动动作玩上一个下午。具有玩具属性的产品,用户不在乎时间和效率,主要追求沉浸式体验。例如,我们喜欢看电影时,希望它的时长更长,一个半小时不够,要三个小时。有些人会反复观看同一部电影,不是因为没看懂,而是因为喜欢。抖音一开始就是帮助人们消磨时间的,即使现在有很多推销产品的,也难以改变它的定位。在抖音上购物,很多时候是没有明确目的的,效率绝对不如淘宝高。再回想一下,我们初次接触GPT时都是如何使用的呢?还记得你问的第一句话是什么吗?有人问天气,有人说你好。反正我在使用所有AI大模型时,第一句都问的是:“你会说中文吗?”有些人用各种脑筋急转弯来考验GPT。剩下几只树上的鸟?小明排名第三的兄弟叫什么?青蛙几天能跳出井口?那些这样使用GPT的人,实际上是把它当作玩具,因为我们不是真的想知道答案,而是想逗弄AI,看它犯傻。但仅仅把GPT当作玩具会大大浪费它的价值,就像火车刚传入中国时,仅修了短短一段,成了皇亲国戚们的玩具,而没有人意识到它对生产力的巨大提升。可能是微软小冰给了大家习惯性的认知,或许是“聊天机器人”这个名字被媒体大肆传播,又或者是ChatGPT名称中的“Chat”具有强烈的误导性。的确,“聊天”是GPT最显而易见、最容易被大众接受的功能,但它也是最初级、最简单的功能。如果你像我一样,带着学习的目的去提问,通过不断追问和调整自己的问法来挖掘GPT背后庞大的知识宝库,同时利用它强大的推理、扩展和总结能力完成原本费时费力的工作,还对GPT-4逐字逐句回答的方式感到无法忍受……那说明你是在把GPT当作工具。如果我们明确了这一点,再来看看,究竟有多少人错误地使用了这个工具,或者低估了这个工具的价值。GPT的一个局限性在于它有时会说些不靠谱的话,因此把它当作搜索引擎的人可能会被误导。然后,他们就得出结论:GPT不好用,无法替代谷歌或百度。其实,这两者本来就是不同的东西。GPT并不追求准确性,而是追求像人类一样进行交流和思考。它在说话的同时也在思考,已经说出去的话无法收回。这导致了在需要复杂逻辑思考或稍微复杂的数学计算时,GPT容易犯错。此外,当问到不存在的事物时,它经常能像模像样地胡说一通,具有一定的欺骗性。然而,如果你了解GPT的优缺点,就可以发挥其长处,避免短处。对于能在搜索引擎中找到正确答案的问题,其实根本不需要用到GPT。与其问GPT“这是什么?”这类问题,不如问“为什么?”、“怎么看?”和“怎么做?”。这也意味着,在GPT的回答中,很可能没有唯一正确的答案,也没有最优解。在吴恩达博士新推出的“prompt engineering”课程中,他简洁明了地介绍了GPT在总结、扩展、翻译、推理等多个方面的强大能力,这些能力在很多方面都超过了现有的搜索引擎。任意一项都是搜索引擎无法实现的。作为AI的初学者,学习这门课作为入门工具再合适不过。在短短2个小时内,你就能了解基本原理。仅以这四种基本功能为起点,就已经有无数的应用场景和排列组合可以想象。作为一个玩具,GPT并不比原神、星穹铁道有更多的玩法,也不比在王者荣耀峡谷中带飞更有成就感,不比抖音里的小姐姐更赏心悦目,也并不能像大狼狗、小杨哥等人在帮你消磨时间的同时还能买到便宜货。所以,在尝试了一圈脑筋急转弯并从中获得了智商上的优越感之后,大多数人又回归到了原本的生活。然而,他们并未意识到,这个世界已经因为GPT的诞生而发生了变化。GPT的出现代表着生产力层面的跃迁,它带来的影响不亚于珍妮纺织机、瓦特改良蒸汽机、电力和互联网。当黄仁勋说GPT-4的发布让AI迎来了“iPhone时刻”,我是完全同意的。一个新的入口正在诞生,一个新的生产力革命正在我们眼前发生。而这个机会,属于所有人,属于普通人。
GPT翻译很厉害,但我更想学英语了
在使用GPT以及MJ、SD等AI工具时,确实可以感受到一种弱势文化的憋屈感。从GPT训练时使用的语料库数据可以看出,英语占据绝对统治地位,而中文作为世界上使用人数第二多的语言,在总体语料中的占比仅为千分之一。这使得中文在全球知识传播中面临巨大的劣势。
中国自己的大型AI模型尚未问世,但即使有了自己的大模型,也无法解决中英文信息不对称的问题。在过去的100年里,全球发表的论文中有90%以上的论文使用的是英语。这个比例在2000年曾经达到惊人的98%。在日常生活中,我们可能只关心自己人懂的内容就足够了,但是作为未来重要的生产工具,我们仍然面临着中英文无法对齐带来的信息缺失。正如我们所看到的,如果没有明朝皇室宗亲名字的生僻字撑着,我们甚至凑不齐一个元素周期表。因此,我们应该在提高自己的英语水平的同时,加强中文在全球知识传播和交流中的地位。这样,我们才能更好地利用GPT等AI工具,为未来的发展创造更多机会。不仅仅是科学术语,中英文本质上是两种不同的语言逻辑,语法和词汇并非一一对应。即使GPT在翻译方面表现出色,但在翻译过程中仍会有大量信息损失。这也解释了为什么用中文提问时,有时会收到英文回答,因为中文可能没有这个词。当百度文心一言问世时,其自带的绘图功能被认为只是换了个皮的产品,例如著名的“车水马龙图”。是否真如此,我觉得没必要证明,但确实存在用中文直接翻译成英文喂给SD或MJ,导致奇怪结果的现象。在一些国内SD汉化网站上,用文生图输入“鹤”和“都市”,可能会得到如下图:当我使用MJ时,需要将看到的别人作品的英文翻译成中文,修改后再翻译回英文。可能是因为我的艺术修养较低,想象力不足,不懂专业术语,所以无法直接用中文输出,但这样的过程经常像鸡同鸭讲。以“carving”为例,中文翻译是“雕刻”,但在英文中,雕刻还可以翻译成“engraving”,因此在翻译过程中可能产生意外结果:Prompt:in style of engraving artwork , 1girl, portraitPrompt:in style of carving artwork, 1 gril, portrait这就像玩“传声筒”游戏,每经过一次转述,都可能产生意想不到的事情。句子越长,误差越大。此外,许多名人和专有名词在中文中通常采用音译方式,记住这些音译名字并不比原文容易,特别是较长的人名,使用起来比直接用英文更容易出错。在GPT中,名人是最佳的提示,无与伦比,因为每个名人都有大量信息被收录,丰富的语料让他们充实饱满,无需再用文字描述。参考微软的GPT4报告中关于莎士比亚解答数学问题的例子,我测试了一下:与其花费大量时间去记住那些所谓的GPT 10个最佳提示,MJ 20个最有用的提示,了解更多国外名人可能是提升你能力的快速途径。把GPT当作玩具的人,可以忽略我的建议。为了稍微增加可能性和趣味性而增加学习负担并无必要。但是,对于把GPT当作工具的人来说,应该认真思考我提到的对齐问题。科学界,特别是前沿科学领域,普遍使用英语进行研究和发表论文。GPT为普通人提供了一种更简便的方式来接近科学前沿。要像科研工作者一样,将AI的最后一点效率挖掘出来,英语这个障碍是无法避开的。
未来被GPT伤害最大的是哪个行业——移动互联网
不久以前,尽管中国的个人电脑普及率较低,办公自动化程度不高,但凭借庞大的市场和人口基数,中国通过智能手机迅速崛起,一跃成为全球移动互联网最发达的国家,甚至美国移动互联网创业者都需要向中国公司借鉴学习。短短几年就诞生了像字节跳动和拼多多这样在移动互联网时代崛起的具有全球影响力的企业。然而,同时也有一个困惑:为什么中国的移动互联网如此发达,但SaaS行业却没有像美国同行那样收入和估值飙升?直到最近深入学习AI,我才更直观地感受到,SaaS发展缓慢的很大原因可能与我们在PC端的滞后有关。在GitHub上,huggingface里有大量不断更新的模型。也许是我的错觉,这些产品大多都是针对PC端的,我还没有看到哪个模型是以手机为主进行调试的。这当然受到手机性能的影响,但在手机那么小的屏幕上编程、写文件实在是不方便。将AI视为效率工具,其主要应用场景在PC端,与SaaS的场景高度重合。在中国企业办公环境中,除了少数互联网公司外,许多企业、事业单位对办公自动化的理解仍停留在Office三件套水平。在这其中,潜力巨大。GPT的强大能力和易用性解决了之前学习门槛高、学习动力不足的问题,有望引发中国SaaS行业的爆发式发展。只是在这波发展中,我感觉移动互联网并没有获得多少增益。自从开始学习和使用AI,我在电脑上的使用时间明显增加了,因为PC上的AI工具太多太好用了!我甚至想起了几年前罗永浩推出的TNT工作站,虽然他们和现在的GPT只是形似,逻辑差异巨大,但也许那是中国距离AI智能办公世界领先水平最近的一次尝试。几年前,Google眼镜刚推出时,我非常兴奋,但在试用过后,我果断放弃了。无法替代手机的问题主要在于输入确认,语音和眼动都无法实现精确操作,还需借助其他设备,如手机或PSVR那样的手柄。但GPT让这一切成为可能,如果AI能听懂你的话,它可以通过追问来确认你的想法,让每个人都拥有一个像钢铁侠的私人助理Jarvis。这不仅仅是技术升级,而是可能引发交互范式的改变。不再需要手机,只需一个耳机就能完成操控。手机变成纯粹的屏幕,交互价值被削弱,离边缘化不远。这样,依靠移动互联网建立庞大帝国的中国大厂可能面临重新洗牌的机会。GUI(Graphical User Interface,图形用户界面)将不复存在……推荐一部多年前关于人工智能的电影《her》,为我们思考未来提供了一个方向,技术上已经没有障碍。靠一幅耳机就可以征服世界,(只有寡姐可以)优雅,真的优雅。补充一点,如果屏幕变得不那么重要,人们获取信息的逻辑将再次改变,从PC时代的搜索逻辑,到移动时代的推荐逻辑,到AI时代的助理总结逻辑。GPT具备总结、推理、扩展能力,可以自行处理信息,对全信息源进行汇总。信息可以极大压缩,拓宽人们获取信息的带宽,普通人也能打破信息茧房。技术平权之后,信息也有望进入平权时代(希望如此)。
笨蛋,问题是教育
如果说有一个行业关乎所有人,且受到GPT巨大影响的,那就是教育。这里包括素质教育、应试教育以及高等教育,从小学到研究生的全阶段教育都将受到GPT的冲击。首先看老师端,我们来看一张图,这是GPT-3.5和4.0在不同领域与人类水平的对比:数字越靠右越强。GPT-4在GRE考试方面几乎超越了全人类,在写作、法律、数学、心理学、生物、统计等多个领域也超过了大多数人类。打个比方,GPT当老师就像是一个美国常春藤名校优秀本科生(且懂中文)的水平,全科通才。相较于90%的老师更专业,100%的老师更博学。GPT可24小时随叫随到,一对一贴身服务,不带情绪和不满。无论你多笨,它都不会生气。这样的家教费用低于一个月的手机通信费,现有教育体系如何与之竞争?其次是学生端,有了GPT,99%需要死记硬背的内容都不再浪费时间。正常人不会背圆周率后几十位,只有记忆力超群的人才会。公司招聘也不会要求口算两位数乘法,因为电脑轻松搞定。如此一来,我们在学校学的内容还剩多少需要花时间去学?据报道,美国大学生中有89%使用GPT写作业。在中国的GPT用户中,用得顺畅的很大比例是中小学生。美国甚至出现了检测论文是否使用GPT的侦测工具,可见GPT对教育的影响之大。教育系统的结构也将发生变化。只要一个人有兴趣,便能获得顶级专家的悉心教导,甚至在小学就可以自学高等数学、理论物理和微观经济学。那么,现有的以同龄人智商和学习能力中位数为参考设定的教育体系,还有意义吗?让学生别把大量时间花在未来不会用到、现在也不感兴趣的学科上,而是让他们充分发挥自我激励,在最具创造力的年纪在他们最喜欢的领域创造价值,不是更好吗?另外,教育理念也面临挑战。许多人接触AI时最深的感触是我们仍将GPT视为一个寻求正确答案的工具。我们习惯了背诵、习惯了寻找正确答案、习惯了避免独立思考,习惯了不求甚解。虽然GPT是一个全方位、互动式、可改进的学习机器人,但它不能替我们提出问题。当我们热衷于找到最佳的prompt秘籍,试图通过一个完美的提问立即掌握正确答案时,我们只是获得了一个解答,甚至可能不是最优解,却失去了掌握解答此类问题方法的机会。吴恩达博士在课程中曾说:“我不推荐学习网上那种30个精选的GPT prompt,因为每个人的情况都不同,没有一个prompt能完全符合你的要求。使用prompt的过程不可能一次成功,如果你一次就得到了一个完美的结果,反而应感到惊讶。”最终,我们将回到教育的本质:是为了求知还是为了竞争?如果GPT是我们无论如何也无法企及的存在,且每个人都可以轻易具备GPT赋予的能力,竞争将不再取决于个人的努力与学习成效。那么,是什么支撑着我们继续学习?这是所有学生、家长以及生活在AI时代的人都需要认真思考的问题。写在最后:
GPT为像我这样"眼高手低"的人提供了实现梦想的机会,让我可以尝试许多过去不敢想或没时间做的事情。“AttributeError: 'NoneType' object has no attribute 'pop'”、 “Something went wrong Server disconnected without sending a response.”、 “Couldn't find Lora with name chilloutmixmm_v10” …… 等一些小bug之外,一切都是美好的。拥抱AI时代最好的方式是亲身投入,感受这个技术带来的变革。但我无法真正说服那些还没有亲手尝试过GPT的人,就如同难以向盲人解释红色一样。五一期间,我避开了人潮,留在上海沉浸式学习AI,并顺便组建了一个小社群。虽然人数不多,但成员素质普遍较高,能达到85%以上的GPT普及度。社群中还有一些实战经验丰富的专家和大神。期间,我们还组织了一次小规模的AI艺术马拉松(AIartathon)。尽管我们的作品可能会被艺术家视为小孩子的涂鸦,但我们依然能在自己的创作中找到乐趣。正是AI赋予了我们这样的可能。prompt:when I was young I went up to the Valley of the Ancients and there I was worshipping The ancient One, The fountain of life, The shining like the communist fire, The glory of the Lord,the glory of the Holy Spirit,I would go forth,my back,and forth --s 750 --v 5