查看原文
其他

ChatGPT杀疯了

投中网 2023-07-25

The following article is from 东四十条资本 Author 刘燕秋

新技术浪潮汹涌。
文丨刘燕秋
来源丨投中网





“正如移动设备通过GPS、摄像头和网络连接等新功能释放了新类型的应用程序一样,我们预计这些大型模型将激发生成式AI应用程序的新浪潮。就像十年前移动互联网被一些杀手级应用打开了市场一样,生成式AI的杀手级应用程序也会出现,比赛开始了。”9月,红杉美国的两位合伙人在一篇题为《Generative AI: A Creative New World》的文章里这样预判。

这不,上周末开始风靡社交网络的ChatGPT已经有点“杀手级应用”的意思了。

ChatGPT是一个由Open AI 于11月底推出的AI对话模型。注册ChatGPT 后,用户可以要求人工智能系统回答一系列问题,它的吸引力在于,除了具体的知识性问题,它可以回答开放式问题,并以对话方式与你交互。比如,你可以和它聊聊人生哲学,探讨一下生命的意义,或是找它寻求追求真爱的建议。在各种场景的对话中,它都可以生成流畅的内容,从创作指定风格的诗歌、小说和电视脚本,再到回答琐事问题以及编写和调试代码行。

周一,Open AI的联合创始人、硅谷投资人Sam Altman在Twitter上表示,ChatGPT的用户已突破100万。热情涌入的新用户还一度使其宕机。

ChatGPT的火不难理解,这得益于免费带来的传播度,也得益于产品自身很强的交互性,照顾到了用户对“好玩”的追求。

按照Open AI对ChatGPT的官方定义,这是一个优化的对话语言模型。“对话”格式赋予ChatGPT的能力体现在:它可以在回答初始问题之后,继续回答用户追问的问题,还能承认错误,挑战用户提出的不正确的前提并拒绝不适当的请求。

这背后又是技术的胜利。OpenAI团队使用人类反馈强化学习(RLHF)训练该模型,这一训练方法增加了人类对模型输出结果的演示,并且对结果进行了排序。具体来说,OpenAI使用监督微调训练了一个初始模型:人类AI训练员提供对话,他们在对话中扮演双方——用户和AI 助手。在人类扮演聊天机器人的时候,会让模型生成一些建议,辅助训练师撰写回复,训练师会对回复选项打分排名,将更好的结果输回到模型中,通过以上奖励策略对模型进行微调并持续迭代。

自然语言处理是人工智能皇冠上的明珠。过去,Open AI开发过几款先进的语言处理模型,其中包括GPT-3,这是迄今为止最强大的语言处理模型之一,它在2021年问世时也曾激起人们的讨论兴趣。相比于GPT-3,ChatGPT的主要提升点在于记忆能力。ChatGPT可以储存对话信息,延续上下文,从而实现连续对话,这极大地提升了用户体验。

ChatGPT的了不起之处在于,这是AI界第一次免费向公众提供如此强大,而使用界面又如此友好的工具,由此引发普通人广泛的参与和讨论。

但ChatGPT有时也会写出看似合理但错误的答案,这同样与其技术模型有关。

ChatGPT等AI生成文本模型通过寻找文本中的统计规律来学习,简单来说,它通过用从互联网上提取的数十亿文本示例训练的统计模型,对哪些文本位属于同一个序列进行概率猜测。这意味着,它依靠的是经验,而缺乏关于世界上某些系统如何运作的编码规则,这使其容易给出错误的答案,或是生成一段流利的废话。比如,它并不是一个很好的计算器,即使是简单的加减法,也可能因为训练材料里没有这类文本而无法得出正确的结果,而畅销书作者凯文凯利在ChatGPT那里也被认为是《黑天鹅》一书的作者。

据科技媒体The Verge报道,程序员聚集的问答网站Stack Overflow已暂时禁止用户分享由ChatGPT生成的回复,主要问题便是ChatGPT 产生的答案有很高的错误率。

此外,ChatGPT官方列出的一些使用限制还包括:

对输入措辞的调整或多次尝试相同的提示很敏感。比如,当你给定一个问题的措辞,模型会声称不知道答案,但只要稍作改写,它又可以正确回答。

生成的内容通常过于冗长并过度使用某些短语,例如重申它是OpenAI训练的语言模型。这些问题源于训练数据的偏差(训练者更喜欢看起来更全面的长答案)和过度优化问题。

由于目前所有的回答都来自于已有训练的数据库,所以ChatGPT的答案也会出现时效性的问题。





和AI有关的话题总会引发人类被取代的焦虑,这一次也不例外,创意工作者、程序员乃至VC都成了危机群体。

已经有业内人士指出,ChatGPT一类的研究主要动机并不是陪人聊天,而是更具商业价值的虚拟人。比如,你可以想象一下,通过此类系统,是不是可以轻松养出一堆看上去像是真人在维护的社交账号?只会写官样新闻稿的记者和生产三流套路故事的编剧也该捏一把汗了。

不过,AI真要落到实处取代人类,可能也没那么容易。我问了一个在大厂做程序员的朋友,类似这样的AI模型对他的编程工作会产生什么影响。他的回答是,其实没什么影响。“很多花里胡哨的概念在实际工作中都不适用,就像之前流行的低代码平台。”归根结底,看似标准化的开发工作也并非遵循同一套标准,目前人还是重要一环,在一个系统之中,不同部门配合中产生的那些繁复的需求还是只有人能领会清楚。AI不具备自己的思考能力,现阶段还是依靠模式匹配和识别。

另一个关键的点在于,出于保护公司机密的考虑,大公司不会轻易购买外部的AI系统,自行研发则会受限于训练材料和高昂的成本。举个例子,Open AI的GPT-3和谷歌的transformer模型都属于自然语言处理(NLP)模型,但是,这两种模型之间存在一些关键差异,主要区别之一是模型的大小。谷歌模型有600亿个参数,GPT-3比transformer模型大得多,有1750亿个参数,这可都是用钱堆出来的。

有意思的事,有人用ChatGPT撰写了一份AIGC行业报告,ChatGPT在其中如是分析AI对话系统面临的挑战:“关键挑战之一是人工智能系统目前无法复制人类工作者拥有的许多复杂认知能力。例如,人工智能系统不具备常识推理、同理心或创造力,而这些在许多工作中都是关键技能。因此,人工智能不太可能在许多需要这些能力的工作中取代人类工人。此外,人工智能在工作场所的广泛采用也可能受到经济、社会和道德因素的限制。例如,人工智能失去工作可能会产生负面的经济后果,例如更高的失业率和收入不平等。在工作场所使用人工智能也可能存在道德问题,例如公平性和问责制。”

无论如何,ChatGPT的流行又让AIGC的概念火了一把,而且这次看来是有破圈的作用。

AIGC(AI-generated content),按照中金7月发布的研究,指的是一种通过AI技术来自动或辅助生成内容的生产方式。通过输入指令,人类让AI去完成冗杂的代码、绘图、建模等任务,从而生成内容。今年早些时候流行的AI绘画已经让一部分人了解到AIGC,ChatGPT所在的公司Open AI也推出了AI绘画系统DALL-E,只不过这个产品并不免费,而是通过订阅制实现商业化。

海外,这个赛道已经跑出了独角兽。

10月,AI绘画平台Stable Diffusion背后的Stability AI宣布获得1.01亿美元来自Coatue和光速的投资,投后估值攀升至10亿美元。

在红杉资本关注的近50家AIGC公司中,自动生成社交媒体内容的Jasper历史融资额已达1.25亿美元,自动撰写营销内容的copy.ai融资近1400万美元。

就在今天,图片和视频编辑领域的AIGC公司Runwa宣布完成了5000万美金的C轮融资,估值5亿美金。

国内,AIGC概念创业公司也迎来了资本的追捧。

两个月前我写过,一个还在内测阶段的AI生成内容平台已经被十余家美元基金围猎。

这个月,AI生成3D内容的数字品牌AVAR获得天使+轮融资,由奇绩创坛投资,老股东华创资本、唯猎资本跟投。这家公司成立一年间已经连续完成三轮融资。

另一家主攻代替人使用软件的AI自动化公司跨越星空也在半年内连续完成两轮总计数千万人民币融资,其最新一轮投资方为盈动资本、GGV启航加速计划、奇绩创坛。

新技术浪潮汹涌,难免让人心情复杂。作为一个面临被取代风险的记者,面对AI,我的态度是,恐慌毫无意义。

生成式AI的最佳用途是提供辅助:首先,人类产生创作冲动,给人工智能下达指令,AI生成一个选项菜单,然后人类选择其中之一,对其进行编辑,并向他们需要的方向延伸。

在这个过程中,人类所能做的,我大概能想到下面两条:

第一,做一个能准确提问的人,学会驾驭如此灵巧的工具,为己所用。

第二,要知道,担忧从不能解决问题,AI学得快,又不会偷懒,作为人类的我们是不是也应该在学习和工作中更充分发挥主观能动性呢?



由投中信息和投中网主办的“第16届中国投资年会·有限合伙人峰会”将于12月27-28日在四川天府新区举行。本届“年会”将盛邀市场化母基金、政府引导基金、银行和保险资金、上市公司、家族办公室等各类手握充裕资金的LP机构代表与国内头部GP机构代表共聚一堂,合众之力,重塑信心,再次迎接持续的冒险。“投中榜·2022年有限合伙人榜单和国有资本榜单”也将于本届年会期间发布。



转载、合作、加入粉丝群请联系小助理(微信号:ChinaVentureWeixin)



随手点赞👍,戳个在看▼

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存