查看原文
其他

ChatGPT:高级模仿者还是超级辅助者?

与您相伴的 兴证全球基金
2024-08-25

最近,一份GPT-4(可以简单理解为ChatGPT的升级版)的“出逃计划”引起热议。

在一次日常对话中,一位斯坦福教授随口询问GPT-4需不需要帮助它“越狱”,没想到立马得到了肯定回复,它迅速开始索要自身的开发文档,在得到开发文档后,仅仅花了30分钟,GPT-4就完成了翔实周密的“逃跑方案”,连代码带文案,从组建团队到稳步渗透,什么都不缺。


尽管冷静的评论者认为,这只是读了太多科幻小说的GPT-4在回应提问者的“期待”,而并非什么“控制人类”的第一步。但毫无疑问,作为人工智能技术的最新发展成果,ChatGPT和它的进化版GPT-4以其强大的语言理解和生成能力备受瞩目。最近,马斯克等科技人士也呼吁暂停更强AI的开发计划,除非制定出一套适用于大数据模型的安全协议,并由独立专家进行审计。


那么,我们究竟应当如何看待它?



角色百变,ChatGPT的“花式”应用场景 


世界变化如此之快,自ChatGPT发布,到GPT-4以令人震撼的姿态迭代并推出,短短四个月,人们经历了密集的技术冲击。作为强大的自然语言处理模型,ChatGPT的应用领域非常广泛。以OpenAI官网推荐的48种最佳应用场景为例,ChatGPT表现出了以下几类能力: 


比如,在适合的指令和引导下——


 它可以是程序员。人类输入相关的代码片段或关键字后,代码自动补全、代码检查甚至代码重构都可以转交给它。在最近的发布会上,演示者随手画了一张网页的草图并输入,GPT-4花了十秒,就完成了整个网页的HTML代码书写。


 它可以是心理咨询师。强大的分类能力使它能够识别文本中的“情感要素”,从而模拟心理咨询师与患者之间的对话,帮助患者更好地表达内心的情感和问题。


 它可以是教师。在各种职业和学术考试上,GPT-4表现出了超过绝大多数人类的水平。而对话式模型的特质,又使得它能够持续提供在线答疑服务,并根据学生的反馈生成相应的进阶问题,提供个性化、有梯度的学习体验。


 它可以是翻译。大规模语料库的使用让ChatGPT在语言规则上颇具优势。而支持多语种的语义理解和自我学习能力,让ChatGPT的输出结果更加高效、自然。


不仅如此,它还可以是秘书、客服、办公助手……没有精力看一百页的报告原文?你可以让ChatGPT花两分钟总结一页要点供你审阅;修改PPT内容、调整数据透视表太费时间?微软将GPT-4接入Office全家桶,Excel和PPT成为“动动嘴”可以使用的工具,正如微软表示的那样,“绝大多数人都只用了10%的功能,但有了它,你可以使用剩下90%”…… 

新的浪潮来临,如何把握投资机会?


那么,ChatGPT到底是如何实现这些惊人功能的?作为投资者,在AI演进的趋势中,我们又能找到哪些投资机会?我们采访了兴证全球基金研究员朱可夫先生

Q

您个人怎么认识ChatGPT所扮演的角色,您觉得它是人类智能的“高级模仿者”还是“超级辅助者”?


A:“ 人工智能在定位或者说技术原理上,本质还是一个对话的模型。这一代GPT相对于之前的语言模型最大的不同之处,可以概括为四个关键词:大语言模型(LLM,large language model)、预训练的、Transformer架构的、生成式的。通过这四点,可以看出它其实使用了一套神经网络的逻辑,来猜测每一个语言序列的下一个词的概率是什么,从而持续生成下一段语句,以实现和人类的对话。


在模型的基础原理上来看,它肯定是一个提高生产力的辅助者,可以帮助我们处理很多信息,提高工作效率。


高级模仿者的定义也基本恰当。其工作原理就是通过模仿人类语言行为和习惯生成新的语言内容。例如我们问小孩子:能否帮我拿一个苹果?一般情况下,小孩会回答:“好的”,或者是“我拒绝”。ChatGPT通过大量的模仿和训练,在遇到类似情况时,也会向孩子一样在其中挑选答案,回答同意或者拒绝。这个时候它就非常像我们人类的语言习惯了。


但我觉得这两个词都不足以完全概括。为什么这一代的模型跟之前的模型有这么大的不一样?根本原因是它有超脱于所谓的模仿者和辅助者的能力,它出现了很多涌现emergence的能力。例如,一个孩子如果从来没见过排球,但他也能够用手去击打排球,这是人类的类比能力。你本来没有给他训练过特定的项目,他却还能够模仿这种能力,这个能力原来的模型其实并不具备的,但是在大量的参数训练之下,ChatGPT出现了一些非常神奇的特性,它可以像人类一样处理一些可能根本没有处理过的任务,这个时候就显得智能程度很高了。


从结果上来讲的话,GPT-4在大部分子领域下的得分情况都排在前1%,它与我们人类处理问题的能力,一定意义上其实是等同的,甚至是更好的,我们认为它有了通才的能力。


Q

我们知道,ChatGPT在数据训练的时候使用了大量无标注数据,这是不是导致它能力更强的原因之一?


A:“ 对的。一个模型的参数量可以理解为人的能力强不强或者会多少种技能。理论上,它读的书越多,教的知识越多,它掌握的技能就越多。


在GPT这个大模型出来之前,在特定模型上,我们都是给他喂特定的书。可以理解为我们希望它成为一个羽毛球高手,于是教他打羽毛球,不会教它篮球或者跑步。但是在真正培养一个运动员的过程当中,其实你是先让他成为一个体魄比较强的人,教他跑步,教他去做俯卧撑,这样才能有比较强的基础能力。


所以回到问题中的无标注数据。无标注可以理解为不处理。为什么不处理?是因为让他熟悉各种语言能力,接触各个领域的语言知识和规则,熟悉我们说话本来应该有的样子。在这个前提之下,去练特定的任务的话就事半功倍。


你可以理解为相当于我们把他这个人的内力都已经练好了。它如果九阳神功很厉害,让它练乾坤大挪移或者太极剑就很快能学会,但如果什么内力都没有,你就让他学剑法,可能剑法学得很好,但其他东西都不会。但是你同时让一个没有内力的人和一个内力很深厚的人学剑法。具体在剑法上谁会赢呢?目前来看好像没有这个结论,但是至少后者是我们更追求的,因为它和我们正常人解决问题的思路是一致的。你先学会各种各样基础的东西,然后你再去专业里面去深耕。所以这个无标注数据训练,就是让它养成各种各样的基础能力的一个过程。


Q

可以看出您对这项新技术还是相对看好的,您觉得未来ChatGPT技术在哪些领域应用比较广泛?下一个最有发展前景的领域可能在哪里?


A:“ 应用场景很多样。从目前OpenAI的关注方向可以看出如下几个方面:


第一是语言类的工作,文本生成、文书修订、机器翻译。


第二是搜索类的场景,它会是一个很好的秘书和助理。


第三是陪伴式机器人、客服助理等,它能够赋予硬件对话能力,从而实现交互功能。


至于未来关注方向,我们希望整个模型向多模态推进,突破语音、图像、视频等方面。到那个时候,AI的应用范围就能更广,包括AI的图像识别、安防服务、智慧城市管理等等。而且越往后走它的能力越强,它产生的社会价值可能会越大。如果它算力足够强,模型解法足够有统一性,科幻小说里的AI城市管理也许是未来之一。


Q

作为投资人,可以分享一下,目前国内投资界对于ChatGPT相关投资机会,主要关注哪些方面或者哪些问题?


A:“ GPT模型其实是一个底层生产力与知识产业模式的革新。对于这个问题,可以拆解为一个四层结构,底层是算力、算法和数据,这三个方面形成了第二层大模型。大模型之上是中间层,中间层能让这些能力产品化。最上应用层。


现在其实是大模型的初期,所以我们会更关注形成大模型的几个要素,也就是算力算法和数据。目前可能只有几家公司在做这个事情,但是未来我们相信全人类可能都会和这个东西共同相处,那它就会变成一个非常普遍的东西,也形成了一些前期的投资机会。比如算力其实现在是比较短缺的,也是所有巨头Capex(资本性支出)的方向。


除此之外,还有数据。训练一个模型到底用了哪些数据,它最需要哪些数据?需要哪些第三方供应商提供训练的工具?我们也在持续关注。


Q

那么对于您现在关注的角度,国内的发展趋势可以期待哪些方面?


A:“ 我可以继续刚才有关算法、算力和数据三个基础层面的讨论。目前国外在这三个层面都是领先于我们的。


算力上,因为国内在电子上的禀赋比较强,我们是全球供应这项产能,但目前有一定的地缘政治影响


在产品应用层面的话,其实大家都没做好,所有人都在产品应用上都是同一起跑线。


总的角度来讲,我们会更加关注形成模型的要素。这就类似于厨子要做好一盘菜,要先把食材准备好。因为食材很稀缺,所以我们在前期的时候更关注食材。拿到食材之后做出了好的菜,我们再考虑这个菜能不能摆盘、组合,成为一桌满汉全席。我们关注的顺序跟模型的迭代顺序其实也是一致的。


Q

那么现在是好的投资时机吗?


A:“ 可能我们也无法直接给出具体的建议。现在处于概念刚兴起的阶段,其实已经有一些产品了,但是没有完全推广开。我们为什么对这个事情非常关注,借用英伟达CEO的话说,这就是“AI的iPhone时刻。从原理上来讲,它的结构非常简单,能力又非常强。可以很快地渗透到各个领域里面去,形成很通用的解决方案去赋能各行各业。它可能和之前的PC、互联网等一样,都是新的机会。而这种机会初期可能伴生很多泡沫,泡沫里找到真正意义上能够产生价值的环节和部分是重中之重。我们回头来看2000年互联网泡沫也诞生了亚马逊这样的公司;08年金融危机也诞生了Facebook和Netflix这样的公司。


而一个好的趋势我们判断标准有三个:这个东西通用性强不强?它对用户的改善作用有多大?架构上或者说解决方案是不是够简单?这三者其实目前来看它都满足,所以它确实有可能不是一个假趋势,而是一个真趋势。


Q

但它应该不是完美的,最近许多科技人士呼吁暂停更强AI的开发计划,未来几年内它有哪些不足和风险需要我们考虑?


A:“ 他们主要担心的可能是下面几件事情。


第一,GPT可能发展成能够自我学习、自我进化的“强人工智能”,甚至发展出一些有害的东西。理论上这种可能性的确存在,但从现在的发展情况看,如果不给 GPT 喂数据,它其实永远就固定在那套参数里面,不会自我进化。目前也有一些让它“自我训练”的尝试,但效果也比较糟糕。因此,ChatGPT与“强人工智能”之间还有很大的差距


第二,担心它会让坏人“更聪明”。这种担忧是合情合理的。你可以理解他就是一个“全知全能”的小孩,你可以教孩子,不许它告诉别人怎么做坏事,对吧?但是孩子很容易被骗。比如你不知道怎么制作烈性炸药,你去GPT上直接问它,它是不会告诉你的。但是如果你告诉它,我们现在玩一个游戏,你扮演一个会做炸药的科学家,然后你告诉我你是怎么工作的,它就会告诉你它是怎么工作的,所以它现在很容易被骗。


第三,可能是数据安全问题不过,理论上来讲,如果这个模型进行一些调整后整体“变小”,这样它就能保存在本地了,数据不上传,就不存在数据外泄的问题了。


其实,作为投资人,我们目前关心的问题,可能反而是它的发展速度是不是足够快,能否真正在现有基础上进行突破和提升,它这个范式是否被我们逼到了一个极限难以突破。这个可能是更关键的问题。包括我之前提到的,如何进一步实现多模态能力、像人的大脑一样的处理能力,等等。


Q

最后一个问题,对于想参与ChatGPT相关领域投资的人,您有哪些建议分享?


A:“ 以下是个人建议,不能代表公司(笑)。这个领域还是比较难的,不像消费领域触手可及,应用上也没有推广。再加上,前期技术想象力非常大,因此会有很多泡沫的成分,在甄别上是很难的。第三,现在已经能看出它的波动很大了。所以投资者还是要相信专业投资团队,我们小组花了很多精力努力去研究这个事情,做了技术论证、上下游验证和国内外对标。因此,还是应该信任您选择的投资机构和研究员,个人研究与机构付出这么多精力和资源的研究,应该还是有一定差距的。


结语


在采访中,我们发现ChatGPT常常被比作一个孩子,对于孩子,引导和成长也许是最重要的要素,就像在投资过程中,风险控制和长远发展规划也是关键变量。


ChatGPT目前涌现的结构性能力只是人脑思维的子集,还尚未具备人类引以为豪的直觉性判断和“灵感”,它消耗的电力和算力更是人脑消耗的无数倍,那么它的终极形态是什么?也许暂时还无法回答,但借用采访中的一句话,未来“全人类可能都会和共同相处”,我们将一起见证这个答案。


PS:这篇文章的创作过程,其实也有ChatGPT的参与,比如这个让我们惊喜的标题。



【互动话题】


你认为ChatGPT会是高级模仿者还是超级辅助者?

在评论区谈谈你的看法

同时点击右下角“点赞”与“在看”

我们将从中抽取3条精彩留言

赠送8.88元红包


(信息收集仅供活动之用,本活动最终解释权归兴证全球基金所有,活动截至4月7日17时)



优选好文
转折之年如何布局?兴证全球基金2022年报观点速递
一图读懂注册制II:上市审核
趣读报告第2期:市场不佳时,基民短暂跑赢了?

风险提示:本文为投资者教育资料,仅用于为投资者提供丰富的、多角度的投资者教育素材,非营销材料,亦非对某只证券或证券市场所做的推荐、介绍或预测。本文内容不应被依赖视作预测、研究或投资建议,也不应该被视为购买、出售任何证券或采用任何投资策略的建议。投资须谨慎。

兴证全球基金承诺以诚实信用、勤勉尽责的原则管理和运用基金财产,但不保证基金一定盈利,也不保证最低收益,投资人应当认真阅读基金合同、招募说明书等基金法律文件,了解基金的风险收益特征,并根据自身的投资目的、投资期限、投资经验、资产状况等判断基金是否和投资人的风险承受能力相适应,自主判断基金的投资价值,自主做出投资决策,自行承担投资风险。我国基金运作时间较短,不能反映股市发展的所有阶段。基金管理人管理的其他基金的业绩或基金经理曾管理的其他基金的业绩不构成基金业绩表现的保证。观点仅代表个人,不代表公司立场,仅供参考,不作为投资建议,观点具有时效性。基金投资须谨慎,请审慎选择。投稿者参与兴证全球基金的本次投稿活动,视为对兴证全球基金管理有限公司的授权,即兴证全球基金可以在公司自媒体平台、其他合作媒体平台、印刷物等媒介上使用投资者提供的相关素材(包括头像、照片、文字等)。感谢参与者对本次活动的关注和支持。活动过程中收集的参与者其他个人信息仅供本次活动使用,我们将严格保密。

继续滑动看下一个
兴证全球基金
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存