查看原文
其他

投资人观点| chatGPT的意义被远远低估了,AGI时代序幕已经拉开了

余智敏 东西文娱 2023-10-23

本文系投资人余智敏投稿,版权归作者所有
本文适合人群:所有关心未来的人
(一定会很快与你的工作/生活相关)
预计阅读时间:12mins-15mins


为什么说chatGPT是革命性的产品?    

1.chatGPT能做什么   
2.chatGPT震撼在哪里
3.AI是如何工作的   
4.chatGPT如何实现的重大突破   
5.chatGPT开启真正的AGI时代


后chatGPT时代展望   

1. 大模型基础设施趋势判断   

2. 应用生态潜在机会可能性

文中涉及的基础概念,从业人员可跳过

AGI(Artificial General Intelligence)是指通用人工智能,和普通人工智能的区别主要在于它们的能力。普通的人工智能只能完成特定的任务,比如语音识别、图像识别等,而AGI则能够完成任何人类能够完成的智能任务,并且能够以和人类相似的方式学习、思考、决策。AGI拥有更强大的智能能力,可以完成更复杂的任务,并且能够应对更多的变化和挑战。因此,AGI比普通人工智能更具有前瞻性和普适性,是人工智能领域的一个重要目标,也是人工智能发展的最高境界。

from chatGPT

NLP (Natural Language Processing)意思是自然语言处理。NLP 是人工智能和计算机科学领域的一个重要分支,主要研究如何使计算机能够理解、分析和生成人类语言。
from chatGPT

formalization (形式化推理)指将某种概念、想法或理论用严格的逻辑推理和数学语言来表达的过程。它包括将抽象的想法转换为形式化的语言,并建立适当的模型来描述和分析这些概念、想法或理论。通过形式化,人们可以更清晰地思考和探究复杂的问题,并为解决问题提供有力的工具和指导。
from chatGPT


导语

2013年我出于好奇心,花了接近半年的课余时间自学了AI神经网络模型,那会儿数据量级、计算机算力水平、神经网络模型的参数都还在非常初级的水平,就已经能在很多领域实现非常惊艳的预测效果。当时由于还不是主流模型,相关编程资料非常少,花了很大的精力才从0把模型跑通。现在再回顾也算是dots connected的事件了。


在过去近10年中,无论是alphago击败人类获得围棋冠军,还是最近几年AIGC生成声音、图片都不算出乎意料,但此前我一直觉得NLP的训练难度是远超前几者的,标注难度大,formalization程度不够,会卡在人工智障的阶段很长时间,直到这几天我体验了chatGPT,陷入了深深的震撼中...夸张来说就是NLP真正从人工智障到了人工智能。我承认我此前远远低估了AI的进化能力,也高估了人类沟通的复杂程度。



一、为什么说chatGPT
是革命性的产品?

1. chatGPT能做什么

以下是基于个人体验观察到的chatGPT体验做的一个主观打分,让大家有个直观概念。4.5分是很好用,他的回复可以直接使用,3.5-4分场景很不错,可以做个很棒的助手,3分以下的场景回复还不能直接使用。



写代码:直接给一个大的目标没办法写出全部代码,但是给出具体的问题可以快速实现,且由于有上下文识别能力,可以根据要求修改快速修改并且给出解释。这个场景以往是搜索引擎承接的,程序员在论坛等网站寻找一致或者接近的代码自己再测试调整,chatGPT在这个场景下的实用性已经非常高了,优于搜索引擎的体验。此外,由于chatGPT知识的结构性非常强,只要了解一些基础编程知识就可以让他拆解目标,按步骤逐步实现。所以一方面是降低编程的门槛,另外一方面提高编程的效率。


写小说:上下文理解非常强,大纲情节设计能力在,正文描述能力有但是文笔不够精美。下图和他一起写故事的时候他还能cue流程...他判定大纲基本确定了,催我细化剧情...

逻辑分析:非常擅长,我用GMAT逻辑题测试问他,中低难度80%正确率,而且每个选项解释都很到位,知其然知其所以然,高难度50%正确率,错误的题说不出推理过程,确实就是没理解(还好没有到100%)。


看一下chatGPT的解释,是真的每一句话都非常有逻辑而且说出了潜在的逻辑...关键是1秒就做出来了包括过程,人类平均1分40秒...


情感陪伴:有情绪的分析能力,聊天中自然情绪的流露会有回应,但是直接问是否有情感能力会否认。



文书内容:基础的修改能力在,互联网黑话也擅长,可以写周报,邮件,感谢信,翻译,视频创作脚本,面试大纲等等。



产品设计/游戏设计:有逻辑框架,创意的部分多试试可能会有惊喜,比如下图新颖的三消游戏chatGPT推荐可以尝试三消+卡牌的组合。


信息收集整理/数据分析:刚才提到的这些都是未联网状态,实际上chatGPT是有访问网页并处理的能力的,只是被限制了,破解情况下可以实现更多能力,比如信息收集整理,数据分析,这部分的场景也可能产生对搜索引擎的替代,现在主要问题是信息真实性难以保证,很可能出现一本正经的胡说八道,所以只要让他给出引用地址,确认效率就高很多。


历史信息和刚才提到的客观时间信息收集类似,是有标准答案,绝对答案的。不只是纯逻辑的内容。所以这部分的数据根据相关性分析推测的,哪怕推测准确度是90%,剩下的10%放进信息中也会导致结果不可信,剩下的10%如果想要准确率上去,会需要更长的反馈矫正,数据必须精准标注了才能调整。

直观感受一下一本正经的胡说八道。让他写个南派三叔风格的故事,确实写了一个但是风格不对,让他解释哪里体验南派三叔的风格,他竟然一本正经地回答了,只是说的没有一句对的。

传统的人工智障是答非所问,一看就知道是假的。但是由于现在chatGPT有了模拟人类的逻辑能力,所以会听起来“头头是道”,这种情况其实更可怕,因为可能会以假乱真,就像当初有人在维基百科虚构了数百年的俄罗斯历史,现在ai已经完全具备这个能力了。

数学能力差是因为没有直接进行符号运算的训练,所以也是一本正经的胡说八道,但是这个本来就是计算机的基础能力,想要加上,或者在现在的对话中让他编程计算软件进行计算都是可以的。

诗歌创造我没放进来是因为此前的NLP就已经实现的很好了,诗歌本身就是天马行空也没有标准答案,几年前小冰就可以实现上传照片根据照片写诗了,这个是小冰根据我画的一幅画写的诗:


2.chatGPT震撼在哪
我们先来看一下下面的图,是近期我和chatGPT以及小冰、百度Plato问相同问题的对比:



注:各家训练目标不完全一致,这么对比不太公平,这里只是做一个简单参考,让大家对chatGPT有个直观感受。

和此前2C的多轮对话NLP产品对比,
震撼于这三点:

(1)多轮对话的能力极强。context理解几乎没有问题,不仅完全不会前言不搭后语,还会推理潜在问题,一直记住之前问题,在后面的回复中跟踪回复。

这一点无论在代码还是写小说还是文本创作等任何有语境的环境,效果都是惊人的好。小说一直记住人设、背景、行动目标等等,异常丝滑。然后有试过让chatGPT给我一段在终端可执行的python代码,用来画玫瑰图。中途发现环境设置有问题,他给出了检查的方法,推理出和画图的gap,推荐了过程中的设置方法和路径。这些都不是单一的搜索查询的场景,而是有上下文语境的场景,也更符合我们真实会遇到的场景。

(2)Formalization的程度非常高,简单来说就是知其然,知其所以然。
上文逻辑题的分析已经非常清楚了,他能推断出竞争者的策略会影响公司的销售份额,这对人类来说很自然,但是对机器来说需要在一大段的内容中找到两者潜在关联性,然后准确判断影响,这非常不容易,但是目前看起来chatGPT已经做的非常好了,完全能够还原出完整的推理过程。

(3)回答问题的表现,在代码、文书、小说创作甚至情感分析等都有非常出色的回应。

完成任务的前提是理解问题,分析问题, 最后才是回答问题/执行任务。第一点是理解问题的能力,是在上下文语境中听懂问题。第二点是分析问题的能力,有模拟人类的推理思考过程,第三点才是最终回答问题的结果。几个能力相叠加,真正实现了从人工智障到了人工智能的跨越。

那到底怎么突然间就从人工智障到了人工智能了呢,需要先理解一下AI是如何工作的。

3.AI是如何工作的
AI的三大生产要素:算力、算法和数据。

AI模型发挥作用有两步:

1.训练模型:有基础的算法,用大量的数据进行训练,反馈迭代

2.应用模型:在适合的场景下,输入信息,运行模型,输出结果

(1)算力水平:随着芯片行业的摩尔定律,计算机算力已经最早的每秒预算五千次到一台顶配的笔记本电脑,每秒两亿五千万次到三亿五千万次。企业级的更是飞速发展,chat-GPT背后也有微软Azure的支持。

(2)有了算力的基础支持,算法层面一直也在快速迭代,可以理解成解题方法,有不同的路径,例如图像生产从GAN到diffusion model等,更高效率更好效果的算法在行业被实践和迭代。

(3)数据,不只是数量的问题,更重要的质量,也就是有效数据量,是机器可以学习进行迭代的数据。

4.chatGPT如何实现的重大突破
在传统的训练方法中,都需要标注的数据,AI可以知道什么是正确的结果然后返回调整,坏处是效率比较低。有明确答案的数据标注难度低,比如分辨猫狗,或者结果类似于棋盘位置这样的也是相对明确的,最后输出的就是棋盘坐标,需要在不同的坐标中选择一个最优的结果。NLP本身模拟人的对话,除了基础的客观信息获取,大多数情况下并没有标准的答案,有不同的可能性,标注难度比前面的都高,训练的有效数据就不足。


但是最近几年谷歌的BERT模型,openAI的GPT模型其实都做了这样一个突破:用了无标记数据进行训练。这样在无监督或者自监督的情况下可供训练的数据量一下就上升了,模型是参数量级也是百倍增长,但是无标记数据会有一个致命的问题,过度拟合,下图就是一个GPT-3的例子:


是不是熟悉的人工智障的感觉,这是因为只根据互联网数据进行训练,模型只能对内容相关性高的赋予更多的权重从而进行预测,他并没有真正理解指令的意图。moon landing和gravity、big bang theory经常出现在一起,就有了这样的回答。这也是为什么在过去几年虽然NLP一直有很大进展但是2C实际落地很难的原因。

chatGPT是基于GPT3做了调整,主要是加入了人类的反馈(RLHF)。此前instructGPT已经引入RLHF,效果显著优于传统GPT模型,这次进一步迭代出chatGPT。也就是在机器大量无标注数据学习之后,在这个基础之上用人类标注数据反馈,迭代到今天的chatGPT就实现了惊人的结果。考虑到GPT-3是20年5月推出的,到今天也就过来2年的时间,就已经实现了质的飞跃。下图是chatGPT对于这个问题的回答:


小结一下,两个重要的突破点,一个是使用了无标注数据,极大增加了可训练数据量,第二个是在前者基础上再加入人类反馈的调整,就有了今天的我们看到的chatGPT。

5.chatGPT开启真正的AGI时代

AGI需要与人进行自然的交流,理解人类的需求,再结合不同的能力完成需求。从这个角度上看,NLP可以说是在这么多人工智能不同领域能力前的那个1,没有NLP再多的0也无法迈进AGI的时代。所以chatGPT今天的表现,是真正打开了AGI时代的序幕。


当然了,不同的场景下对能力组合的要求不同,离最终形态的AGI还有距离,但是我们已经可以开始解锁一些细分场景的丝滑体验了。



二、后chatGPT时代展望分成两个部分,一部分是底层大模型基础设施,一部分是应用生态

1、大模型基础设施趋势判断

先说核心结论:

1、多模型逐步融合,或有人机交互新入口主攻不同技能的模型融合是必然的趋势。

文字和语音的转换已经非常成熟,所有今天和chatGPT文字交互的内容,完全可以语音随时随地输入(类似现在的siri换一个更智能的大脑),他也反馈文字或者语音。从文字到图片最近一年也有质的飞跃,还有音乐的创作等等。所以输入的角度可以是语音、文字、图片等,输出也可以是语音、文字、图片等,未来算力成本进一步下降还可能解锁视频的形态。NLP能力解锁之后,相当于机器人的大脑已经有了,这时候可能会在现有硬件层面多一个交互入口(类搜索引擎),也可能结合实体机器人实现物理世界的一些功能。

2、大模型不会被openAI一家垄断,但是会有寡头

虽然chatGPT目前能力惊人,但是从上文的分析可以看出chatGPT是在RLHF这块走在前面一些,谷歌的BERT如果加入更多人类反馈的调整,也是有可能会出旗鼓相当的NLP产品。但是考虑到巨头已经在行业积累时间非常长,而且前期投入大,再加上有用户量之后数据反馈多进而更智能产生飞轮效应,所以创业企业想做底层模型胜出的概率很低了。

3、国内会有也必须有自己的大模型

无论是出于数据安全还是地缘政治还是审核等维度考虑,国内必须有自己的大模型。各家巨头此前就有推出不同的大模型产品,比如百度文心,但是在多轮对话的NLP上还是远不如chatGPT。参考此前其他算法的发展情况,行业学习的速度都很快,所以对国内的大模型还是要有信心,期待各家最终的产品。

2、应用生态潜在机会可能性

通常来说,细分场景需要根据大模型二次开发,因为会有特定场景的数据和特征,所以基于底层模型也会有很多的生态可能性。例如国外一款叫replika的产品就是基于更早的GPT模型开发的虚拟人社交产品,用到了GPT的情绪分析能力,给当中的虚拟人做了单独的训练,能够提供很高的情绪价值,只是之前的智能程度还不够。

从场景来说一些可能性:

(1)2C虚拟人的任何场景,包括虚拟人社交产品(replika升级智能版),游戏角色(智能NPC)应用等等。NLP是虚拟人的大脑,也是最“灵魂”的部分,有了这个能力不同的场景都可以解锁,例如将来虚拟人直播就可以不用中之人。

(2)AIGC内容生产的相关场景,多模型融合之后会有更多可能性。

(3)办公效率提升场景:邮件撰写,面试提纲,会议摘要,拍摄脚本撰写,访谈提纲。

(4)效率提升工具:写代码,写小说,资料收集,数据分析。

(5)智能客服升级。
因为AI极大提升了效率,很多岗位未来需求量一定会逐步减少,容易结构化的工作,简单重复的工作,基础的信息收集分析等都是效率最先被提升的地方。与此同时,所谓的创造性工作,目前看起来AI做的没有想象中的差。

但是绝对无法替代的是人与人的交流。所以如果你是行业的创业者寻求融资或交流,或者希望寻找这个方向创业的机会,或者仅仅是想对这篇文章表达赞同/批判的观点,非常欢迎通过后台联系我。


附:为什么需要关注AI

革命性的技术变革往往带来巨大的机遇和挑战。人类社会历经原始社会、农业社会、工业社会以及信息技术社会的变革,每一次变革间隔的时间越来越短,产生的影响也越来越大。

技术的变化总是指数级的,在拐点到来之前,无论鼓吹者如何吹捧,新技术还不能带来显著的变化,也因此在爆发之前,人们总是会低估潜在的影响。而过了拐点之后,无论怀疑者如何质疑,反对者如何抗拒,他们都会迅速吞噬各行各业。

有的变化是海平面级别的,有的是海浪级别的,海平面级别的变化是行业基础设施的变化,会影响很多的行业,头部能出千亿美金甚至万亿美金的企业,例如历史上的PC互联网,移动互联网,海浪级别的变化更多,会有很多百亿美金级别的企业。

因此找到重要的技术变量,并且跟踪判断拐点就尤为重要。在当今的信息技术社会中,我们正在经历两个革命性要素的剧烈变化,一个是crypto,一个是AI,分别对应生产关系和生产力的变革。

AI是重要的信息技术科技变革,其结果是生产力的巨幅提升,AI发展的最高境界就是AGI通用人工智能,可以模拟人实现不同场景下复杂任务的完成。AGI时代的到来,可以使得人们以最便捷的方式和AI交互并得到期待的结果。而chatGPT的推出,正是AGI序幕拉开的信号。


Hello!
我们在为更加闭环、更加高效的服务模式做准备
欢迎加入限定白名单
与我们一起探索








您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存