查看原文
其他

始自 ChatGPT,迈向AGI:于《四川日报:川观智库》问计高质量发展及包含 GPT-4的内容补充

走向未来 走向未来 2023-08-31

在《川观智库》的圆桌上和聂再清(清华大学国强教授、智能产业研究院(AIR)首席研究员)、陈云伟(中国科学院成都文献情报中心创新研究部主任、研究员)、曹晟(电子科技大学教授、四川省数字经济研究院执行院长)、周强(电子科技大学基础与前沿研究院教授)、张志安(复旦大学新闻学院教授)、刘俊明(中国科学院大学计算机专业副教授、中科院沈阳计算所副研究员)、陶芳波(人工智能公司心识宇宙CEO、前Facebook高级研究科学家)等几位老师一起探讨了关于ChatGPT和通用人工智能的话题。是“两会”“问计高质量发展”的一部分。

本文是 《迈向以人为本的通用人工智能时代》系列文章的一部分:

  1. 武林至尊,ChatGPT;Bard 不出,谁与争锋?且看人工智能江湖的倚天屠龙记

  2. ChatGPT所到之处硝烟弥漫,一文看遍各行业对ChatGPT的专业评估——且看AI江湖谁是屠龙刀下冤魂?

  3. ChatGPT是如何铸就的?且看屠龙刀ChatGPT现身AI江湖的故事

  4. 大语言模型LLMs技术精粹总纲:重剑无锋,大巧不工——且看AI江湖刀剑争锋的源流

  5. 大语言模型LLMs技术精粹,Transformer模型架构全解析:三生万物——且看AI江湖基石

  6. 大语言模型LLMs技术精粹,稀疏变换器网络全解析:变则通,通则久——且看AI江湖基石

  7. 大语言模型LLMs技术精粹,GPT-1架构全解析:九层之台起于累土——且看AI江湖之起高楼


         

1. 如何全面认识ChatGPT? 

 

川观智库:ChatGPT如此火爆,所谓“外行看热闹,内行看门道”,那么业内如何看待它的效果和能力呢?

王文广:我也听一些在硅谷的朋友说,OpenAI也没想到ChatGPT的效果这么惊艳。它能像人类那样真正理解语言,这给业内人士和大众带来的震撼差不多大。从“真实性”“正确性”来说,它的回答未必是对的,但从“语言”本身来看,它的回答是“合理”的,不会让人吐槽“人工智障”。

补充

  1. ChatGPT 是基于text-divinci-003做出来的聊天机器人。OpenAI 在13天内开发了一个ChatGPT ,并匆忙推出的。其核心目的是要赶在竞争对手( 应该是Anthropic 的Claude,这是一家前 OpenAI 高管创立的公司)之前推出。这样能够抢占他们的先机,并帮助收集反馈以改进新模型。当时 OpenAI 已经完成了 GPT-4的预训练,正在有监督微调和RLHF训练优化模型中,为3月15日推出的做准备。

  2. ChatGPT收集到的反馈提升了 GPT-4的效果,同时也是的推出时间略有推迟。

  3. 短短13天能够基于text-divinci-003就开发出 ChatGPT,一方面说明了OpenAI 的AI大工程基建以及工程师能力都相当强大。这不是一个实验产品,是要能够经得起亿级用户使用并体验相当良好的工业级产品。


    

川观智库:ChatGPT的技术基础是否是全新的?

王文广:围绕ChatGPT的各方面技术不是新东西,并且是公开的。谷歌2017年发表的一篇关于Transformer(一种用于语言理解的新型神经网络架构)的文章,奠定了包括今天ChatGPT所有技术的基础,

补充:

  1. 基础模型是2017年的变换器网络(Transformer),Google在2018年初使用了变换器网络的解码器来做摘要,同年年中, OpenAI 发布预训练模型 GPT-1。

    参考:

    1. 大语言模型LLMs技术精粹,Transformer模型架构全解析:三生万物——且看AI江湖基石 大语言模型LLMs技术精粹

    2. GPT-1架构全解析:九层之台起于累土——且看AI江湖之起高楼

    3. 大语言模型LLMs技术精粹,稀疏变换器网络全解析:变则通,通则久——且看AI江湖基石

  2. 预训练最早可以归到2013年 Google 发布的 Word2vec。2018年开始是预训练大模型的开端,这是由于2018年之前深度学习在语言理解和生成方面都表现的不算太优秀。2018年 BERT 的发布惊艳了当时的自然语言理解领域,自那时起,BERT 及其变种成为了 ChatGPT 之前普遍使用的预训练模型。参考:

    1. 学习ChatGPT和扩散模型Diffusion的基础架构Transformer,看完这些论文就够了

    2. 飞桨代码实例详解用BERT进行实体抽取【珠峰书 知识图谱 命名实体识别 NER】

  3. 基于人类反馈的强化学习 RLHF 是2017年OpenAI 和 Google (DeepMind)对强化学习的改进,此后 Google 和 OpenAI 分别探索了 RLHF 在语言模型上的应用。参考:

    1. 大语言模型LLMs技术精粹总纲:重剑无锋,大巧不工——且看AI江湖刀剑争锋的源流

  4. 4.情境学习(In-context Learning)在2020年的 GPT-3论文中披露,说明了通过少样本或零样本学习能够完成许多自然语言处理的任务。参考:

    1. ChatGPT是如何铸就的?且看屠龙刀ChatGPT现身AI江湖的故事

         

川观智库:ChatGPT有什么缺点?

王文广:ChatGPT有很强的逻辑能力,所以它不会给出一些很“智障”的回答。但也正是因为它可能会给你看起来逻辑正确,实际上是错误、失实的内容答案,就存在比较严重的风险。所以ChatGPT可以作为你熟知的领域内非常好用的效率工具,但不能把它当作你完全不懂的领域的知识来源。

补充

  1. 事实和推理是 ChatGPT 不擅长的,而语言本身则是 ChatGPT 最擅长的。

  2. 可以认为语言的通天塔已经完成,跨语言交流不再是障碍。

  3. 事实和推理,还有赖于符号主义人工智能,知识图谱(广义版)或许是最佳的方案。详情可参阅 LaMDA。当然,知识图谱或者应该改为知识人工智能,接起符号主义在新时代的一棒,继续发展,并和连接主义、行为主义完全融合。

  4. 通用人工智能AGI=神经网络大模型(连接主义) ⊕ 知识图谱(知识 AI,符号主义) ⊕ 强化学习(行为主义)



2. ChatGPT会否成为很多行业的“终结者”? 


川观智库:ChatGPT目前主要的应用情况如何?会让很多人失业吗?

王文广:ChatGPT被运用后,一种情况是替代基础的、雷同的、重复性的人力,比如游戏公司已经用它写脚本,而不再使用外包服务;一种情况是提升从业者的工作效率,比如做营销的人拿它来写文案,效率可能提升数倍。包括我自己,每天都用它写文案、写代码之类。我认为,ChatGPT能够提升几乎所有岗位的工作效率。


川观智库:ChatGPT强大的“文字功能”,是否会彻底改变相关行业?比如传媒业

王文广:ChatGPT的确能够做与语言有关的几乎一切事情,包括但不限于文本生成、自动摘要、问答、改写、情感分析、表格到文本和文本到表格、文本分类、机器翻译等,但这并不代表它会彻底改变所有行业。如前面说到的,我认为它更突出的表现是提升行业的效率。

补充

  1. GPT-4出来后,大家可以看的更清楚了,文字类的工作,包括传媒、市场营销、剧本创作等,极大部分都能够被“超大幅度”提升效率,这将带来两个影响,一方面是低端职位的消失,另一方面是基于 AI 的文创的繁荣,高端职位的井喷。

  2. 大量品牌商都已经开始使用了。比如Mattel 已将 AI 图像生成器 DALL-E 投入使用,让它为新的 Hot Wheels 玩具车提出创意。二手车销售商 CarMax 正在使用为流行的聊天机器人 ChatGPT 提供支持的相同“生成式”人工智能技术来 汇总数千条客户评论。与此同时,Snapchat 正在为其消息服务引入聊天机器人。杂货配送公司 Instacart 正在集成 ChatGPT 来回答客户的食品问题。可口可乐计划使用生成式 AI 来帮助创建新的营销内容。虽然该公司尚未详细说明其计划如何部署该技术,但此举反映出企业在利用许多员工和消费者已经在自己尝试的工具方面面临越来越大的压力。“我们必须接受风险,”可口可乐首席执行官 James Quincey 在最近的一段视频中表示,该视频宣布通过咨询公司贝恩领导的联盟与初创公司 OpenAI(DALL-E 和 ChatGPT 的制造商)建立合作伙伴关系。

         

川观智库:ChatGPT会带来更多的商业机会和就业机会吗?

王文广:ChatGPT一定会催生新的业态。时间倒退回工业革命之前或互联网时代之前,现今的很多职业也是没有的。未来会一样,大量基于AI衍生出的工种会出现。

补充

  1. 工业社会出现了极大量的职业都是农业社会所没有的,智能社会也一定会有极大量的职业是现在所没有的。

  2. 现在大部分人都处于同一个起跑线,积极拥抱 AGI,才会有更好的未来,不管是企业,还是个人!

         


3. 地方政府和企业如何抓住ChatGPT机遇? 


川观智库:业内普遍认为ChatGPT打开了通用人工智能的大门,地方政府可以做些什么?

王文广:我认为当前地方政府首先该做的是了解ChatGPT,“知己”且“知彼”。并且不是某个或者某些职能部门,而是所有部门、所有官员都应该搞懂弄清。然后再做产业扶持的相关工作。而政府也无需大包大揽,把重点放在基础科学和建设基础设施即可。

政府还需要做的关键事情是法律法规的制定,以规范类ChatGPT产品可能引起的科技伦理矛盾,引导趋利避害。

补充

  1. 最近听了许多直播和分享,许多直播和分享中的人对 ChatGPT 的基本技术和应用都不了解就开始大谈特谈,犯了大量的“事实性错误”,这和 ChatGPT“一本正经胡说八道”是类似的,并不好,而且会误导公众。

  2. 建议首先去了解 ChatGPT 以及 AGI。如果是人工智能领域的,建议直接优先阅读一手的论文和技术报告,然后再看二手的讨论获取灵感。如果不是人工智能领域的,建议咨询真正的专家,至少是阅读了相关的数十篇论文的。

         

川观智库:我们的企业应该做类ChatGPT的产品吗?大量的中小企业该从什么赛道切入去抢抓机遇?

王文广:在人工智能、互联网等领域,大量的中小公司、新公司没必要做类ChatGPT这样的大工程,因为其投入巨大,我认为短期内有能力成功的一定是大厂或巨头。中小公司和新公司要找属于自己的领域“占山为王”。占什么“山”?一种是依托大模型做垂直类的关联小模型;一种是依靠巨头的API,做配套应用。

补充

  1. 参考: ChatGPT所到之处硝烟弥漫,一文看遍各行业对ChatGPT的专业评估——且看AI江湖谁是屠龙刀下冤魂?

  2. 谨记:细分领域占山为王的,倒是存在较多可能

         

4. 为何是一家小公司做出了ChatGPT? 


王文广转述了OpenAI在其官网写到的一句话:“吾辈欲以人工智能为使,推动人类极致繁荣于宇宙之中”。他认为这句话很好地概括了OpenAI对事业的专注是研究,而不是一门计算投入产出比的生意。

“另外,公众容易对创业公司表现宽容,却对巨头公司更严苛。”王文广说,OpenAI像个孩子,完成一些事就值得赞扬。但是巨头公司,比如Google和Meta像个大人,一旦做错事受到的批评会更激烈。ChatGPT“一本正经胡说八道”的情况,若发生在巨头身上可能被骂得很惨。“Google内部一直有类似于ChatGPT的产品,我甚至觉得技术更优,能给出一个比ChatGPT更好的聊天机器人。但是Google的试错成本高得多,容易被束手束脚。”

补充

  1. 专注于追求理想

  2. 创新者窘境




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存