全球产业动态丨 ChatGPT引发中美在人工智能领域新竞争

Original GIG 广州粤港澳大湾区研究院 2023-11-08

收录于合集

广州粤港澳大湾区研究院（GIG）立足湾区，服务国家，面向未来。研究院由著名学者郑永年教授担任理事长。

▎图源：网络

导读

目前，ChatGPT已经成为用户增长速度最快的应用程序。在微软投资的Open AI推出火爆的ChatGPT后，谷歌也坐不住了，希望在当下火爆的生成式人工智能领域占据一席之地。2月4日，谷歌已向AI初创企业Anthropic投资约3亿美元，获得了Anthropic约10%的股份。Anthropic将用投资从谷歌的云计算部门购买大量计算资源并开发一款名为Claude的智能聊天机器人。

比尔·盖茨评价ChatGPT称，该人工智能技术出现的重大历史意义不亚于互联网和个人电脑的诞生。因此，以ChatGPT为代表的生成式人工智能领域成为了中美科技竞争的新战场。在美国的OpenAI和谷歌分别推出ChatGPT和Bard后，中国科技巨头百度也投入生成式人工智能市场，推出了大陆版ChatGPT的项目“文心一言”（ERNIE Bot），引发了中美新一轮科技竞赛。

谷歌Bard如何运作？
2月6日，谷歌发布了一款名为Bard的人工智能聊天机器人，以此与最近火爆全球的ChatGPT竞争。Bard与ChatGPT的主要区别在于，谷歌的服务将通过互联网获取所有数据。而在所有其他方面，二者运作相似。

Transformer模型是谷歌在2017年发布的开源神经网络架构，是LaMDA（Language Model for Dialogue Applications，对话应用软件的语言模型）的基础。LaMDA是谷歌在2021年公布的模型，能够分析人类的自然语言，并识别出其中包含的指令信息。有趣的是，Transformer还用于GPT-3的开发，而GPT-3是ChatGPT所基于的语言模型。Bard建立在谷歌现有的大型语言模型LaMDA之上，其响应非常像人类，以至于有谷歌工程师认为它是有知觉的。除了LaMDA之外，Bard还将使用来自互联网的所有数据来提供回复。

谷歌表示Bard将在未来几周内面向所有人开放。谷歌CEO桑达尔·皮查伊（Sandar Pichai）称Bard能将世界知识库与谷歌大型语言模型的力量、智慧和创造力结合起来。他强调，他希望谷歌的人工智能服务“大胆而负责任”，但没有详细说明如何阻止Bard分享有害或辱骂性内容，而这是ChatGPT广受诟病的一个原因。他说，Bard将与轻量级版本的LaMDA一起发布。这个版本LaMDA需要的计算能力小得多，可以让谷歌将面向群体扩大到更多的用户，从而得到更多的反馈。

谷歌宣布这一消息之前，人们普遍猜测微软向OpenAI投资数十亿美元后，会将人工智能聊天机器人ChatGPT引入其搜索引擎必应。微软计划在未来将ChatGPT的下一代版本GPT-4整合到旗下搜索引擎必应中，这给谷歌带来了不小压力。此版本的必应由专为搜索引擎量身定制的尖端OpenAI大语言模型提供支持。ChatGPT可以根据互联网上的信息以文本形式回答问题和执行请求。它可以生成演讲、歌曲、营销文案、新闻文章和学生论文。

人们正在使用谷歌搜索来提出比以前更微妙的问题。例如，过去关于钢琴的一个常见问题可能是它有多少键，现在更有可能是它是否比吉他更难学——这没有直接的事实答案。此时，人工智能可以提供帮助，它可以针对没有正确答案的问题进行独立主观的回答。专家认为，聊天机器人的最终目标在于互联网搜索——用一个明确的答案取代繁冗的网页链接。

生成式人工智能的困难

然而，谷歌这款实验性的人工智能聊天机器人并没有收到它期望的热烈反响，反而在产品的促销广告中出现了令人尴尬的事实错误。此前有报道称，其对有关NASA的詹姆斯韦伯太空望远镜的问题给出了错误的回答。投资者也对该公司就在产品中部署人工智能的计划所做的介绍感到失望。公司的股价也因此受到重创。谷歌母公司Alphabet的股价下跌超过7%，公司市值缩水1000亿美元。这还引起了公司员工的抨击，认为谷歌在Bard的发布上表现得很“急躁”“糟糕”且“不符合谷歌风格”。谷歌发言人表示，该错误凸显了严格测试过程的重要性，要求进行新一轮的测试，以确保Bard的回答达到质量、安全性和全面性的高标准。

许多专家认为人工智能聊天机器人仍处于早期开发阶段。苹果公司联合创始人史蒂夫·盖瑞·沃兹尼亚克（Stephen Gary Wozniak）和OpenAI联合创始人兼首席执行官山姆·奥尔特曼（Sam Altman）也表达了类似的担忧。人工智能模型仍处于早期阶段，暂时难以处理回答中的相关敏感性问题，因此人工智能行业正在为此苦苦挣扎。谷歌搜索引擎负责人也表示，人工智能聊天机器人可以在一种被称为“幻觉”的现象中生成错误但令人信服的答案。谷歌就是从这次教训中领会到了这个糟糕的事实。

百度文心一言即将上线

文心一言由基于百度提出的知识增强大模型（Ernie）扩展而成的一系列高级大模型构成，可以执行广泛的任务，包括语言理解、语言生成（ERNIE 3.0 Titan）以及根据文本生成图像（ERNIE-ViLG）等。与其他语言模型相比，文心一言能够将广泛的知识与海量数据相结合，从而产生非凡的理解与生成能力。此外，百度还设计了一个自我监督的对抗性损失和一个可控的语言建模损失，使ERNIE 3.0 Titan生成可信和可控的文本。

为了减少计算开销和碳排放，百度还为ERNIE 3.0 Titan提出了一个在线蒸馏框架，其中教师模型将同时教授学生和训练自己。ERNIE 3.0 Titan是迄今为止最大的中国密集预训模型。相关实验结果表明，ERNIE 3.0 Titan在68个NLP数据集上的性能已优于现阶段最先进的语言模型，包括ChatGPT所应用的GPT3.5模型。

早在2022年9月，百度CEO李彦宏判断AI发展在“技术层面和商业应用层面，都有方向性改变”。百度透露，文心一言将于2023年3月完成内部测试，并向大众开放，目前文心一言正在做上线前的冲刺。

中国的生成式人工智能追赶有难度不过，中国在生成式人工智能领域追赶美国有四大先天不足。

第一，国内的大模型研究没有一家公司能把数据和模型的飞轮完整转起来。往往是A公司训练了一个，B公司也训练了一个，打个广告就完了。这是中国赶超ChatGPT的难点。

第二，中国在算力领域遭遇美国的“卡脖子”。2022年8月底，全球GPU计算的两大龙头公司英伟达（NVIDIA）和超微（AMD）相继证实，其美国总部已收到美国政府通知,向中国区（含中国香港）所有客户停售高端GPU芯片。虽然最新公告显示，美国政府已授权英伟达和超微的GPU订单履行可延续到2023年9月1日，但缓刑不代表美方的心慈手软。美国政府已经瞄准了又一个对华“卡脖子”的领域：高端GPU。目前即使是国内头部公司，在算力上与谷歌等巨头也存在明显差距。

第三，中文互联网的数据质量与英文数据有较大差距。为了弥补这种明显的数据差距，中国公司还需要想办法，做中英文不同语言之间的数据互补。

第四，中国公司还缺乏像OpenAI公司的纯碎创新精神和长期主义。OpenAI和DeepMind可能是业界唯二的两家机构，无论在创新、投入、决心上，还是在顶尖人才储备上，都一如既往地坚持。成功背后是他们很多失败的尝试。相反，国内更倾向于在技术出现突破后，快速追随。

如需阅读本报告完整版，请付费购买。

往期智库报告链接：

全球战略性新兴产业动态简报 | 2022年第1期

全球战略性新兴产业动态简报 | 2022年第2期

全球战略性新兴产业动态简报 | 2022年第3期

全球战略性新兴产业动态简报 | 2022年第4期

全球战略性新兴产业动态简报 | 2022年第5期

全球战略性新兴产业动态简报 | 2022年第6期

全球战略性新兴产业动态简报 | 2022年第7期

全球战略性新兴产业动态简报 | 2022年第8期