查看原文
其他

七月综述|GPT狂热结束之后

王杰夫 新皮层NewNewThing 2023-08-02

「人容易高估短期变化,低估长期影响,因此回顾变得必要」


撰文 | 王杰夫

编辑 | 吴洋洋

ChatGPT变笨了吗?

这个几个月以来不断在社交媒体上引发争论的话题终于等来了学术分析。来自斯坦福大学与加州大学伯克利分校的研究团队比较了GPT模型在3月和6月对同一问题的回答,发现6月的GPT解决数学问题、生成代码等方面的能力都有所下降。

对此的一种推测是严格的监管措施损害了大模型的输出质量。7月14日,美国联邦贸易委员会(FTC)向ChatGPT的所有者OpenAI发出了质询函,要求该公司对运营中是否存在不公平或欺骗行为作出回应。这是迄今为止AI技术公司在美国面临的最强监管。

对于模型训练和输出内容的各种「正确」要求会影响ChatGPT的表现——太听话的孩子都会显得缺乏创造力,更何况大语言模型(Large Language Models, LLMs)。不过从时间上看,4月至5月已经有用户反映GPT「变笨」,而当时OpenAI与美国政府还处于蜜月期,监管至少不是其性能下降的唯一原因。

另一种更合理的推测是OpenAI主动降低了GPT的性能。OpenAI首席执行官山姆·奥特曼(Sam Altman)在6月初就说过,为大模型提供算力的GPU极度短缺,「少一些人使用ChatGPT会更好」。而方正证券刚刚发布的《OpenAI的盈亏分析》报告就提供了佐证:如果GPT-3.5的精度下降为原来的95.7%,成本大约下降25%。当然,OpenAI对主动降低性能的猜测矢口否认,只表示会进一步研究GPT可能变笨的原因。

作为开启AI新纪元的产品,ChatGPT的变化或多或少也反映着智能领域发生的改变——人工智能与大众的蜜月期已经结束了。政府不会再睁一只眼闭一只眼地任由AI技术公司野蛮生长,新鲜感退去的消费者也开始用挑剔的眼光来判断它是否值得占用一笔额外支出。

而监管与算力紧缺,这两大导致ChatGPT变笨的难题,也在影响着每一家AI技术公司。


监管与算力难题持续存在

从监管上看,在意识到生成式AI的潜力后,全球都加快推出了法律法规。这对于创业公司的影响要远大于对技术巨头,毕竟有着资金优势和先发优势的技术巨头能够更好地消化上涨的合规成本。

7月21日,白宫宣布,政府已经与7家AI技术公司达成自愿协议,这些公司承诺会「保持强有力的安全措施」。这7家公司分别是亚马逊、Google、Meta、Inflection、Anthropic、微软和OpenAI,它们要么本身是技术巨头,要么背后的主要投资人是技术巨头,大模型的「大」对应着大公司的「大」。

与美国政府优先选择和技术巨头达成自愿协议的方式不同,中国政府的监管更加积极主动。7月13日,网信办等七部门联合发布《生成式人工智能服务管理暂行办法》(以下简称《暂行办法》),要求技术公司为生成式AI算法备案,并保证AI生成的内容「透明」、「可靠」,不能是「虚假有害」的。生成式AI应该做什么、不能做什么,《暂行办法》基本把这个要求说清楚了,但依然没有提及开放生成式AI商业化的议题。

从另一大难题——算力紧缺的角度看,短期内它依然是套在AI技术公司头上的紧箍咒,不过长期来看,供需关系会回归平衡。

6月21日,英特尔宣布将分拆芯片制造业务。在过去三十多年里,英特尔一直奉行垂直整合策略,包揽了从芯片设计、制造到销售的所有工作。它拥有优秀的芯片制造能力,但只制造自己设计的芯片。

拆分后的英特尔芯片制造部门会将产能开放,这意味着除了台积电与三星电子,英伟达、AMD这样的芯片设计公司将迎来第三个具备制造高性能AI芯片能力的合作对象。不仅如此,英特尔与三星电子几乎同时公布了扩充产能的计划,长期来看,算力供给会越来越充裕。

英特尔打算拆分其芯片制造业务了然而对于中国公司来说,算力风险可能会是一个长期难题。6月底《华尔街日报》称,拜登政府考虑对出口中国的AI芯片实施更严格的限制措施:向中国客户直接出口芯片必须经审批通过;同时禁止以云服务的方式向中国AI公司提供算力。这两项措施如若实施,将几乎杜绝中国公司获取高性能算力的方法。

作为回应,7月3日,中国商务部、海关总署宣布,对镓、锗两种制造半导体最重要的材料实施出口管制,中国出口的镓锗目前占据全球镓锗出口量的80%。紧接着7月17日,美国半导体行业协会(SIA)在官网对美国可能采取的限制措施发表声明称,「白宫反复采取过于广泛、模糊不清、有时是单方面的限制措施,可能会削弱美国半导体行业的竞争力,破坏供应链,引发重大市场不确定性。」


商业模式初探

既不确定政策何时允许生成式AI开放商用,又面临着芯片供应随时可能中断,但中国技术公司在两难中并没有停下脚步。在7月8日结束的2023世界人工智能大会(WAIC)上,阿里巴巴、华为、腾讯、百度等大公司都设台展示了它们的「大模型」,总计超过30款。

在上海世博中心的会场里,几乎每家公司都在强调自家模型可以服务不同行业的企业客户,最常听到的词是金融、传媒、政府、零售等等,但很少听到哪家公司谈及如何让大模型服务个人用户。

上海举办的世界人工智能大会(WAIC2023)

要让个人用户买单很难,至少ChatGPT的情况是这样的。App分析平台data.ai的数据显示,ChatGPT iOS版App上线后第一个月,每日新增付费用户只有1500人左右(20美元/月),月活付费率(月付费用户数÷月活跃用户数)约1.6%。相比之下,Spotify、Slack、Evernote 3款产品的付费率分别为46%、30%、4%。即使考虑到部分用户选择通过网页渠道付费而未被计入该统计,ChatGPT的数字依然不算乐观。

不过,作为全球最大的企业软件公司,微软在销售生成式AI产品方面看上去很有信心。7月18日,微软在Inspire大会上宣布,公司将优先为企业客户提供Microsoft 365 Copilot服务,定价为每月30美元。这个价格昂贵得超出大部分人的预料,要知道相较于Microsoft 365(曾用名Office 365,包含Word、Excel、PowerPoint、Outlook、Teams等办公软件)商业标准版每月12.5美元的价格,含有Copilot(生成式AI助手)功能的完全体总价接近原先的3倍。

不过对于企业来说,Copilot哪怕只提高个位数的效率都是划算的,毕竟雇用一个月薪2万元员工的开销足以买100套生成式AI助手。微软在宣布定价一周前与毕马威(KPMG)达成了一项协议,毕马威将在未来5年花费总共20亿美元采购微软的人工智能与云计算服务,这家会计师事务所预期这笔投资将创造120亿美元的回报。按照其2022年的营收测算,相当于这批「AI员工」要承担每年7%的新增业绩。

相比于微软在生成式AI商业化上的一系列进展,OpenAI的商业化却困难连连,不仅付费率不乐观,用户数也面临增长瓶颈。数据统计网站Similarweb称,ChatGPT的网站访问量和应用软件下载次数在6月首次出现下降。


硅谷技术巨头觉醒

随着双方关系逐渐发生微妙变化,微软与OpenAI的蜜月期也将结束。

OpenAI首席执行官山姆·奥特曼多次提到ChatGPT要做「超级助手」,这无疑让人联想到微软反复宣传的概念「Copilot」——智能副驾,其实就是超级助手的另一种说法。并且OpenAI说到做到,继6月推出「函数调用」功能后,7月它又推出了「自定义指令」功能。前者让ChatGPT能够连接到模型以外的软件或数据,从而在回答特定问题时给出更准确的答案;后者让用户控制ChatGPT回复内容的风格,提升了个性化能力。

微软自然也不会把鸡蛋全放在OpenAI这一个篮子里。在7月18日的Inspire大会上,微软还宣布了与Meta的合作,将其开发的Llama 2新模型添加进Azure云服务的AI模型目录中,为想要调用大模型的客户提供GPT之外的另一种选择。Llama 2是Meta开发的第二代大语言模型,Meta称其性能只略微逊色于GPT-4与PaLM 2(它们分别是OpenAI与Google最先进的大模型),关键是这款模型可免费商用。

除了貌合神离的老面孔,智能领域7月也有重量级新玩家入场。

7月12日,马斯克宣布成立一家新的人工智能公司——xAI。他召集了一群有数学背景的人工智能科学家,立志要做一个帮助人类破解数学、物理学等学科复杂问题的通用人工智能。马斯克表示团队会保持着一个较小的规模,更接近是一个研究机构。

马斯克组建的人工智能公司xAI7月19日,彭博社报道称,苹果2022年起就在秘密研发聊天机器人AppleGPT,团队管理者直接向CEO库克汇报。等到苹果真正推出这款应用,在iPhone里陪伴用户多年但只会预报天气的Siri将成为名副其实的智能助理。

蜜月期里,即使ChatGPT回复笨答案,用户依然会盲目喜欢它。但蜜月期结束后,一切逐渐回归基本的商业逻辑,AI技术公司需要游走在政府、用户、竞争对手与合作伙伴之间寻找各方利益的平衡点。没有什么关系是牢不可破的,哪怕是微软与OpenAI。

以下是2023年7月人工智能领域在监管、模型与芯片等方面重要进展的新闻详情。


监管篇


01. 国内监管的一只靴子落地:

《生成式人工智能服务管理暂行办法》发布

7月13日,国家网信办、国家发改委、教育部、科技部、工信部、公安部与广电总局等七部门联合发布《生成式人工智能服务管理暂行办法》(以下简称《暂行办法》),首次对生成式AI的研发及服务作出明确规定。相较于4月的《生成式人工智能服务管理办法(征求意见稿)》,正式版《暂行办法》首次明确了对生成式AI监管的辩证原则,要求「发展和安全并重、促进创新和依法治理相结合」,以及实行「包容审慎和分类分级监管」。该《暂行办法》将于8月15日起施行。


02. 美国联邦贸易委员会:

首次正式调查OpenAI

7月14日,美国联邦贸易委员会(FTC)向OpenAI发出了一份长达20页的质询函,提出了包括模型训练、隐私和提示词风险、API插件、个人信息等在内的49个问题,囊括200多个小问题。这是美国监管机构首次正式发起对生成式AI潜在风险的审查,也是OpenAI面对的首次调查,而就在5月,山姆·奥特曼还曾在参议院听证会上就AI与隐私、监管的关系侃侃而谈。彼时参议员们提出的问题大多并不尖锐,更多时候是向奥特曼请教人工智能技术,征询对类似ChatGPT这样的人工智能的管理方法的意见。


03. 拜登政府:

与7家技术巨头建立「AI开发共识」

7月21日,白宫宣布政府已与7家生成式AI公司达成自愿协议,以制定旨在确保该技术安全开发的指导方针。这些公司承诺会在人工智能技术开发过程中履行「安全、保障和信任」三项基本原则,并采取多项措施保障AI安全,包括发布产品前先做内外部安全测试、开发水印(watermark)系统帮助用户识别AI生成内容,降低欺诈和误导风险。据称,OpenAI还特别起草了一份内部政策备忘录,内容显示该公司支持「要求任何想要开发人工智能系统的机构需要先获得政府许可」的想法,公司CEO奥特曼5月在参议院听证会上也曾表达过类似观点。


模型篇


04. 马斯克又成立一家公司xAI:

要做通用人工智能

7月12日,马斯克在Twitter上宣布,正式创立人工智能公司xAI。在马斯克眼里,xAI是一家人工智能公司,但又不只局限于人工智能,而是拥有一个更宏大的目标——「理解宇宙」。这是马斯克继2002年的航空公司SpaceX、2003年的新能源汽车公司特斯拉、2016年的脑机接口公司Neuralink之后,创立的又一家新公司。他表示,xAI将会与他拥有的另外两家公司Twitter和特斯拉深度合作,利用前者的高质量内容与后者的算力来训练模型。马斯克曾在4月批评ChatGPT等大模型给公众制造谎言,他认为构建AI时不能考虑政治正确,因为必须允许人工智能说出它真正相信的事实,即使会引来批评,但这是追求真理以及确保AI不会威胁人类的唯一途径。


05. 微软为Microsoft 365的生成式AI定价:每人每月30美元

7月19日,微软公布了Microsoft 365 Copilot——一款专门为Microsoft 365用名「Office 365」,包括Word、Excel设计的生成式AI助手——的定价和推出方式,该产品基于OpenAI最先进的模型GPT-4。微软为该产品定价每人每月30美元,并且暂时只卖给企业客户。不少人认为价格偏贵,同为微软旗下的AI编程助手GitHub Copilot每月仅收费19美元,高级版ChatGPT每月也不过20美元。不过会后微软股价上涨近4%,反映出资本市场对于微软办公套件的吸引力充满信心。


06. 苹果入场:

AppleGPT已在内部测试

彭博社7月19日报道,苹果公司已创建一个名为「Ajax」的人工智能框架。该框架创立于2022年,目标是将苹果在机器学习方面的开发统一起来。该系统架构在Google云的机器学习框架Google JAX上(这可能是“Ajax”这一怪异名字的来源)。苹果已基于「Ajax」新框架改进了搜索、Siri、地图等多款产品,并基于该框架开发了类ChatGPT的聊天机器人AppleGPT。苹果计划在明年举行一个与人工智能相关的重大发布会,届时有可能发布这款慢了对手一年多的产品。


芯片篇

07. 英特尔:

计划分拆芯片制造业务
据路透社6月21日报道,芯片巨头英特尔宣布组织架构重组,旗下制造业务将在未来独立运作并自负盈亏。分拆有助于英特尔更专注于芯片设计,分拆后,根据英特尔CFO大卫·津斯纳(David Zinsner)在投资者电话会议上的说法,英特尔从事芯片设计的部门将与制造业务部门建立「客户-供应商」的关系。基于这种新模式,英特尔明年将成为全球第二大晶圆代工厂,制造收入将超过200亿美元(台积电的销售目标为850亿美元)。但是英特尔没有给出具体的执行时间表,消息发布后,英特尔股价收跌6%,创1月以来的最大单日跌幅。


08. 拜登政府:

准备升级对华AI芯片限制

据《华尔街日报》6月27日报道,拜登政府正在考虑对出口中国的AI芯片实施新的限制。美国商务部可能会叫停英伟达等芯片制造企业向中国等国家的客户直接出口芯片,此类出口必须经审批通过。此外,美国政府还在考虑限制向中国人工智能公司提供云服务,美国政府希望通过这种方式杜绝对于芯片出口禁令的规避。

不过美国芯片公司对此限制表示反对。7月15日,美国三大芯片巨头——英特尔、高通、英伟达的高管共同前往华盛顿游说,反对拜登政府扩大对中国出售某些芯片和半导体制造设备的限制。两天后,美国半导体行业协会也呼吁不要再升级对华芯片销售的限制,因限制会「扰乱供应链,造成重大市场不确定性,并促使中国持续升级报复行动”」


-END-


我们是一个诞生于GPT浪潮、由《第一财经》YiMagazine孵化的全新内容IP。

和每一位关心技术、关注人类命运的读者一样,我们希望在这个充满不确定性的时代,更好地理解快速变化的科技世界,也更好地理解生而为「高级智能」的我们自己。

在这个目标下,我们计划从学术、商业、伦理、监管等多个角度报道和讨论与“智能”相关的议题。请注意,我们说的智能,不只是 AI。



若想了解更多月度综述资讯,请点击阅读往期:

六月综述|大模型的中期战事


与记者交流,可添加微信(请备注公司名称和姓名):

王杰夫 微信号: wjfsty

张司钰 微信号: helianthus351

吴洋洋 微信号: qitianjiuye


再次,喜欢就关注我们吧,记得「设为星标

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存