OpenAI 何以掀翻 Google 布局多年的AI大棋?
首先,让我们回顾一下蕴含在这场旷日持久的AI暗战之下的关键技术时间线。
01
Google与OpenAI
LLM领域的发展时间线
从对ChatGPT技术路线的拆解追溯,及其论文中提供的技术点和示意图看,ChatGPT与 InstructGPT 核心思想一致。其关键能力来自几个方面:强大的基座模型能力(InstructGPT),高质量的真实数据,以及从用户标注中反馈学习(RLHF)等,以此一窥ChatGPT是如何一步步进化成目前的强大形态。
2017年,DeepMind最早提出了RLHF概念,这一后来解锁ChatGPT重要「涌现」能力的关键,它通过人工标注作为反馈,提升了强化学习在模拟机器人以及游戏上的表现效果。
同年6月,Google发布NLP领域的里程碑——Transformer,成为后来所有LLM的基础架构,也为GPT铺就了前提。
2018年6月,在Transformer问世不到一年的时间,OpenAI发布了只有解码器(decoder-only)的GPT生成式预训练模型,通过大数据集进行训练,并主张通过大规模、无监督预训练+有监督微调进行模型构建。
2018年10月,Google重磅推出著名的具有划时代意义的BERT,一个比GPT大四倍,拥有3.4亿参数的大模型,几乎在所有表现上碾压了GPT。而自带光环的BERT只有编码器,用一种「完形填空」的方法,其训练效果超过人类表现,宣告NLP范式的改变。
2019年2月,被碾压的OpenAI准备背水一战,此时一个重要的命题摆在面前,BERT的大火让是否坚持做生成式模型成为一种灵魂拷问,但OpenAI坚定自己的目标——AGI,孤勇直前地践行生成式,并加倍投入,提出有15亿参数的GPT-2,并没有特别新颖的架构,它只是基于Transformer的解码器,稍做修改。尽管最初OpenAI并不愿意发布它,因担心它可能被用来向社交网络发送假新闻。
2019年10月,Google发布了统一的模型框架——T5,基于编码解码器的T5(BERT只有编码,GPT只用解码),最大模型110亿参数并开放。兼容了BERT和GPT下游任务的T5,再次让Google风光无两。
2020年5月,卧薪尝胆的OpenAI,在生成式之路一往无前,发布了规模是GPT-2两个数量级的1750亿参数的GPT-3,在业内掀起AGI热浪,也拉响了巨头规模竞赛的号角。
2021年10月,Google推出FLAN(1370亿参数),并从此开始重新转向只有解码器的模型,还提出了ChatGPT用到的Instruction Tuning概念。
2022年1月,Google再推LaMDA(1370亿参数),展示了接近人类水平的对话质量以及在安全性和事实基础方面的显著改进,并称其可能具有「意识」。所有人在当时觉得Google已在LLM遥遥领先。
2022年3月,OpenAI发表经过「魔鬼调教」的InstructGPT(1750亿参数),提到采用Instruction Finetune和RLHF,比GPT-3更擅长与人类「沟通」,但并未引起大规模的关注。
2022年4月,Google发布基于「通用AI架构」的语言模型PaLM(5400亿参数),文中提到了那一神奇的「激发」ChatGPT逻辑能力的「思维链」。
2022年9月,DeepMind发表Sparrow(700亿),加入RLHF和Retrival,但反应平平。
2022年12月,OpenAI的ChatGPT席卷而来,是InstructGPT的兄弟模型,一经问世迅速引爆全球,堪称人类对AGI里程碑的一步。
2023年2月,Google发布基于LaMDA的Bard,正式对决ChatGPT。
02
功败垂成
Google错失的那些时间点
OpenAI时速下的远见和信念
从技术路径来看,OpenAI是实用至上的「拿来主义」。
没有知识分子的清高,没有孤勇黑马的桀骜,无论是Transformer、Instruction Tuning、还是RLHF和「思维链」,不因是别人发明的就避之不用,而是取其精华,默默在自己的大模型里埋首用功。
如果 Instruction Tuning 是关键,那Google和DeepMind在2021年10月发明了它以后,直到2022年12月都没有重视过。反观OpenAI只花了5个月就将其用到InstructGPT,坚实了ChatGPT的基础。
如果将「思维链」视为 ChatGPT 能解题的关键,当Google还将它用于象牙塔的「实验」时,ChatGPT已准备走向「产品化」。
犀利如箭的棋局背后是灵魂棋手的智慧,这也是OpenAI一切远见和信仰的真正来源。
2015年,几位满怀对AI革新信仰又才华横溢的年轻人,从成立一个「工程型的AI实验室」出发,到今天OpenAI成为变革AI的引领者。如果说ChatGPT讲述了一个「足够好的预测带来了你所梦想的一切」的故事,那么其灵魂人物的前瞻眼光和今天的OpenAI也完美注解了这一句。
历史的潮流奔涌向前,硅谷的创新土壤、互相竞逐的技术迭进、巨头的巨额注资,有万千人「守护」梦想的OpenAI走到历史的必然。
任何大卫击败歌利亚的故事,都值得我们思考。
OpenAI此局高踞上风,与微软的联姻也将让两者更强。如今棋布错峙的谷歌,无法再「按兵不动」了。紧急应战的Bard能否让Google重归尊位?
AIGC时代,几位科技巨头们之间的「棋局」激战正酣,一切还远未到握手言和的时刻。
群雄逐鹿,一切才刚刚开始。