中国版ChatGPT不是口嗨,百度“文心一言”后发先至
ChatGPT持续在刷屏。
不知道你发现没有,自这款聊天机器人发布的第一天起,有关生成式AI要革搜索引擎命的热议就没有被压下去过。
跳过网页浏览筛选这些步骤直接给你一个答案,ChatGPT的搜索结果更加准确有效率;开发人员Josh Kelly从自我感受角度呐喊Google is done;亿万富翁Chamath从盈利能力和参与度的角度,细数谷歌搜索为什么会慌神。
微软凌晨刚推出由ChatGPT支持的搜索引擎Bing必应与浏览器Edge,ChatGPT官方网站就因为访问拥挤而宕机。ChatGPT一夜蹿红引发全球科技狂欢,谷歌拉响警报求助“退休”元老,推出类ChatGPT竞争对手Bard打响保卫战。
全球最大的中文搜索引擎百度处境类似,作为国内唯一一家拥有全栈AI技术架构的公司,则迅速推出了足以代表国内选手出战的类ChatGPT项目“文心一言”。就国内目前而言,百度在NLP领域(GPT属于自然语言处理NLP范畴)的水平绝对拔尖。按李彦宏的期待,2023年的百度势必要进行“引领搜索体验的代际变革”。
巨头财经「产业观察」第41篇。
01
01
国内大厂争先发布类ChatGPT产品
多数保持观望态度
比尔·盖茨仰慕它,马斯克害怕它,法官用它做法庭裁决,总统用它发表公开致辞,看到敏感问题还会打太极……
ChatGPT就是这个时下最当红的炸子鸡,它一改以往的AI形象,在国内被追捧到了前所未有的高度。
凭借在NLP领域的出色表现和可扩展性,ChatGPT能够记住之前的交流内容并联系上下文语境进行互动。历经三代更迭,这款“会说人话”的机器人更加有人性。微软CEO认为这无异于要掀起一场全新的工业革命。
革命性技术引发无限性猜想。ChatGPT轻松拿捏住了资本和厂商。腾讯、阿里、华为接连公布了“人机对话”的相关专利。微软谷歌百度等科技巨头之外,国内也还有科大讯飞、商汤科技等人工智能企业正蓄势待发。
对此,网友们分为两派:一类人心存疑虑,抱着“看看再说”的观望态度。
另外一类人则直接表态不看好。他们认为,ChatGPT之前,国内大厂几乎处于缺席状态,去年11月ChatGPT发布时,国内大部分人其实都没什么反应,现在又都来做类ChatGPT的产品,明显是在蹭热点。
02
02
这是一门卡脖子的技术
也是一场中国不得不面对的战争
但其实,我们不妨从以下两个角度思考问题:
第一,宏观环境决定了国内企业很难演化出激进的路径。
ChatGPT概念股虽水涨船高,但真正能和ChatGPT这项技术搭上边的确很有限。
杀手级产品之所以没有首先诞生在中国,究其原因除了中国企业本身的局限性,还与中国的资本市场、商业和应用生态特殊性相关。
开创性产品本身具有很大的不确定性,巨额的资本投入与汉语复杂性之外,国内市场还缺乏培育和容纳创新人才氛围,更准确地说是缺少Paypal黑帮、SamAltman这样的企业家与群体引领长期主义文化。
宏观环境决定了国内企业很难演化出激进的路径。从这个角度上看,各大厂商稍慢一步,无可厚非。
其二,ChatGPT,是一场中国不得不面对的战争。
ChatGPT是门卡脖子技术,它的真正威力或许根本不是取缔搜索引擎,而是基于人工智能能力进行的自我创造。
这是一个必然趋势。互联网平台、移动互联网平台的内容生产模式,会从PGC(专家生产内容)、UGC(用户生产内容),过渡到AIGC(AI生产内容)。从这个角度出发,科技大厂的躬身入局不是蹭热点,而是一种必然的定性与鞭策。
收集ChatGPT“能记住之前的聊天内容”“能识别问题中存在的错误”“回答有用且有趣”等种种使用体验,是众多AI公司发展数十年却一直求而不得的成绩。尤其对搜索引擎平台而言,也许只有积极拥抱ChatGPT,才能让力量得到延伸。
03
03
百度官宣“文心一言”
反应最快、口号最响亮、排期最清晰
面对刀架脖子的情形,百度内部更多表现的是兴奋。
早在去年12月ChatGPT第一波关注时,百度创始人李彦宏就曾慷慨发言:“这很宏伟,很激动人心。但我们认为它是可实现的,因为技术已经到了临界点。类似ChatGPT这样的技术很火,如何用在搜索场景上,这是比技术本身更难探索的。未来一年,在这方面我们非常有机会。”
纵观“举棋”的国内大厂,百度的反应速度最快,排期最为清晰。百度成为公认的最有可能挑战OpenAI的企业。
早在2019年,百度就开始研发预训练模型,先后发布知识增强文心(ERNIE)系列模型。不到两年时间,百度更新了ERNIE 2.0、ERNIE 3.0英文模型,前者登顶国际权威排行榜GLUE榜首。后者则在国际权威的复杂语言理解任务评测中超越OpenAI 的 GPT-3 等大模型。
时间拉回去年,百度5月、11月先后两次更新升级了11个大模型,包括5个基础大模型、1个任务大模型、5个行业大模型。具体涉及文心大模型开发套件、文心 API、AI 作画产品“文心一格”和产业级搜索系统“文心百中”。
回归技术本质,中国ChatGPT会在大模型能力成熟的企业中诞生,对比几家巨头的经验值,也只有百度文心大模型在研发+应用“双链路”上做到多元通畅,为此我们有足够的理由相信百度能做出中国ChatGPT。
04
04
第一层
“搜索”是百度的“命”
主营业务天降技术buff,不扛起大旗都说不过去。从决心上讲百度没有丝毫回旋余地。应战既彰显信心又鞭策了团队,同时也体现出社会责任与担当。
从实际落地看,文心一言的相关功能已陆续在百度搜索内上线或内测,包括多答案回复、智能生成等。时至今日,百度规模化的AI大生产已然形成,AI深度学习从技术、生态、产业等多个维度逐渐成熟。
而外界讨论最多的“ChatGPT对于原有系统商业模式的冲击”更多是悬而未决。因为不同于谷歌约80%的高广告收入占比,百度广告营收占比仅为57.4%。根据数据,2022年Q3,百度核心收入为人民币 252 亿元,同比增长2%。其中,广告收入为人民币 187 亿元,相比第二季度增长 10%;非广告收入为人民币 65 亿元,同比增长 25%,主要受百度智能云及其他 AI 驱动业务的推动。
百度无需像谷歌那样对ChatGPT的爆红如临大敌。只要保持“充分利用类ChatGPT技术新升级,做搜索代际变革”的战略定力,生成式内容也会极大丰富内容生态和内容供给,足以让成熟的搜索业务焕发生机。
05
05
第二层
李彦宏是有足够战略定力的技术信仰者
谁能率先实现NLP自然语言处理的技术突破,谁就能在AI领域笑傲群雄。
众所周知,ChatGPT属于自然语言处理NLP的范畴,核心是处理文字信息,NLP被称为“人工智能皇冠上的明珠”,在信息大爆炸时代帮助人类大脑处理海量信息。
这是百度优势领域。
自诞生之时,NLP技术就成为搜索技术的重要组成部分。2010年初,百度重新梳理与规划了NLP的工作,成立百度自然语言处理部。到2019年3月,百度就凭借ERNIE的快速更新迭代获得国际认可。
2021也是取得巨大进展的一年,9月,百度发布PLATO-XL,成为全球首个百亿参数中英文对话预训练生成模型。12月,百度发布参数规模达到2600亿的文心,在60多项NLP任务中取得最好效果。
百度在人工智能领域深耕数十年,可以说,在NLP领域,百度已然登顶。目前国内没有一家公司目前水平接近百度。
李彦宏对ChatGPT的看法是非常乐观,他坦言:“ChatGPT是AI技术发展到一定阶段后的新机会。怎么把这么酷的技术,变成人人需要的产品,让每天有几亿人从中受益?怎么赋能千行百业,让他们的生产效率大幅度地提升?”
06
06
第三层
百度并非从零开始,而是有完整的技术储备
有效结合类ChatGPT技术和搜索市场优势是非常难的,也是最伟大、最能够产生影响力的。
百度要做中国的“OpenAI+Google”。它的底气来源在于人工智能技术芯片、框架、模型和应用四层架构各方面均有自研技术。类ChatGPT处在模型层,而百度从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,各个层面也都有关键自研技术。
这是其他国内厂商不具备的。百度文心系列大模型(如ERNIE Zeus基础大模型和plato对话大模型等)在行业已普遍应用,而能支撑该训练模型的框架,目前国内没有谁可以超越百度飞桨。
在深度学习框架领域,百度飞桨已超过谷歌 TensorFlow在国内市场排名第一。另外,从近几天中国用户对话ChatGPT的情况来看,OpenAI和ChatGPT对中文语言的学习和处理还未达到巅峰,百度对中文语言的理解具备天然的优势。
统计数据显示,自去年12月ChatGPT上线以来,其注册用户已超过1亿。但就目前国内而言,还是有很多用户无法注册ChatGPT。ChatGPT使用门槛相对较高,海外大模型的中文语义理解也有待加强。如果百度能做出中国的ChatGPT,这才意味着真正的全球狂欢。
07
07
巨头财经的思考
后发先至,实现应用层的持续创新
从0到100万用户,Netflix用了3.5 年,Twitter用了24 个月,而ChatGPT,只用了5 天;ChatGPT基于OpenAI的GPT3.5模型创建,相比4年的GPT1(1.17亿)、GPT2(15亿),GPT3参数已经有了指数级的增长达到1750亿。
更加强大的GPT4正在逼近,更长周期的技术竞争拉开帷幕。
历史经验证明,过往每一轮技术革命中,中国起初都未必领先,但最终都能创造出具有全球引领性的应用层创新成果。
相信,在这轮竞争中,中国依然能后发先至,实现应用层的持续创新!
01. 江南春,创投圈的李佳琦
02. 李学凌:敢和字节跳动宣战的男人
03. 大智慧黄峥,小聪明拼多多
04. 王兴的「理想」
05. 周鸿祎,愿你知天命后仍少年!
06. 刘强东的三个阳谋!
04. 吃了九年荷尔蒙红利 ,陌陌的第二春在哪里?
03. 联想B变:3S战略的沉淀期
今日头条 丨 百家号 丨 雪球 丨 新浪微博
搜狐号丨企鹅号 丨 快传号丨 招财号 丨 财富号
格隆汇 丨 澎湃新闻丨 亿邦动力 丨 凤凰网
创业邦 丨 凯迪网 丨 网易号 丨36kr