中国的大模型机会在何处?
致力于人工智能,并确保它的未来很美好
2016年9月,现今OpenAI CEO、ChatGPT之父,时任创投公司Y Combinator总裁Sam Altman,在特斯拉加州弗里蒙特工厂采访了埃隆·马斯克。马斯克当时很有远见地表示,“人工智能,致力于人工智能,并确保它的未来很美好,这是我认为目前最重要、最紧迫的事情。”
七年后,人工智能热潮席卷全球。
3月14日,OpenAI推出ChatGPT,随后进场玩家也越来越多,微软推出Copilot让全球10亿打工人为之感到振奋,Midjourney解决了AI不会画手的bug……基于大模型的AIGC类产品层出不穷,正不断颠覆着人们对于“效率”想象的上限,为人类的生产与生活带来巨大变革。
但受限于大模型成本投入、研发路径不同、中文数据质量等原因,中外大模型存在着一定差距,中国的大模型机会在何处?
AIGC赛道即将迎来大爆发
OpenAI掀起的这场AI狂潮,为酣睡了许久的互联网行业注入了新的能量,中外互联网科技企业的热情迅速被点燃。国内,百度率先跟进推出文心一言,阿里云通义千问大模型进入内测阶段,华为盘古系列AI大模型也即将上线,3月底的博鳌亚洲论坛上,腾讯集团披露正在研发AIGC以及大模型相关技术,类ChatGPT的对话机器人也在酝酿中。
不光大厂,还有资本和行业大佬。
一个月前,美团联合创始人王慧文在朋友圈发“英雄帖”,出资5000万美元,要创立新公司打造中国版OpenAI。3月19日,创新工场董事长兼CEO李开复高调宣布,正在亲自筹组中文版ChatGPT公司“Project AI 2.0”。此外,阿里“框架大神”贾扬清、搜狗前任CEO王小川、京东曾经的AI掌门人周伯文都表明了同样的意愿,重燃创业野心下场入局,快马加鞭奔赴AIGC赛道。
资本端,据量子位报告显示,国内多家机构已高度明确要将AIGC作为主投赛道,个别头部机构已经推出了相应的主题孵化项目,预计本年度融资规模将有数倍增长。市场规模也在不断扩大,预计2030年我国AIGC市场规模将达到万亿级别。
“大厂入局”、“大佬下场”、“热钱进入”,可见AIGC赛道的火热程度。根据国内某信息查询软件显示,近三个月以来,将人工智能纳入经营范围的公司超过9万家,最近15天内新增企业2万多家,企业如雨后春笋般涌现。
中外大模型存在差距
ChatGPT席卷中文互联网的同时,国内用户也期待能有一款中国版的类ChatGPT产品出现。
资金雄厚、人才济济的大厂被寄予厚望。但赛道火热,产品不佳,是目前中国AIGC发展的现实写照。根本原因在于中外底层基座大模型存在着一定差距。
OpenAI之所以能率先成为AIGC领域的标杆,源于其坚实的底层技术积累。
早在2018年,OpenAI就发布了最初版本的GPT大模型,尽管被同年Google发布的BERT模型碾压,但OpenAI始终坚持GPT路线,2019年发布GPT-2,2020年发布GPT-3,GPT-3这个1750亿参数庞然巨物的出现,大家惊异地发现大模型开始具有类似人类一样的能力;随后OpenAI又发布GPT-3.5 ,今年3月14日ChatGPT诞生及紧随其后GPT-4,至此OpenAI已经从最初一个创业公司,终于成为AI领域的一方霸主。
不难发现,OpenAI花费了5年时间,执拗地专注于GPT路线,深耕生成式预训练模型技术,才有了今天让世人惊叹的产品。
反观国内大模型领域,尽管也早有布局,但工程技术的积累上始终是晚于国外大模型。中国最早的大模型诞生于2021年3月,由智源研究院发布的“悟道1.0”。OpenAI五年的GPT工程技术积累,让中国公司在追赶的时候必须越过一个巨大的鸿沟。
最现实问题是资金问题。以OpenAI使用了数万块英伟达A100进行海量数据训练和推理,如果以1万张英伟达A800 GPU为标准,仅GPU采购成本就超10亿美元。
昆仑万维CEO方汉也曾表示,“超过千亿级别的大模型,训练需要1000-2000张A100的卡,硬件成本约5000万美金,训练需要投入的人力、电力、网络支出等,一年至少5000万美金到1亿美金的投入”。这就意味着中国底座大模型的抢滩注定是少数玩家的游戏。
除此之外,中文文本数据量不高、AI顶尖人才短缺、英伟达芯片的“卡脖子”状态,无疑都为中国AIGC的发展制造了重重困难。
但中国2-3年内追赶OpenAI并非不可能。
首先,中国目前存量工程师数目大概有6000万,是全球最大的一个工程师国家,具备了坚实的人才基础;其次,费用的高昂会随着底层算法的优化,逐渐的降低训练成本;最后,虽然目前硬件上来说,受制于限售禁令,国内企业仍在不遗余力的制作本土的训练卡。后发者未必没有机会。
深入场景化应用先行
有人下场掘金,有人做掘金工具。
Sam Altman领导的OpenAI团队坚定不移地拥抱AGI信仰,要做的是探索AI能力的天花板,挑战自我。但对于全球很多初级玩家而言,尤其中国的互联网科技公司,切入AI赛道的策略并非就是要比肩OpenAI。
ChatGPT点燃了一团火,中国互联网公司在不断抱薪添柴,以期让AIGC在中国市场全面开花。但客观存在的差距意味着,中国AIGC的发展必须找到适合自己的独特化路径,才能先跟随、再超越。
在大模型的发展生态上,中外大模型技术和应用的优先级不同。国外是技术先行为底座再进一步推动应用层的发展,中国的大模型生态是应用发展先行。
美国市场,大模型生态机会形成基础层-中间层-应用层的明确分工。OpenAI的定位就是成为新的基础设施,做大模型平台。平台之上,中间层和应用层的公司来负责将技术抵达垂直场景。
例如,Notion、Salesforce等公司选择直接调用ChatGPT的能力服务用户。SaaS企业Jasper就是基于GPT-3开源的API,帮助企业和个人用户写营销文案和AI绘画。
但中国AIGC的发展,目前企业着力于基础层和应用层,缺少中间层的企业布局,整体层级不够完善。
▲AIGC产业链全景图,来源:量子位▲
中国创业公司认为,一边做大模型基础平台开发,一边直接瞄准垂直的行业场景落地,更适应中国的本土化AIGC的发展。比如,澜洲科技、衔远科技等中国AIGC创业公司就走的这一路线。
但这一路线,未必适用于大多数创业公司。创业公司资源是有限的,尤其是资金投入。
英伟达最新的H100,一张3.4万美元,超过20万人民币。做一个ChatGPT需要耗费3万张显卡,花费至少6亿元人民币。高算力、高成本即意味着AI 2.0时代创业的绝对高门槛,没有雄厚的资金支撑根本无法承担AI训练的费用。
因此对于国内的初创公司而言,从应用层切入,打透AIGC场景,能快速将AI生产力转化为商业价值,或许是一条具有现实意义的路。
百度创始人李彦宏也认为,“大模型时代,最大的创业机会在应用,”他的判断基于上一次的移动互联网变革,“操作系统其实没几个,最成功的是微信、抖音、淘宝这些应用。未来10年应用领域可能诞生10倍价值的机会。”
据量子位《中国AIGC产业全景报告发布》报告,至2030年,中国AIGC产业发展共分三个阶段:
整体均处于业务场景验证和变现探索期
底层大模型发展加速,中间层尚未出现相关玩家,基于Stable Diffusion等开源模型的上层应用迅速出现,但受底层大模型接口限制,大部分技术尚未达到稳定进入实际生产环节的水平;
2应用蓬勃期(2025-2027)基本价值创作路径和技术思路得到确认
行业普遍尝试应用人机共创,且内容资讯、娱乐传媒等领域利用AIGC产生确定性价值。这一时期,底层大模型和中间层模型主要玩家基本确定,开放API增加,整体入局玩家增多,尤其是大量应用层玩家;
3整体加速期(2028-2030)产业生态逐步完善
报告指出,2028年往后,AIGC在个性化、实时化、自主迭代等方向上的延展价值得到充分发挥,和其他业务系统进行紧密连接,会有相关初创公司产生完整解决方案。这一阶段AIGC成为内容领域基础设施,预计会催生出完全不同的新业态。
小体量垂直大模型更接地气
相较于AI 1.0时代,AI 2.0技术能兼容更多的场景和领域,不仅仅只是做一个大模型通用于各行各业,而更多的是在一个垂类场景下,用更低的成本实现更高的通用性和实用性。
就目前中国互联网实际发展情况而言,能ALL IN大模型的玩家少之又少,底层大模型的投入非常大,仅少数头部大厂有足够的资金、技术、人才储备。
单就算力规模来说,为了让ChatGPT更智能,微软的Azure为OpenAI建设了一个单独的超算中心,具有超过28.5万个CPU核心、1万个GPU和400 GB/s的GPU服务器网络传输带宽。而处理1800亿个参数的GPT-4大模型,需要的GPU芯片数量高达2万张。
在国内,云计算技术人士公认的一个说法是,1万枚英伟达A100芯片是做好AI大模型的算力门槛。
对于大多数的AIGC创业企业而言,与自有应用、生态结合的垂直大模型,才是更好的切入方向。
昆仑万维CEO方汉认为,并不是任何情况下都需要1000亿或者是10000亿参数的模型。在很多情况下,一个几十亿参数甚至一个几亿参数的小模型也能很好的完成工作。
金融是目前国内落地较早的场景。国内某创业AI公司已推出了多个大模型对外产品服务,目前已落地大模型、AIGC(智能创作)平台、机器翻译平台、金融NLP平台等多款技术及产品,落地同花顺、华夏基金等企业。
华泰证券认为,金融行业数字化程度领先,拥有数据富矿,有望成为AI大模型率先落地的垂直领域之一。在应用端,生成式和理解式大模型在银行、保险、资管、投研、投顾等多个细分领域正在落地或拥有潜在落地场景,帮助金融机构降本增效。
无独有偶,ChatGPT也是率先落地类似于摩根斯坦利,助力摩根斯坦利的金融咨询业务。
作为目前全球最火的自然语言大模型产品,ChatGPT至今不对中国用户开放,国产ChatGPT进入需求井喷期,中国互联网科技企业面临着巨大的机会,快速找到适应中国市场的发展路径,为中国本土用户定制化产品,尤为迫切的重要。与自有生态结合+垂直场景大模型,将是中国本土发展AIGC特色化路径。