Sora令人工智能再掀高潮，中国会错过第四次工业革命吗？

Original 小萌王汤山老王

2024-12-21

仅仅根据一段文字描述，便能瞬间生成60秒的视频，而且画面质感很高，效果接近实拍。前几天，继ChatGPT之后，Open AI公司又发布了堪称颠覆性的文生视频大模型--Sora。

(以上是OpenAI官网上根据文字描述做出的视频）

在许多人哀叹即将失业的同时，也不禁让人反思，我们连ChatGPT都还没追上，现在又来一个Sora。

第一次工业革命是以机械化为特征的蒸汽机时代，第二次工业革命是电气化和内燃机时代，第三次工业革命是信息技术和互联网，那么带来第四次工业革命的大概率便是数字化和人工智能。

前两次工业革命中国没有赶上，最后导致了“落后就要挨打”的耻辱近代史，好在20世纪下半页在全球化的浪潮下，我们赶上了信息技术革命，特别是21世纪初的互联网时代，叠加低人力成本下“世界工厂”的地位，才让我们稳居世界第二大经济体。

但是，在第四次人工智能革命面前，美国的OpenAI、谷歌、微软等这些头部企业的发展确实高出其他国家好几个身位，最直观的证据就是，这些企业每次发布的新产品，都足以用“震撼”二字来形容。

AI行业确实有很大的发展潜力，全世界各种大模型这么多，但领跑的企业实际上并不多，而且头部企业技术垄断效应非常明显。对于那些对“中国互联网领先全球无比自信”的人来说，AI的重大突破绝大部分发生在美国的这个事实，将中美在科技创新上的差距再一次摆上了台面。

与之对应的是另外一个问题，相比美国在AI领域的成就，中国到底缺少什么？

我看到许多人将原因归结于创新精神和制度等方面，对于这种正确的废话我也不能完全否认，但这些虚无缥缈的归因在我看来实际上就是把多因素的实际问题故意简单化。

股市不好怪制度，楼市下行怪制度，消费疲软怪制度，产能过剩怪制度，什么都怪制度。但在这背后，一定有一些具体的东西。在人工智能领域我们真正缺失的其实就是两样东西，第一是芯片，准确说是高性能集成电路；第二就是足够的数据。

无论ChatGPT和Sora的性能多么强大，作为软件的它们，总归要建立在硬件的地基之上的，没有集成电路这个硬件，巧妇也难为无米之炊。硬件性能不够的时候，软件也必然上不去。

而目前的高性能显卡只有英伟达能提供，美国又接连对中国禁售，这就注定了我们在某些前沿的大模型上面暂时只能望洋兴叹。

其实，贸易战后的这几年，中国集成电路产业的进步是比较快的，以手机芯片为例，2018贸易战刚发生的时候，国产手机里的芯片国产化率整体低于5%，只有在基带芯片领域海思和紫光展锐有一定的存在感，而且主要是在中低端机型上。

而基带芯片也只是手机芯片的一种，一部手机有十多块芯片，此外还有其他领域的芯片。整体的国产化市场占有率要从5%提升到50%或者60%实在太难了，也难怪贸易战刚开始的时候，许多人会极度悲观。但是在制裁发生后，资本嗅到了钱景，大量涌入半导体行业，因此才有了“特朗普才是中国半导体产业最大的功臣”一说。

2020年和2021年，半导体行业的融资额度都在千亿以上，正所谓力大砖飞，在资本的加持下，芯片国产化率大踏步前进，到了2023年，芯片国产化率大致达到了25%上下。

不光是终端的芯片国产化率提高了，更可喜的是，上游的半导体设备、材料也有很大进步，国产化率大约来到了30%。在上下游的共同努力下，2023年中国首次实现了芯片进口的减少，比2022年减少了10.8%，背后就是国产替代起来了。

然而，即便成就不小，但差距还是显著，按照2014年中国制定的《中国制造2025规划》，芯片国产化率应该在2025年达到70%，目前来看2025年可能最多达到50%-55%。

这只是数量上的，质量差距更大。

众所周知，目前国产芯片还没有办法突破3nm，麒麟9000s是5nm的产品，而台积电已经量产了3nm，2nm也在研发中了，预计在2025年量产。不过有差距不意味着无法追上，现在就有一个好的时机--摩尔定律即将失效。

我们知道，半导体领域有一个著名的摩尔定律，就是当成本不变时，集成电路上可容纳的晶体管数目每隔大约18到24个月就会增加一倍，性能也将提升一倍。

这个定律过去这些年一直在生效，代表就是台积电不断缩小芯片体积，从45nm直到最新的2nm。可是到了2nm后，瓶颈已经很明显了。因为2nm相比5nm，性能提升不大，成本却大幅增加，而且即使2nm乃至1nm能够成功，那接下来呢？你的大小总不能是负的吧？

芯片性能的进步遇到了显著的天花板，目前的硅基芯片路线已经没有多少进步空间了，这也意味着，构筑在芯片地基上的AI，其性能天花板也是看得见的。

这对中国来说是好时机，可以做两手准备，一方面是加大现有技术路线的投资力度，尽快突破EUV光刻机，以便实现高阶芯片制造能力，当然，这个过程急不得，目前看至少要三五年。

另一方面，新的技术路线也不能忽视。比如在燃油车时代，因为技术垄断，国产和外资的差距巨大，双方的技术积累相差太远，追了多少年也追不上，最后培养了一批备受诟病的国产燃油车企，最后是新能源时代的到来，让国产汽车实现了弯道超车。

你以为新能源汽车总体来说真的比燃油车好？当然不是，而是从产业角度考虑，我们国家必须让新能源汽车好。

芯片行业也存在这种可能性，毕竟现在硅基芯片的技术路线已经到顶了，而业内最看好的新技术路线是碳基，从原理上说，碳基芯片的运行速度可以比硅基高10倍，同时耗能减少90%，是质的飞跃。

最重要的是，碳基芯片从原理上是可以不需要光刻这个环节的，直接绕过光刻机这个最大的制约，由于这些优点，许多研究团队已经将目光瞄向了碳基芯片，中美两国也都在押注，当前还没有出现真正的可以量产的碳基芯片，领域内最新的进展是今年1月，天津大学制成了第一个石墨烯半导体器件。

这项研究虽然也有美国乔治亚理工大学的参与，但总的来说，双方处在同一个起跑线上。就好像新能源车时代，燃油车的专利技术不再有用一样，新的技术路线上，大家都是对等的，曾经的劣势不再有，只有硬件追上了，中国的AI才真正有追上的可能。

除了芯片，中国在人工智能领域的第二大缺失，就是数据。从之前的“人工智障”到现在的人工智能，无论多么智能，使用何种模型，本质上都是靠海量的数据喂出来的，数据喂得越多，系统就越“聪明”，为什么这里的“聪明”要打个引号呢？

那就得了解现阶段的AI的工作原理--穷举法。

2017年，阿尔法狗在围棋比赛中击败了棋王李世石，这是AI初次震惊世界，阿尔法狗用的就是穷举法。简单来说，由于棋盘的面积有限，每一步对应的走法也是有限的，研究人员只需要提前把各种可能性输入，并同时输入应对办法，那么无论李世石怎么走，都逃不过AI的算计，自然就会输，道理就是这么简单。

ChatGPT远比阿尔法狗难度大，但原理依旧是相同的，比如你让它写一篇500字的短文，描写春天。研究人员会事先在数据库里，储备足够的有关春天的句子，并标注其中的逻辑变化，把尽可能多的可能性写进去，需要用的时候，就会在数据库里快速检索，然后组合出来。

这么简单的原理怎么过去没有人能做到，因为算力不够，在智能手机时代以前，芯片的运行速度普遍很慢，存储能力也差。想用穷举法的话，光是成本就能吓退所有玩家。

得益于智能手机时代的技术进步，芯片运行速度和存储能力有了质的飞跃，AI才成为了可能。但因为本质上用的还是穷举法，也就是提前把各种数据输入进去“逼迫”它学习，而不是AI真的理解了许多现实原理，人工智能的推理和演绎能力是被强行训练出来的，所以AI就需要海量的数据进行训练。据说ChatGPT 4.0诞生才几个月的时候，就已经扒完了人类网络上的所有内容。这个说法可能略有夸张，不过AI需要海量的数据进行训练，则是毫无疑问的。

在这方面，美国有天然的优势，因为英文网络的数据远大于中文世界，英文内容大约占据世界互联网内容的一半左右，而中文仅为5%。

不得不承认，美国具有的先发优势表现在各个方面，英国殖民了全世界几百年，加上美国的后来者居上，让许多国家至今通行英语，语言作为人类智慧的集中体现，如果一门语言在世界通用，它自然会吃到很多隐性红利。

大家看到的是美元利用世界储备货币的地位收割全世界的经济成果，看不到的，是通用语言这个影响更深远的东西。语言用的人多了，能产生的数据自然更多，AI的训练样本就越多，中文则基本局限于华人圈子，用的人不够，数据也就不够，AI的训练样本不足。

这也是国内文心一言等语言大模型产品明显比不过ChatGPT，乃至ChatGPT本身中文语境的输出能力明显弱于英文语境下的直接原因之一。

造成中文数据缺失的另一个原因是中美两国互联网企业全球化程度的差异。美国互联网企业的全球化程度高，而且在许多国家都是垄断状态。以社交类APP为例，美国有脸书、推特、Snapchat、ins、WhatsApp、YouTube、奈飞和红迪实现了全球化，用户分别在数亿到数十亿不等。

如此多的用户，必然产生海量的数据，而中国仅有Tiktok实现了真正的全球化，虽然Tiktok很火，但毕竟双拳难敌四手，一家产生的数据横竖也比不过美国的群狼。其他的什么微信、小红书、微博等等，本质上都没有突破华人圈子，这还只是社交APP，如果考虑其他领域的App，中美互联网企业的全球化差距更大。

尽管这几年，中国互联网企业加大了出海力度，比如拼多多的海外版就搞得有声有色，从去年下半年开始，长期在西方国家APP排行榜上霸榜。不过客观地说，这种成功仍然是个别现象，暂时还没有成为一种常态。

此外，即使有足够多的数据，拿到数据后能不能用、敢不敢用也是个问题。美国不但在军事和金融领域霸道，对互联网世界的管理也是很霸道的，威逼利诱互联网企业无条件遵守它的法律，于是在数据管理上，美国的互联网企业打着遵守本国法律的旗号，通常不会把数据进行本地化存储。也就是它的互联网企业，在其他国家拿到数据后，会回传到美国总部，这意味着美国真的能掌握这些数据、使用这些数据。

而中国互联网企业在海外出于避免被找麻烦的原因，往往很遵纪守法，特别是数据上会在海外进行本地化存储，大部分不会回传到国内。比如，Tiktok在美国的数据，就按美国的要求进行了本地化保存，连管理团队大部分都是美国人，因此这些数据中国企业只是名义上掌握了，实际上能用的不多，自然也谈不上对AI的训练帮助。

如何提高中国企业对于海外数据的掌控能力，也是我们必须解决的难题，但这种问题明显不是单个乃至多个企业能解决的，必须国家层面进行协调，具体来说，就是需要建立一套跨国数据协调使用机制，哪些数据大家能用，能共享，哪些是各国的隐私，哪些数据属于非敏感，都必须建立明确的标准机制，这肯定不是一朝一夕能完成的。在这方面，目前还没有成功先例，但如果中国做不到美国那样的霸道，又希望在数据数量上缩小差距，那么这一步是必须要走的。

这是数据能不能用的问题，至于“敢不敢用”，还牵扯到我们独特的审核制度。说白了，我们不是怕管不住国内的语言大模型胡乱回答，而是怕国内的用户胡乱提问。

最后还有一点必须强调，Sora在公布后，网上出现了一大堆自称是Sora生成的视频，实际上OPEN AI并没有给出试用入口，只是声称给了个别人内部试用的权限。换言之，广大网民还没有办法体验Sora的性能，而网上那些所谓的sora生成视频绝大部分都是假的。

之所以不开放，大概率还是和算力有关。我们知道，AI的训练是很昂贵的，ChatGPT 训练一次得300到1200万美元，同时后期的维护开支也不小。Sora作为视频模型，考虑到视频远比图文大得多，训练成本和维护成本必然指数级上升，现在的技术大概率还不成熟，或者说大规模商业化还存在成本难题。要想显著降低成本，就得提高算力，于是问题又绕回到了前面所说的，芯片才是硬道理，这是中国不得不面对的一大关。

我们之前的节目中提到过，美国对中国半导体产业的应对策略已经从之前的“全面封锁”变为现在的“半封锁，半倾销”，——封锁最先进的技术，你生产不出来的产品，就不卖给你，而那些中国已经能够生产的，就放开倾销，让你自己的企业产品卖不出去，这非常类似上世纪八十年代将日本半导体产业扼杀的《美日半导体协议》，也间接让日本一定程度上无缘后来的互联网信息技术革命。

但是，不是只有首个研发出新技术的国家才叫抓住了工业革命，内燃机是德国发明的，美国最后依然没有落下。

真正的工业革命是一次对众多行业的整体更新换代。现在中国几乎所有的大厂都在跟进人工智能领域，你说国内的AI大模型这不好那不好，实际上你去看全球其他国家，包括欧洲、日本，实际上都还停留在策划等阶段，大多没有到真正应用的层面，从这个角度讲，中国也领先了他们几个身位，人工智能革命未来大概率是中美共同主导，我对此还是比较乐观的。

“制度”不能完全解释暂时的落后，难道中国古代的制度是完美的吗？

但是五千年前我们和埃及人一样直面洪水，四千年前我们和古巴比伦人一样铸造青铜器，三千年前我们和希腊人一样思考哲学，两千年前我们和罗马人一样英勇征战，一千年前我们和阿拉伯人一样无比富足，而现在我们正和美国同台竞技。

五千年来，中国一直在世界的牌桌上从未离开，而对手却换了好几轮。这背后是源自中华民族根子里的务实。

往期精彩回顾：

房地产相关：

炒房变炒票？一纸房票，能救中国楼市吗？

央行放水印钞，给了2024年中国楼市一丝曙光？

祸起百亿赌局，万达卖子求生，王健林最后一战

恒大物业状告恒大集团，树倒猢狲散还是金蝉脱壳之计？

“烂尾楼”和“保交楼”，难点在哪里？

中央三部门发声不惜贷、抽贷、断贷，“棘手”的房地产问题靠政策刺激还能够解决吗？

“毒土地”事件，谁是地产下行周期的过错方和买单者？