大语言模型(LLM,Large Language Model)。为什么说是通用AI的一场革命?这是非常简单的算法,就是去预测一个字后面最有可能出现的下一个字是什么,当它预测率准确度足够高、足够有用,在这个意义上它看起来就像掌握了语言。《人类简史》一书中提到:语言是人类最伟大的发明。语言让我们可以沟通,语言背后天然就蕴含着人类的智慧,因为人类一万年积累的海量的知识基本都被文字、语言以及最近20年的视频给沉淀下来了,所以掌握了文字和语言基本就破解了人类到今天为止所有的知识。我们今天还不太理解大语言模型背后的运行机制是什么,它也许不像人一样在思考,但它表现出了像人一样的逻辑推理能力,这对未来就会产生根本性的影响。过去30年的发展,从互联网到无线互联网,到传感器,数字化转型,大数据计算等,这些逐步拓宽了软件世界的能力边界,但其本质是在做加法,是叠加,但AGI通用人工智能将这些串在一起提高了所有软件的适配能力和自主能力,开始从量变到质变,发生一个新的飞跃。比如AGI可以自动编程,一下让软件能力就有了一个急剧提升,这是一个质的变化,在这个意义上,大家一般认为大语言模型是AI时代的第一个类iPhone的时刻,也是一个大变革的时代。
另外一个非常重要的且更根本的领域是AI for Science。到目前为止AGI只能应用人类现有的知识,并不能创造新知识,但AI for Science将AI用来做科学的发展,它很有可能创造完全不一样的格局,比如它可能会发现新的化学方程式或新的物理定律,整个人工智能又会往前迈一大步。今天像DeepMind下面的AlphaFold蛋白质解析取得了很大的进展,这样非常新生的领域也是AI驱动的,只是不那么广为人知,但这方面的积累也会带来下一步的突破。
另外一个重要观点,基础设施与应用是共同演化的。原生应用通常发生在一场技术革命的第三个阶段,它们需要时间去孕育,技术要成熟到一定的程度,要能够创造全新的价值,这时候它能带来真正海量的大众用户,变成国民级的杀手应用,就像移动互联网时代的微信一样,最后自然而然地成为了新商业范式的领导者,因为追赶者很难追上它。举一个例子大家就可以更好地理解这个概念了,Google是PC互联网的第一个原生应用,Google极简搜索框非常震撼,你输入一个关键词,几秒钟就能返回结果,这是以前无法做到的,是用户体验的极大突破。但这样一个突破,需要底层技术的重大创新来支持,就是分布式计算。今天AI计算都是基于分布式计算发展而来的,所以它开创了一个计算的新时代,但同样重要的是开创了一个商业模式,叫Pay for Performance,即大家今天熟悉的精准营销,将广告成本从一个不可衡量的指标变成一个更精准度量的,我花多少钱得到了多少用户,且是事后付费,客户点击了以后才收费,价格是市场定价,有人跟你抢,价格就高,没人跟你抢价格就低,通过这样的市场定价才能将海量的点击都充分地利用好,这是一个商业模式的巨大突破,所以会出现一个巨大的虹吸现象,广告往线上走,线上广告往Google走,才有了Google十几年的辉煌。有十年时间,硅谷所有的人才都在Google,所有创新都从Google发生,极高的利润率,非常高速的增长,到后面搜索的垄断,这是非常典型的原生服务创造了一个新的时代。从这个角度来看,这是刚才提到的三个时代,可以看看技术带来的原生服务的出现,刚才提到的Google是PC互联网的原生服务,1998年成立,2004年上市。第二个原生服务是Facebook(脸书),2004年成立,2012年上市,Facebook是非常典型的PC时代的原生应用,但上市那一年正好遇到移动互联网开始变得非常火爆,所以一上市股价就跌到了40%,逼着Facebook快速地进行移动互联网的转型。2008年APP store发布,2009年出现Super APP超级应用,也是第一批原生应用,大家可以看到很密集,2009年的Whatsapp、微博、Uber;2010年的美团、Instagram;2011年的微信,2012年的头条,2013年的快手,2015年的拼多多,2016年的抖音,很多人今天被抖音和拼多多定义了我们的生活,这是真正移动互联网的王者,最原生的应用。