历史不会重演,但历史背后的发展逻辑总是惊人的相似!看不清未来的时候,可以看看历史的演化能带给我们哪些启发?
英国经济学家卡洛塔·佩雷斯(Carlota Perez)在《技术革命与金融资本》从技术革命发展的角度,提出了"技术-经济周期"理论。为我们理解当下AI的行业现状及预判未来的发展节奏趋势,提供了一个很好的理论框架。卡洛塔·佩雷斯(Carlota Perez)深入研究了自工业革命以来五次重要技术革命周期,发现这些技术革命及其背后所带动的经济与社会变革始终遵循着某种规律——她称之为“技术—经济范式变迁”。通常,创新技术所带来的技术革命可以的分成两个周期、四个阶段——安装期(包括爆发阶段与狂热阶段)及实施期(包括协同阶段与成熟阶段)。新技术崛起的早期是一个爆炸性增长阶段——资本被未来潜在的超高利润回报所吸引,迅速投资运用新技术的企业和所需的基础设施。投资的涌入使“新技术”看起来非常强大。然而,由于应用发展的落后,这些先行过度的投资在短期内并不能全部转化为商业价值的创造,两者矛盾不断累积,最终导致在“狂热阶段”的尾声,泡沫被刺破。但在泡沫破裂之后,新技术经过一段时间的转折调整迎来真正的实施期——即应用大爆发的黄金时代。纵观历史,技术革命中每次过剩的基础设施投资都为后续的应用大爆发铺平了道路,只要泡沫背后是真正有用的技术,技术革命最终总会不可阻挡地展开。回到这一轮AIGC生成式人工智能,目前正处于大模型技术崛起的“爆发阶段”,这个阶段基础设施的投资大大高于应用的发展速度。
提到AI不得不提深度学习的鼻祖杰夫·辛顿。在辛顿的履历里,找一件对AI贡献最大的事,并不是他让神经网络成功度过生存危机的误差反向传播算法,也不是他后来以受限玻尔兹曼机为基础,进一步演化出来的深度信念网络,而是他用了四十年的时间,坚持不懈,开创了一个新的分支:机器学习。也为后来所有的研究者,守着这扇通往新世界的大门。
被业内公认的“深度学习三巨头”:杨立昆、约书亚·本吉奥、杰夫·辛顿。杨立昆是辛顿的半个学生,约书亚·本吉奥是辛顿的徒孙。可见辛顿被称为“深度学习”鼻祖实至名归。算法被三巨头解决了,但是只有算法上的创新还远远不够,横在三巨头眼前难以逾越的还有两座高山:算力和数据。2012年,64岁的辛顿去谷歌做暑期实习生,这次入职,是应吴恩达邀请,接手谷歌猫项目。如果只是识别一只普通的猫,传统的计算机视觉自然不在话下,可是猫有可能长得千奇百怪。虽然当时谷歌在动用了16000个CPU后,识别准确率已经高达74.8%,辛顿却仍然认为:他们的神经网络用错了。几个月后,辛顿和自己的两个学生:Ilya Sutskever、Alex Krizhevsky,带着新算法AlexNet,以及两块英伟达GTX580显卡,参加了计算机视觉领域最受关注的世界赛事,ImageNet,并以84%的识别准确率,拿下冠军。也是这一年后,曾经只拿来玩游戏的GPU,凭借超强的并行计算能力,来了个180度大翻身。神来一笔的两块GPU,算力这座大山被凿开了口子。那么数据问题又该如何解决?实际上,这场图像识别比赛(ImageNet)本身就是一块高质量的数据试金石,比赛的主办者,就是后来被称为AI教母的李飞飞。早在2000年,她就意识到,卡住神经网络脖子的,可能不在于算法的精度,而在于缺少大规模、高精度的数据。最开始她用WordNet中的名词作为索引,来筛选和分类图片,但只依靠本科生,这项任务大概90年后才能完成。就在所有人都陷入僵局的时候,马逊土耳其机器人这个网站步入研究者的视野,也没用什么新鲜方法,亚马逊找来十万名“人类智能”,一招人海战术,在短短两年时间内,就标注了超过300万张图像。2010年,第一届图片识别大赛举办。2012年,数据库里的图片,就已经扩充到了1500万张。也是这一年,数据集的概念出现,逐渐成为未来所有人工智能的核心养料。所以当李飞飞看到了辛顿的AlexNet获奖,立刻就意识到,历史即将改写。她在颁奖当天,买了最后一班飞机票,亲自赶到现场给辛顿团队颁奖。多年以来压在深度学习身上的三座大山:算法、算力和数据,在这一年被集中解决,第三次人工智能浪潮也从沉淀中苏醒,时刻准备爆发。
互联网解决的是供需匹配问题,而AI解决的是供给不足的问题。互联网这波技术革命本质上解决的是供需匹配问题。腾讯解决的是社交信息匹配;阿里解决的是电商信息匹配;美团解决的是外卖生活信息匹配;滴滴解决的是出行信息匹配;携程解决的是订票订酒店信息匹配。而AI的本质是解决的是供给不足或效率提升的问题。计算机视觉领域的AI四小龙,解决的是在视觉场景下能提升效率的问题,比如刷脸、智慧安防,让支付效率和安全效率大幅提升。语音人工智能领域科大讯飞,解决的是在语音识别、语音合成、语音评测等场景下供给不足或效率提升,比如普通话等级考试,原来都要靠人工评分,现在可以用AI机器评分,不仅解决了评分专家供给不足,还大幅提高了评分效率,通过AI语音技术保障了能同时支持大规模的考试人员。所以这波AIGC技术革命,也同样解决的是在其能力边界范围内,能解决供给不足或提升效率。在文生文领域,AIGC能提炼总结几百万字长文本的内容。在文生图、图生图、文生视频领域,能大幅提升图片和视频的创作效率。在英语学习领域,AIGC也能比大部分英语老师发音更标准,语法运用更规范,解决了优秀英语老师供给不足的问题,让普惠教育具备实现的可能。俞军产品方法论提到的价值公式:用户价值=新体验-旧体验-替换成本。想要追求性能越强的大模型,就越需要越高的计算成本,越高的计算成本导致替换成本越高,用户价值没办法体现。所以现在大家都在做垂类或者优化小模型性能,就是看到了这个问题。再有就是新体验,现阶段对用户还不足够友好。大模型的意图理解,创作和推理能力,目前来看整体和人类的顶尖水平还是有较大差距的。如果试图让大模型做一些“创造性”的工作,就需要非常强的提示词工程。不同水平的提示词下,大模型的水平差异确实会非常大。普通大众用户又不能为了使用这个AI产品,学习下吴恩达的提示词课程,使用门槛太高了,这就限制了“新体验”的普及。但是我认为随着模型的迭代,提示词对模型生成的结果质量影响会越来越小,主要的作用是提升精确性。AI对用户价值的体现,在现阶段还没有得到充分释放!
未来格局一定只剩屈指可数的几家基座大模型玩家,类似互联网时代的苹果系统、安卓系统和鸿蒙系统。(2)AI应用从 Copilot 到 AI Worker。AI应用的发展路径日趋明显。目前业界的共识,AI应用的演化大体会遵循自主系统的发展过程,即Copilot → Agent → AI Worker。Copilot作为人类工作的辅助,为人类提供自然语言交互和知识搜索等基础功能,典型场景包括知识的收集与整理、基于知识生成文本或视觉结果等。在Copilot应用中,人依然是中心,是任务的主要解决者,AI只是辅助人更高效地工作,对原有业务流程与组织结构的影响较小。GitHub Copilot 是这类应用的成功典范,许多AIGC应用本质上也属于这⼀类。Agent的核心能力是决策和独立完成某些任务。Agent执行任务过程中可能包括多项决策,通过交互、访问知识和数据、以及调用工具。理想的Agent应该是可以自我学习和完善、高度个性化的。AI Worker的核心则是像人类一样融入社会组织,独立完成某个角色的工作,组织中可能包括多个独立的AI Worker。AI Worker的核心在于可以在工作中学习、接受培训,并且可以与其他的人或者AI协作完成复杂的工程项目。应用发展到这个阶段,会极大影响原有的业务流程与组织形态,产生全新的协作机制及工作流。目前AI应用绝大部分还处于Copilot 阶段,但真正有潜力的AI应用不能止步于Copilot,至少需要能够独立决策和可靠地完成任务。所谓可靠指的是能够独立处理任务和决策中的各种特殊情况;而AI Worker则是远期目标。随着模型小型化,大模型不仅可以跑在本地的各种GPU服务器上,还可以轻松地跑在电脑、手机和汽车上。Apple最新发布的Apple16就搭载了AI功能,其终端可以把大模型和AI直接带给全球几亿的用户,再加上如今消费终端厂商的内卷程度,大模型在消费终端普及的加速度,会有突破性进展。1、《揭秘教育大模型时代,是“枯木逢春”还是“海市蜃楼”?》
3、《全球Top100消费级AIGC应用》榜单新鲜出炉!中国14款上榜,5款教育应用》
4、《00后年轻人赚到500 万美元的秘密:30天用AI构建RizzGPT》
5、《神器助力,这款AI工具让娃的学习生活so easy!家长必看》