李飞飞领衔Stanford HAI发布全新500页2024人工智能报告,显示超过30%的工作岗位或被AI取代"
李飞飞&Stanford HAI: 2024 年人工智能报告
由AI先驱李飞飞领导的斯坦福大学人本人工智能研究所(Stanford HAI)最新发布了《2024年人工智能指数报告》(Atificial Intelligence Index Report 2024)。
这份长达500多页的报告是Stanford HAI发布的第7份AI Index研究📊,追踪了2023年一整年全球人工智能的发展趋势🌍。
Stanford HAI官方介绍道,“这是我们迄今为止最全面的报告,而且是在人工智能对社会的影响从未如此明显的重要时刻发布的。尤其AI时代,更加不能错过这份详细研究报告
今年的500页报告着重介绍了多模态基础模型的兴起、对生成性 AI 投资的激增、新的性能评价标准、全球舆论的变化,以及新颁布的重要法规。
如果你没有足够的时间逐条查看这些研究结果,你可以在这里快速了解关键要点。🔍✨
图1:向开源迈进
在上一年(2023)里,有关组织发布了149个基础模型,数量是2022年的两倍还要多。在这批新推出的模型中,有65.7%采用了开源模式(即允许公众自由使用和改进),这一比例相较于2022年的44.4%和2021年的33.3%,呈现显著上升趋势。
图一显示了2023年不同类型的基础模型(foundation model)的数量分布情况:
开源(Open)模型的数量最多,共有98个。这说明目前开放共享的基础模型占大多数。 有限(Limited)访问的基础模型数量为23个。这类模型只能被特定人群或组织访问和使用。 闭源(No access)基础模型数量为28个。这些模型是完全封闭的,一般公众无法接触和使用。
这个饼状图清楚地显示了2023年基础模型在开放程度上的分布情况。开源模型最多,但也有一定数量的受限或闭源的模型。这可能取决于模型本身的用途和特性,以及公司或组织的商业策略。对于普通用户来说,能够自由使用和接触的开放模型无疑最有价值。
图2:然而,开源性能真的好?
这张图表2比较了一些被称为“顶尖闭源”和“开源”的人工智能模型在特定基准测试中的表现差异。
基于代理的行为:在AgentBench这一基准测试中,顶尖闭源模型比开源模型的表现要好317.71%。这表明在此测试中,顶尖闭源模型的表现显著优于开源模型。 数学推理:在MATH这一数学推理基准测试中,顶尖闭源模型比开源模型表现好39.57%。 编程:在HumanEval这一编程能力测试中,顶尖闭源模型比开源模型表现好54.82%。 综合语言理解:在MMLU这一综合语言理解测试中,顶尖闭源模型比开源模型表现好27.54%。
所以尽管开源模型的数量在增加,但闭源模型在性能上仍然领先。在选定的10个基准测试中,闭源模型平均超越开源模型24.2%,这一差距在不同任务中表现各异,从数学问题如GSM8K的4.0%,到需要更多代理能力的AgentBench任务高达317.7%。
图3:科技巨头的比拼
在人工智能的竞赛中,产业界尤其在开发与发布基础模型的领域里占据了重要地位。去年,谷歌在众多产业参与者中脱颖而出,发布了最多的模型,包括其重要作品 Gemini 和 RT-2。自2019年起,谷歌就在发布基础模型的数量上遥遥领先,总计达到了40个,而 OpenAI 以20个模型紧随其后。
相比之下,学术界的进展较慢:在上一年,加州大学伯克利分校贡献了三个模型,斯坦福大学贡献了两个。
图3显示了2023年不同公司和组织建立的基础模型(foundation model)的数量。
Google建立了18个基础模型,数量最多。 Meta(Facebook)建立了11个基础模型。 Microsoft建立了9个基础模型。 OpenAI建立了7个基础模型。 together.ai建立了5个基础模型。 Hugging Face建立了4个基础模型。
这些都是当前人工智能领域非常知名和活跃的公司和组织。他们都在不断研发和推出新的基础模型,这对于人工智能技术的发展非常重要。
图4:产业界的绝对优势
如果要寻找有力证据来证明在当下,企业级人工智能是领域内的主宰者,以下数据或许可以说明问题。2023年,产业界发布的新基础模型占全部的72%,其巨大比重让其他所有参与者相形见绌。
不同领域在2019年到2023年之间建立的基础模型(foundation model)的数量。
工业领域建立的基础模型数量最多,从2019年的15个增加到2023年的108个,增长非常快。 学术界(Academia)建立的基础模型数量次之,从2019年的8个增加到2023年的28个。 工业界和学术界的合作建立的基础模型数量较少,从2019年的2个增加到2023年的9个。 政府部门建立的基础模型数量最少,从2019年的1个增加到2023年的4个。 政府和工业界的合作建立基础模型的数量一直保持在0。
总的来说,这个图展示了近几年各个领域在建立基础模型方面的发展情况,工业领域的增长尤其迅速。这对科技发展来说是一个很重要的趋势。
图5:成本飙升
这个图表展示了一些著名人工智能模型的训练成本和计算规模。让我用简单的话来解释一下:
图中的每个点代表一种人工智能模型,比如Transformer、BERT-Large、GPT-4等。横轴表示每种模型在训练过程中需要使用的计算机算力,越往右表示计算量越大。
纵轴表示训练每种模型需要的成本,越往上表示成本越高。
我们可以看到,一些大型模型如Gemini Ultra、GPT-4等,它们需要非常大的计算量和高昂的训练成本,这可能需要科技公司或研究机构投入大量资金。
相比之下,一些较小的模型如Transformer、BERT-Large,它们的训练计算量和成本就相对较低。
学术界和政府之所以难以在人工智能的竞速中保持领先地位,部分原因在于训练这些庞大模型所需成本的急剧上升。谷歌的 Gemini Ultra 的训练估计耗资高达1.91亿美元,而 OpenAI 的 GPT-4 也需要大约7800万美元。
作为对比,2017年开创性的原始 Transformer 模型——几乎所有现代大型语言模型(LLM)的基石,其训练成本大约只需要900美元。
图6:人工智能竞赛
美国拥有61个重要的机器模型,数量最多。 中国拥有15个重要的机器模型。 法国拥有8个重要的机器模型。 德国拥有5个重要的机器学习模型。 加拿大拥有4个重要的机器学习模型。
这些数字反映了不同国家在机器学习领域的研发和应用实力。机器学习模型是人工智能技术的一个重要组成部分,广泛应用于语音识别、计算机视觉、自然语言处理等领域。这些国家在机器学习发展方面的差异,可能与其整体科技实力、资金投入、人才培养等因素相关。
图7:颤抖吧,人类
这个图表展示了人工智能系统在不同任务领域的性能与人类表现之间的比较。
图表显示了不同任务领域中人工智能系统的表现与人类基准线的对比。
在图像分类、基础阅读理解、英语理解等任务中,人工智能系统已经超过了人类的表现。
在更复杂的任务如视觉推理、多任务语言理解和竞争级数学等领域,人工智能系统仍在追赶人类的水平,但性能已经有了很大的提升。
到2023年为止 ,整体来看人工智能系统在很多智力任务上的表现都有了大幅提升,在某些领域已经超过了人类的水平。这说明人工智能正在不断发展进步,未来在更多领域可能会超越人类的能力。
图8:私人VC投资总体下滑,但Gen AI投资逆势上扬
这张图表显示了私人投资生成性人工智能(GenAI)的情况:
总体AI私人投资这个指标展示了随时间的波动情况。 与之对比的是专门投资于生成性AI的部分,这个指标呈现了更明显的增长趋势。 从2019年的0.84亿美元增长到2023年的25.23亿美元,生成性AI私人投资大幅增加。 而总体AI私人投资在2021年达到峰值132.36亿美元后有所下降,但生成性AI投资持续攀升。 这表明在整体AI投资波动中,投资者对生成性AI技术寄予了较高的期望和信心,推动了这一细分领域的持续投资增长。
近年来,尽管人工智能领域的私人投资总体呈下降趋势,但生成性AI技术却显著增长。2023年,这一领域的投资额达到了252亿美元,是2022年的近九倍,与2019年相比增长了约30倍,这一现象被称为“ChatGPT效应”。在2023年,生成性AI的投资占到了所有与AI相关私人VC投资的超过四分之一。
图9:美国在 AI 投资领域遥遥领先
2023年,美国在人工智能领域的私人投资再次遥遥领先。
图中显示了美国以67.22亿美元的投资排名第一,是所有国家中投资最多的。
紧随其后的是中国,投资额为7.76亿美元。
其他国家的投资额依次为:英国3.78亿美元、德国1.91亿美元、瑞典1.89亿美元、法国1.69亿美元、加拿大1.61亿美元、以色列1.52亿美元、韩国1.39亿美元、印度1.39亿美元。
从整体上看,美国的人工智能投资明显领先于其他国家和地区,远超第二位的中国。这表明美国在人工智能领域的投资力度和地位依然占据主导地位。
其他一些欧洲国家如英国、德国、法国等也有较为可观的投资水平,说明这些国家也非常重视人工智能技术的发展。
这些反映了各国在人工智能领域的投资格局和差距,为我们了解全球人工智能发展态势提供了直观有趣的数据信息。
图10:企业如何开展人工智能业务?
客服中心(Contact-center automation)中,26%的企业正在使用AI技术来提高客户服务的效率。 个性化推荐系统(Personalization),23%的企业在利用AI实现更精准的个性化服务和推荐。 获取客户(Customer acquisition)中,22%的企业采用AI技术来提升客户获取和转化的能力。 增强产品(AI-based enhancements of products),22%的企业正在利用AI来改进和升级自己的产品。 AI驱动新产品(Creation of new AI-based products),19%的企业正在利用AI开发全新的产品和服务。
企业在客户服务、营销、产品开发等关键业务领域中广泛采用AI技术来提升效率和竞争力的现状。这说明AI正在成为企业提升竞争力的重要工具。
图11:年轻人和高收入群体更担忧AI对工作影响
全球范围内,大部分人都认为人工智能将改变他们的职业生涯,超过三分之一的人甚至担心可能会被AI取代。
这张图表展示了人们对于人工智能将如何影响就业的看法:
57%的人认为,在未来5年内,人工智能会改变他们现有工作的方式。这表示多数人认为人工智能将会对他们当前的工作产生影响。 相反,35%的人认为人工智能不太可能改变他们的工作方式。这表示还有相当一部分人不认为人工智能会对他们的工作产生太大影响。 在是否会取代当前工作方面,36%的人认为人工智能很可能在未来5年内取代他们的工作,而56%的人认为不太可能发生这种情况。 另有8%的人对这些问题表示不确定。
特别是年轻一代,包括95后和00一代,预计人工智能带给他们特别大影响。例如,66%的95后相比70或者80后一代的46%,更多地认为人工智能会显著改变他们当前的工作环境。
此外,高收入者、受教育程度更高的人群以及担任决策职位的个体,也普遍认为人工智能将对他们的职业生涯产生重大影响。
图12:对待AI产品态度
上面图表展示了13个不同国家民众对AI是否引起焦虑的调查结果。
澳大利亚有 69% 的人说 AI 让他们感到焦虑。 英国有 65% 的人表示 AI 让他们感到焦虑。 加拿大有 63% 的人表示 AI 让他们感到焦虑。 美国有 63% 的人表示 AI 让他们感到焦虑。 印度有 58% 的人表示 AI 让他们感到焦虑。 法国有 52% 的人表示 AI 让他们感到焦虑。 西班牙有 51% 的人表示 AI 让他们感到焦虑。 比利时有 50% 的人表示 AI 让他们感到焦虑。 德国有 46% 的人表示 AI 让他们感到焦虑。 韩国有 44% 的人表示 AI 让他们感到焦虑。
总的来说,这张图表展示了全球人们对 AI 技术持有一定程度的焦虑情绪,但具体情况因国家而有所不同。
报告英文原文下载:https://aiindex.stanford.edu/wp-content/uploads/2024/04/HAI_AI-Index-Report-2024.pdf
(若需要中文版,请私信我哦)
我们的AI团队现向外界开放服务,旨在助力每个企业与个人引领时代潮流,将先进科技与创新想法完美融合!
告别昂贵服务费和缺人烦恼,再见漫长交付周期
无限创意风格,分分钟生成专业级作品
感受 AI 带来的全新工作体验!
欢迎各大品牌方、媒体、科技企业、知名IP等合作
合作请联系负责人微信:Milo-1101
--END--