AI基础设施规划:新的路径
Source: RACHEL DUNNING, AI infrastructure planning requires a different approach, NOVEMBER 17, 2022
将来有一天,AI基础设施和IT基础设施将融为一体。但目前,它们尚未完全融合,因此我们特别关注企业如何借助基础设施来推动他们的AI项目扩展。对于那些通过机器学习、深度学习以及其它变体来实施AI的企业而言,IT基础设施显得尤为关键,因此需要特别关注所应用的技术以及采购方式。
一项由451研究公司进行的调查探索了这些想法,并包含了来自美国和英国的700位AI决策者的直接反馈。这些见解揭示了市场上的众多趋势和发展,其中包括不断增加的数据和模型管理需求、对云计算和边缘计算的日益青睐,以及需要克服的一系列障碍,以将AI项目从概念阶段推进到生产实践中。
关键要点
随着人工智能的广泛应用,正在引领支撑其运行的基础设施发生深刻变革,这包括从芯片技术到云端架构的技术改变,以及企业在规划和采购此类基础设施时的不同方式。
这一变革要求关注用于加速人工智能并促使其扩展的关键技术,但这些技术都需要资金支持。人工智能拥有独特的基础设施需求,因此,投入人工智能的企业将其IT基础设施预算的大部分用于此领域——许多企业应用按需扩展的方式进行支出。虽然各企业的需求各不相同,但能够高效传输大量数据的能力至关重要,这也导致更高性能的网络再次位居企业的首要需求清单,正如在过去几年的调查中一直如此。
此外,可持续性问题也愈发引人关注,大多数企业表示愿意投资于可持续的人工智能/机器学习(ML)基础设施。尽管云计算在人工智能应用中发挥着重要作用,但人工智能边缘推理,以各种形式存在,是未来企业所追求的目标,因此它很可能成为未来人工智能基础设施规划的重要因素。
研究结果概览
AI基础设施规划需要一种独特的方法,与IT基础设施不同。据调查,59%的企业在AI规划上应用了与其它IT基础设施不同的策略。尽管有多种原因驱使企业这样做,但最常见的原因包括网络需求、存储性能以及不同的技术和硬件需求。几乎所有企业(99%)都一致认为,AI驱动的应用程序能够与现有基础设施无缝集成非常重要。然而,难以将AI与现有基础设施无缝整合是导致应用不同AI规划方法的首要原因,尤其在医疗保健、电信和制造领域,这一因素具有特别强烈的推动力。
AI/ML工作负载对基础设施的需求不断增加。81%的受访者预计未来两年内他们的AI/ML工作负载需求将增加,相比之下,2021年同一调查中有76%的受访者持有相同的看法。尤其是对于拥有超过10,000名员工的大型企业,89%的企业预计AI基础设施需求将增加。
许多IT环境没有为未来做好准备。65%的IT环境需要进行一定程度的升级以满足未来基础设施需求。对于40%的企业来说,这些变化较小,但四分之一的IT环境需要进行中等到重大的升级。
越来越多的模型被部署到生产环境中。今年,生产环境中的平均模型数量显著增加,达到了3,444个,而2021年仅为1,991个。与此同时,概念验证阶段中的平均模型数量有所减少。特别是在那些仅将ML用于生产的企业中,这种变化尤为明显,反映了整体AI/ML计划的持续成熟。
数据量随着成熟度的提升不断增长。在那些从事AI领域时间最长的企业中,用于构建模型和进行预测的数据量最大。那些五年前开始开发他们的第一个ML项目的企业,平均使用107PB的数据来构建和训练模型,以及155PB的数据进行推理。与此相比,那些不到六个月前开始ML开发的企业中,相对较高比例的企业(32%)预计将大幅增加数据用于构建和训练模型,增幅可能达到50%或更多,而那些五年前开始开发的企业只有19%。
尽管数据随处可得,但用于训练的难题依然存在。略多于一半(51%)的企业拥有足够构建和训练其AI/ML模型所需的数据,而有两成五的企业拥有超过足够的数据。然而,拥有数据并不等同于轻松访问 —— 65%的企业在获取AI/ML工作负载所需的数据方面遇到困难,对于那些数据量更大的企业而言,这种困难会更加突出。
“按需扩展”仍然是最受欢迎的AI基础设施支出策略。有47%的企业采用“按需扩展”的方式来进行AI/ML基础设施采购,而只有39%的企业提前规划,11%的企业则按固定额度采购。
总体来看,企业将其IT基础设施预算的43%用于支持AI。对于那些已将ML项目投入生产的企业,这一比例上升至51%,而对于年龄不到10年的公司,则高达60%。
AI基础设施支出保持平稳,但随着成熟度的提升而增加。在过去的12个月里,企业平均投入约140万美元用于AI/ML基础设施。这略低于前12个月的支出水平(150万美元),表明AI成本保持了相对稳定,甚至略微下降。然而,随着企业逐渐进入更高成熟度阶段,支出逐渐上升。那些已将ML用于生产的企业在2021年平均支出160万美元用于AI基础设施,而那些仍处于概念验证阶段的企业则平均支出130万美元。在过去两年内开始开发AI项目的企业支出110万美元,而那些在五年前开始开发的企业则平均支出约190万美元。
企业对多种基础设施资源的需求不断增加,其中更高性能的网络位居他们的需求清单之首。有45%的企业将更高性能的网络视为提高其AI/ML工作负载性能所必需的资源,其中23%认为这是不可或缺的。其它高需求项目包括更具可扩展性和高性能的存储设备(36%);云中的加速器(33%);以及更快速的标准服务器(32%)。
低代码工具正成为企业的重要资产。在拥有AI/ML计划的企业中,有59%目前正在使用低代码工具,而另外29%计划在未来一年内开始应用。目前使用低代码工具的企业认为其主要优势在于易于集成(37%)、增强的可扩展性(36%)和更快的部署速度(33%)。
云端是必然之选,但边缘计算是企业所追求的方向。尽管公有云仍然是主要的AI工作负载场所,用于存储、训练和推理(均占比45%),但有95%的企业表示他们更愿意在边缘进行更多的训练和推理。然而,他们在实现这一愿景时面临了诸多限制,包括存储容量、预算和计算性能等因素。
可持续性问题至关重要。总体而言,85%的企业表示他们愿意为可持续的AI/ML基础设施支付费用;其中30%认为这是绝对必要的,并愿意为此支付额外费用。在能源、石油和天然气行业,这一趋势尤为显著,有44%的受访者认为可持续性是绝对必要的。
---【本文完】---
近期受欢迎的文章:
我们正处于数十年未见之大机遇中
新技术爆发式发展,催生新产品
然而,颠覆式创新并非简单的技术堆叠
而是异常复杂的系统工程
需要深度洞察
欢迎一起分享思考和见解