查看原文
其他

数据智能:AI成功的关键

常华Andy Andy730
2025-01-01
Jim Liddle

Nasuni公司

可以说,由于生成式AI工具的激增,AI已成为2023年最热门的话题之一。在这一迅速增长的背景下,企业正面临着董事会对于成功实施AI、在竞争中取得优势的日益增加的压力。

然而,尽管AI创新的步伐迅猛,但在将AI应用于业务时,应该将其视为一场马拉松,而非短跑。

为什么呢?在AI的狂热中,企业内部潜在的更深层次的数据基础设施问题已经在近年来逐渐积累,导致了AI项目的失败。

例如,根据S&P Global 2023年全球AI趋势报告,该报告基于全球1500家企业和研究机构,发现数据管理是AI/ML部署中最常被引用的技术障碍,超过了安全性和计算性能。

与其在2024年冒险继续推进,最终导致AI实施失败,不如让企业根据实际情况,将重心放在数据智能和“AI准备”上。

实际上,企业必须认识到AI对数据质量、治理、访问和存储的高要求。只有满足了这些要求,他们才能考虑推进数字化转型或改进计划,从而成功地获得期望的竞争优势。

数据是AI的核心

令人震惊的是,许多企业对他们的数据感到困惑,因为他们不清楚如何使用这些庞大的数据量,或者是否真的需要这些数据。而这些数据正被用于训练AI模型。

当企业不清楚他们的数据是否准确、是否及时更新、是否能够按需获取或者存档、是否经过正确分类并且“可搜索”、是否合规,或者是否包含个人可识别信息(PII)或受保护的健康信息(PHI)等敏感信息时,我们如何期望用它来训练一个聪明而有能力的AI模型,同时确保合规呢?

对企业数据的清晰认知是成功运用AI的关键,但这一步往往被忽视。要实现这一点,关键在于将重心放在数据智能上,并借助混合云平台的支持。

为何AI将依赖于数据智能

数据智能涉及到对企业数据的深入理解和洞察,以及如何利用这些数据。IDC提出了数据智能需要回答的六个基本问题:

  1. 谁在使用哪些数据?
  2. 数据来自哪里,它的源头是什么?
  3. 数据何时被访问,上次更新是什么时候?
  4. 我们为什么需要这些数据,为什么需要保留(或丢弃)这些数据?
  5. 数据如何被使用,或者更具体地说 - 数据应该如何被使用?
  6. 数据内部存在哪些关系,与数据使用者之间存在哪些关系?


找到这些问题的答案对于任何企业来说都是至关重要的,这使它们能够做出更明智的决策,并为成功的技术实施提供途径,尤其是在AI方面,数据智能和AI密不可分。

那么为什么这么说呢?因为只有通过我们提供给AI的信息,才能真正控制AI,并充分发挥它推动生产力、提高效率和降低成本的潜力。因此,我们应当避免提供不相关、过时、重复或敏感的信息。否则,不仅会制约AI的潜力,还可能导致重要业务信息被错误地分享给不合适的人。AI并不清楚提问的是CEO还是团队其他成员,它只知道所接收到的数据。

只有经过精心策划和整理的企业数据,能够提供有洞见的见解、满足合规要求,并且经过智能处理的数据,企业才能真正准备好将其数据暴露给AI系统,并从中获得真正的益处。

利用更智能的数据,AI将更具环保性

除了实施AI所面临的挑战,推进AI系统所需的能源和计算资源也对环境可持续性产生了影响。运行大型AI模型所需的资源大幅增加了能源消耗,进而增加了企业及其数据中心的碳足迹。

数据智能有助于解决这一问题。通过整合和清理数据集,企业可以减少输入到AI模型中的陈旧和重复数据,并更好地了解专有数据及其在AI中的用途。

经过优化、丰富的数据集能够为更小、更智能的AI模型提供支持,这些模型需要的功耗更少。而经过良好训练的这些模型将优于基于原始计算能力的更大模型。

AI的成功应用:数据整理是关键

AI的成功并不是孤立的。它需要作为更广泛的数据智能范畴的一部分来利用。尽管许多企业已经通过实施数据分析、机器学习和AI在销售、客户支持等低风险领域推动了数据项目,但在尝试将这些技术应用到更复杂、高价值的应用程序时,往往会遇到瓶颈。

通过在今年更好地利用资源实现数据智能,企业最终将能够实现对这些高价值项目的AI赋能。最终,IT领导者将能够从之前分散的数据资产中获得真实、统一的数据源,从而提升公司的创新能力和对客户的响应能力。

此外,以可持续的方式实施这些技术,不仅在速度上,而且在考虑环境影响方面,都将使企业能够提供董事会期望从AI中获得的竞争优势。

-----

Source:Jim Liddle; Data intelligence: the key to successful AI; 19 Jan 2024


---【本文完】---

近期受欢迎的文章:

  1. 智能数据平台:2023年回顾和2024年预测

  2. Databricks数据智能平台:颠覆性变革的洞见

  3. 美国国防部《数据、分析和人工智能发展战略》

  4. 深度讨论:实时数据引领人工智能未来

  5. 人工智能数据困境:如何克服信息超载



更多交流,可添加本人微信

(请附姓名/关注领域)

继续滑动看下一个
Andy730
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存