AI能成为冷数据的杀手级应用吗?
AI的快速发展正围绕数据领域开辟全新机遇,而数据本身正是AI成功的命脉。
尽管最初的焦点多聚焦于热数据,但如今,利用企业中积淀的丰富冷数据来训练模型,并从中挖掘新价值的机会正逐渐显现。虽然目前尚处于起步阶段,但近期的技术突破正激励着企业以更加开放和创新的思维去探索冷数据的全新应用场景,这既有助于快速实现AI的成效,也为长期战略成功奠定了基础。
如何处理已完成初始用途但仍由企业保留的冷数据,已成为IT部门乃至合规和安全团队面临的一大挑战。这些部门在保留这些数据时常常感到矛盾重重。多数情况下,数据的保留是出于合规性或监管要求的必要性。为了降低成本、确保合规并规避潜在风险,许多企业会定期删除老旧数据。
AI驱动存储应用的拓展
随着AI技术的崛起,数据的存储用途开始发生转变。以往,企业往往缺乏保留旧数据的明确业务动机。然而,在AI及其它创新技术的推动下,情况正悄然改变。如今,一些企业开始挖掘冷数据的潜在价值,将其转化为竞争优势的源泉。
最近,我们的一项研究报告为利用冷数据进行AI的应用提供了有力支持。报告指出,AI已成为推动新存储和超融合基础设施项目的主要因素,预计在2024年发挥关键作用。
近期,一些引人注目的新动态引起了我们的关注。首先是云对象存储厂商Wasabi推出的新服务——AiR。基于公司近期收购的Curio技术,AiR被打造为一款智能媒体存储服务,能够利用AI自动为丰富的媒体内容添加元数据标签。这一创新使得内容变得可搜索,用户可以通过人物、品牌、标志等关键词快速定位并访问相关内容。
想象一下,没有元数据的对象存储就如同失去了搜索功能的互联网,其应用价值大打折扣。而AiR正是瞄准了媒体行业的这一痛点,旨在为冷媒体内容注入新的活力。这项技术的应用前景十分广阔。例如,市场营销人员可以轻松找到包含特定明星或品牌标志的图片素材,媒体公司也可以快速定位和替换可能引发争议的内容。值得一提的是,除了技术上的创新,Wasabi还在成本方面下足了功夫。订阅AiR服务的用户只需支付存储费用,无论他们如何频繁地访问、查询或移动数据,都不会产生额外费用。这种灵活且经济的定价模式无疑将鼓励媒体用户更积极地与他们的存档内容互动。
利用备份数据训练AI模型
另一个值得关注的例子来自数据保护领域,SaaS备份厂商Own Company(前身为OwnBackup)推出了一项新功能——Own Discover。备份数据长期以来被视为一种“保险政策”,尽管备份公司一直在探讨如何利用这些长尾数据进行更多创新应用,但进展一直较为缓慢。然而,AI的崛起可能为这一领域带来颠覆性的变革。
Own Company敏锐地捕捉到了这一机遇,并推出了Own Discover功能。该功能旨在帮助客户利用备份数据来训练AI模型,从而激活这些沉睡的数据资源。虽然备份数据并非AI应用的典型场景,但Own Company指出了其独特的优势:这些数据是按时间序列格式企业的、完整且最新的,并且得到了妥善保护。此外,Own Discover还强调了在历史悠久的SaaS数据中蕴藏着巨大的商业价值,例如可以用于销售和收入预测、客户流失预测等方面。鉴于Own Company与Salesforce的紧密合作关系,这一功能的应用前景尤为令人期待。目前,Own Discover已处于有限可用状态,我们将密切关注客户对这一创新功能的反应,以及他们如何借助这一功能实现快速且简便的AI应用成功。
对长期存储的需求
我们还需要关注存储归档介质本身。企业在大规模、低成本的对象存储方面如今有了更多的选择,无论是在本地还是云端。然而,随着主要的超大规模云服务商为选择离开这些平台的客户取消了出口费用,并且许多企业表示更愿意在本地保留其最有价值的数据,AI的发展可能会催生新的替代方案。
近年来,磁带成为了一个越来越受欢迎的选择。尽管有人可能认为磁带是一种过时的技术,但它在众多数据中心中,包括一些全球最大的计算环境中,仍然发挥着至关重要的作用。如果我们假设围绕冷数据或冷存储的AI机会将促使更多企业长时间保留更多数据,那么随着存储成本的不断攀升、功耗限制以及环境因素的考量,对成本效益高、规模大的长期存储需求也将日益增加。
为此,磁带提供商也积极应对,推出了更加集成的系统,将基于磁带的归档与基于磁盘的对象或文件存储系统相结合。例如,Spectra Logic的Glacier产品融合了该磁带厂商的BlackPearl文件和对象存储系统与Amazon S3 API的兼容性,适用于其系列磁带库。Spectra近期对他们的磁带库管理软件进行了全面升级,并推出了新的Spectra Cube磁带库。其目标是更直接地迎合那些可能没有现有磁带库技能储备、并且需要支持现代化云计算和AI应用程序的客户。
这些仅仅是我们遇到的少数最新示例,它们表明了冷数据长尾中蕴藏的巨大潜力。虽然在这一过程中可能会遇到各种挑战,尤其是监管方面的障碍,但发掘保留数据的新价值似乎蕴藏着巨大的可能性。
Source: Simon Robinson; Could AI be the killer app for cold data? 16 Apr 2024
--【本文完】---
近期受欢迎的文章:
更多交流,可添加本人微信
(请附姓名/关注领域)