VAST Data理念:构建思考机器的探索
起源
VAST一直秉持着一个貌似简单的理念:如果我们能够赋予计算机自主思考和发现的能力,会发生什么呢?
若计算机具备独创性思维的能力,发现的过程,这一过程自人类文明早期以来一直是推动所有人类进步的引擎,将会显著加速。我们有望构建革命性的人工智能能力,远远超越我们自身的潜能,解决世界上最重大的问题,推动人类前进。
当我们的创始人于2016年创建VAST Data时,这就是他们构想的未来。那时,人工智能计算的进展基本上仅限于使用上世纪60年代的神经网络识别YouTube视频中的猫。
如今,类似的神经网络推动着生成式人工智能模型,如ChatGPT或Bard。
我们对神经网络如何模仿人脑的过程仍了解不完全,但我们已经认识到,将这些机器学习模型与丰富的数据结合起来,可以在广泛的应用和业务功能中创造价值。
释放人工智能的真正潜力
然而,ChatGPT和人工智能语言模型并非用于发现事物或生成新思想的工具。它们无法与自然界互动。虽然它们是实用的工具,但生成的文本、图像和视频都是基于从互联网中输入的信息。这已经远远超越了仅仅识别猫的水平,但离治愈癌症的目标依然遥远。
人工智能的真正潜力远远超越了我们迄今为止所见。要实现这一潜力,就必须对传统的数据管理概念和预设进行彻底地重新思考。
由人工智能驱动的发现和深度学习远远超越了处理非结构化数据(如文档、图像或文本)的范畴。它涉及处理来自传感器、基因测序仪、视频源或自动驾驶车辆等现实世界的模拟数据,将其解释为人类知识体系的一部分,并与我们尚未想象到的思想建立联系。
机器还需要相互学习。就像人类之间的合作推动了比个体独自工作更好的结果一样,计算机通过相互作用学习。例如,谷歌DeepMind通过让其AlphaGo计算机程序与自身进行数千次对弈来优化其神经网络,每次都从错误中吸取教训。正如我们已经见证了数千年的那样,知识建立在知识之上,以加速发现的步伐。
我们认为,一个为神经网络提供对这种自然数据以惊人的速度和规模进行广泛访问的数据平台,将提供比迄今为止所见更为复杂的人工智能。随着数据集变得更大、算法变得更智能,以及处理器变得更强大,自我发现的计算机——思考机器——将不再仅仅是科幻。
引领下一代AI基础设施
这是VAST成立的初衷,也是我们构建“VAST数据平台”的原因。我们选择从存储基础设施入手,因为数据是推动人工智能和深度学习的基础。通过打破困扰存储IT几十年的架构和业务权衡,我们提供了一个可扩展的非结构化数据架构,消除了存储分层,并实现了对所有数据的快速访问。
然而,存储只是开始。VAST一直以来都是一家专注于人工智能数据平台的公司。
今天,我们推出了一个全新平台,扩展了VAST DataStore(原名通用存储)的功能,并引入了两个新组件:VAST DataBase(为VAST DataStore中的非结构化数据添加结构)和VAST DataEngine(为这个新时代提供计算框架)。这些概念一起构建了一个统一的环境,用于采集、存储、编目、处理和查询大量结构化和非结构化数据。
最为重要的是,VAST DataSpace将全局范围内的数据连接在一起,使得模型能够访问并从组织内全部信息的整体中学习。这也让我们的客户牢牢地掌握在手中,使他们能够根据自身需求使用AI,而非为外部利益服务。
民主化数据是我们的使命。将每个企业转变为“以AI为先”的数据枢纽,需要民主化对基础设施的访问,以存储大规模数据集并执行数据驱动的算法。这将把权力和能力从当前通过掌控宝贵数据主导AI的少数人手中分散出去。
如今,任何考虑进行任何类型的AI实践,尤其是规模宏大的组织,都需要三个关键要素:
由最终用户开发的AI应用 由VAST提供的存储、数据库和计算引擎服务构成的软件基础设施堆栈 来自NVIDIA等公司的硬件
随着我们的客户迈向构建大规模AI集群的探索,我们相信VAST将成为为他们提供所需自由的数据平台,使他们能够在这个新的AI时代重新构思与数据的互动,而不受陈旧基础设施限制的束缚。
这一愿景从VAST创立之初就一直存在,而今我们正在将这一愿景变为现实。
---【本文完】---
近期受欢迎的文章:
我们正处于数十年未见之大机遇中
新技术爆发式发展,催生新产品
然而,颠覆式创新并非简单的技术堆叠
而是异常复杂的系统工程
需要深度洞察
欢迎一起分享思考和见解