其他
杨成虎:存储&计算是过去,记忆&推理才是未来
The following article is from Fabarta Author 杨成虎
企业智能中的 Large Model 与 Knowledge
Data Centric LLM
数据的私有性、安全性和可控性:数据存储于多模态数据库中,数据库具有完备的数据管理安全能力。而不是存储于大模型中,数据读取不受控。 自然语言识别能力:数据洞察能力具备智能化, 不仅实现了自然语言查询与查询生成, 还可以作为数据补充的辅助; 结果可解释性和追溯性:数据结果并不直接来自大模型,而是通过大模型构建中间查询计划,再通过数据库执行对应的查询计划与一定的数据整合能力而产生数据结果。在整个过程中,查询计划可固化、可追溯、可调优。
多模态智能引擎 ArcNeural
Graph HTAP:我们为用户提供了统一支持的高性能实时查询,并同时具备弹性的 AP 和 TP。不同于传统企业采购 Graph 时需要分别购买 TP 和 AP 两套系统,我们为您提供了一个一体化的 TP/AP 一体解决方案; 多引擎支持:我们不仅支持图数据引擎,还支持向量化引擎。通过插拔式引擎设计让我们能同时处理多种数据模态; 云原生架构:新一代数据库的显著特点,实现了存储和计算的分离。其中,蓝色主体部分代表我们的计算节点,而数据则存储在分布式共享存储上。这种存储方式既可以基于 OSS 存储,也可以采用其他分布式块存储,确保了存储与计算的分离弹性;
多模态智能引擎 ArcNeural:存储层的架构
多模态智能引擎 ArcNeural:HTAP Graph 技术
多模态智能引擎 ArcNeural:Serverless 技术
多模态智能引擎 ArcNeural:混合多模态存储(Vector Column Type)
使用 SIMD 进行距离计算加速,与传统方式相比,我们的方法可以提高 4 倍的性能。 支持属性过滤的向量检索功能,同类系统只能进行纯向量检索,而不能进行其他字段(标量)的联合检索。 通过原有图技术沉淀,我们在向量数据模型上也实现了完整的 CRUD 和 ACID 功能。
多模态智能引擎 ArcNeural:混合多模态查询(One Query)
ArcNeural 2.1 版本核心特征
多模态:我们的引擎支持多种数据格式,包括图数据、向量数据、JSON 以及传统的 Table 数据结构; 企业级数据管理:ArcNeural 提供完整且严谨的数据 ACID 处理能力,技术特色还包括内存引擎技术和多跳并行化处理; 企业级交付方面:除了支持云原生的弹性部署,我们的解决方案还适应于分布式系统、银行的多地多中心等高级要求,并且支持模块化部署,可以根据需要进行个性部署; 国产化:我们深感自豪地宣布,ArcNeural 完全满足国内的生产要求。从代码的完全可控性到对国产硬件的完美适配。在系统内核研发方面,我们使用现代编程语言 Rust 编写。最后,ArcNeural 支持面向合作企业和伙伴开源。
『一体两翼』产品矩阵
左翼 - ArcFabric:关注数据的生产 数据治理和数据资产:这两个模块主要对企业数据进行管理、元信息抽取,甚至补充; 产生的显式关系:例如结构化数据的血缘关系,这部分数据会存储在我们的图引擎中; 产生的隐式关系:例如非结构数据的内容关联,这类数据则会存入向量引擎表达; 右翼 - ArcPilot:关注数据的消费 低代码平台和用户交付:使得数据的消费变得更为便捷; 数据智能平台和知识中心:为企业提供强大的数据分析能力和知识存储;
企业智能 IT —— Arc42
演示 1 :图+向量解决模型幻觉问题
演示 2:图+多路召回帮助答案更精准
往期优质文章推荐
往期推荐