秘籍!星环科技图数据库StellarDB带你释放数据的洪荒之力
近日,图数据库厂商Neo4j宣布企业版闭源的消息,互联网圈为此掀起一股讨论热潮。图数据库有着何种魅力,引得如此广泛的关注?俗话说,一图值千字,图数据库通过点和边简化数据关联关系的表示,而不是像传统关系型数据库那样,人为地将数据打散再重新组织,从这一点上来说,图数据库才是真正的关系数据库。在图数据库中,点和边的关系其实是数据最自然的存在状态,因此更适合进行大数据分析。
人工智能时代的新宠儿
图数据库应对的是当今一个宏观商业世界的大趋势:凭借高度关联的数据中复杂而动态的联系获得洞察力并赢得竞争优势。无论我们想了解的是客户之间的联系,电话或数据中心网络元素之间的联系,还是基因和蛋白质之间的联系,都会涉及大量的高度关联的数据。这些数据又会构成庞大的图,而理解和分析这些图的能力将成为公司在未来的核心竞争力。对于任何达到一定规模或价值的数据,图数据库都是呈现和查询这些关联数据的最好方式。
下图显示了不同类型数据库的热度趋势(来源于著名的数据库排名网站DB-Engines),不难发现,从2014年起,图数据库的热度就超越了其他类型数据库,到2018年,热度已是第二名Search Engines的两倍。
从计算机技术的发展情况来看,图数据库热度的增长轨迹和大数据以及人工智能的普及发展相吻合。与传统基于关键字的搜索相比,基于图的搜索更智能化,允许用户指定更细致的搜索条件,返回数据之间的关联关系。借助于图在关联关系上的天然优势,图数据库相关的产品在金融、公安、电信等领域大放异彩。
知识图谱是图数据库一个非常典型的应用,2012年由Google首次提出,用于理解用户输入意图,查询复杂关联信息,改进搜索质量。知识图谱在NLP技术的助力下,从海量的非结构化数据中挖掘有效实体,通过归一、融合,形成通用知识图谱和行业知识图谱。以金融行业反欺诈业务为例,将资产、征信、消费记录等不同来源、不同格式的数据整合起来,综合运用语义理解、知识挖掘、知识整合等技术,提炼出高精度的实体和关系,可以有效地识别出欺诈案件(如身份造假、互相担保等)。
星环科技图数据库StellarDB
星环科技凭借其敏锐的市场感知力,在创司之初就开始对图数据库投入研发力量。闭门修炼多时,目前星环科技的图数据库产品Transwarp StellarDB已相当成熟,在金融反欺诈、威胁情报、黑产打击和案件溯源等业务上显示自身的洪荒之力。
相比于Neo4j等单机系统,StellarDB是一款为企业级图应用打造的分布式图数据库。作为一款面向未来丰富应用的图数据库,StellarDB能够满足市场对海量图数据的存储和查询需求,并具备以下技术亮点:
计算引擎为StellarDB提供了强大的数据处理功能,解决用户复杂路径查询的痛点,并提供毫秒级查询能力;
存储引擎能够轻松存下海量图数据,同时允许用户实时增加、删除和修改数据;
采用精巧的存储格式和高效的压缩算法,千亿级别关联数据的存储不再成为难题;
数据存储多个副本,并基于分布式一致性协议Raft保证系统的容错性能和高可用;
除此之外,StellarDB在存储和查询性能上表现优异。在4台Intel Xeon E5-2620 v3 CPU,128GB内存,4T SATA硬盘的环境下,使用LDBC社交网络测试基准(http://ldbcouncil.org/developer/snb)进行测试。StellarDB的插入性能可以达到43万条/秒,查询的QPS达到3700次/秒,95%的查询延迟低于7ms。
未来机遇和挑战
在技术领域,高性能的计算设备已经不是问题,数据量也足够大,如果还是沿用传统的计算模型和工具,是不可能跟上人工智能时代发展的脚步的。只有建立基于图的分析系统,才能找到隐藏在数据背后的关联,更好地挖掘数据的价值,实现商业价值最大化。
Gartner在2018年的《5 Trends Emerge in the Gartner Hype Cycle for Emerging Technologies》新兴技术报告中,将知识图谱列入了创新爆发列表。可以预见,知识数据量会迎来爆炸性增长。而作为存储平台的图数据库,必然会面临更大的数据存储量、更快的查询需求、更高的并发需求以及更复杂的查询模型。
面对这么多挑战,星环科技又将给大家带来什么样的秘籍?敬请期待!
点击或回复关键词,查看相关内容
公司
产品
产品 | 星环的划时代版本-Transwarp Data Hub 5.0
认证考试 | 数据中心联盟—星环联合认证体系首次认证考试报名中
技术
白话大数据 | 白话大数据合集
深入机器学习 | 深入机器学习系列合集
案例
银行 | 中国银行:大数据在银行领域的应用与实践
智能金融 | 星环科技发布证券业大数据战略规划纲要(白皮书)
运营商 | 运营商的新方向-运用Hadoop技术将大数据资产变现
视频监控 | Hadoop在实时视频监控的应用场景