查看原文
其他

16款开源大数据数据库:总有一个适合你

2016-01-20 云头条

如今,开源大数据数据库应用广泛,本文介绍了其中一些最值得关注的例子。




你在下面看到的这些数据库和数据仓库是大数据领域真正的主力军。它们保存并帮助管理数量庞大的结构化数据和非结构化数据,因而让用户有可能借助大数据工具来挖掘洞察力。许多公司高度依赖这些开源解决方案,从Cassandra(最初由Facebook开发)之类的工具,到颇受好评的MongoDB(旨在支持最繁重的大数据负载),不一而足。许多工具在迎接挑战:比如说,OrientDB每秒可以存储多达150000个文档。众多企业组织在依赖这些开源数据库,从波音、康卡斯特到丹麦政府,不一而足。准确地说,与其他工具一样,本文介绍的这些软件在如今的全球商业市场扮演着核心角色。


Cassandra



  • 这个NoSQL数据库最初由Facebook开发,现在由Apache基金会加以管理。许多拥有庞大活动数据集的企业组织在使用它,包括网飞(Netflix)、Twitter、Urban Airship、Constant Contact、Reddit、思科和Digg。可以通过第三方厂商获得商业支持和服务。

  • 支持的操作系统:与操作系统无关。

  • 相关网站:http://cassandra.apache.org


HBase



  • 作为另一个Apache项目,HBase是面向Hadoop的非关系型数据存储仓库。功能特性包括:线性及模块化扩展性、高度一致的读取和写入性能、支持自动故障切换等等。

  • 支持的操作系统:与操作系统无关。

  • 相关网站:http://hbase.apache.org


MongoDB



  • MongoDB旨在大型数据库。它是一款NoSQL数据库,具有以下特性:面向文档的存储、完全索引支持、复制和高可用性等。可以通过10gen获得商业支持。

  • 支持的操作系统:Windows、Linux、OS X和Solaris。

  • 相关网站:https://www.mongodb.org


Neo4j



  • Neo4j号称是“全球领先的图形数据库”,声称性能比关系型数据库至少提升1000倍。有兴趣的企业组织可以向Neo Technology公司购买高级版或企业版。

  • 支持的操作系统:Windows和Linux。

  • 相关网站:http://neo4j.com


CouchDB



  • CouchDB是为万维网设计的,它将数据存储在JSON文档中,你可以通过万维网来访问,也可以使用JavaScript来查询。它提供了分布式扩展功能,具有容错存储机制。

  • 支持的操作系统:Windows、Linux、OS X和安卓。

  • 相关网站:http://couchdb.apache.org


OrientDB



  • 这款NoSQL数据库每秒可以存储多达150000个文档,在短短几毫秒内加载图形。它集文档数据库的灵活性和图形数据库的强大功能于一身,同时支持ACID(原子性、一致性、隔离性和持久性)事务和快速索引等特性。

  • 相关网站:http://orientdb.com


Terrastore



  • Terrastore基于Terracotta,声称拥有“可扩展性和弹性方面的高级功能,又不牺牲一致性”。它支持自定义数据分区、事件处理、下推谓词(push-down predicate)、范围查询、map/reduce查询和处理以及服务器端更新等功能。

  • 支持的操作系统:与操作系统无关。

  • 相关网站:https://code.google.com/p/terrastore/


FlockDB



  • 作为大名鼎鼎的Twitter数据库,FlockDB旨在存储社交图谱(即谁在关注谁以及谁在屏蔽谁)。它提供了横向扩展功能和非常快的读取及写入速度。

  • 支持的操作系统:与操作系统无关。

  • 相关网站:https://github.com/twitter/flockdb


Hibari



  • Hibari被许多电信公司所使用,这是一种键值大数据存储系统,具有很强的一致性、高可用性和出众性能。可以通过Gemini Mobile获得支持。

  • 支持的操作系统:与操作系统无关。

  • 相关网站:http://hibari.github.io/hibari-doc/


Riak



  • Riak谦虚地自称是“可以部署到生产环境的功能最强大的开源分布式数据库”。”用户包括:康卡斯特、Yammer、Voxer、波音、SEOMoz、Joyent、Kiip.me、DotCloud、Formspring、丹麦政府和其他许多公司。

  • 支持的操作系统:Linux和OS X。

  • 相关网站:http://basho.com/products/


Hypertable



  • 这款NoSQL数据库提供了高效率和出色性能,因而相比类似数据库,可以节省成本。代码是百分之百的开源代码,不过还提供收费支持。

  • 支持的操作系统:Linux和OS X。

  • 相关网站:http://www.hypertable.org


Blazegraph



  • Blazegraph之前名为“Bigdata”,这是一款高度可扩展的高性能数据库。它既有采用开源许可证的版本,也有采用商业许可证的版本。

  • 支持的操作系统:与操作系统无关。

  • 相关网站:https://www.blazegraph.com


Hive



  • 作为Hadoop的数据仓库,Hive有望易于汇总数据,并易于对大数据执行即席查询及其他分析。至于查询,它使用了一种名为HiveQL的类似SQL的语言。

  • 支持的操作系统:与操作系统无关。

  • 相关网站:http://hive.apache.org


Infobright社区版



  • 这种可扩展的数据仓库支持多达50TB的数据存储仓库,并提供了“领先市场”的数据压缩比(高达40:1),以提升性能。基于同一技术的商业产品可以在InfoBright.com找到。

  • 支持的操作系统:Windows和Linux。

  • 相关网站:http://www.infobright.org


Infinispan



  • 来自JBoss的Infinispan自诩是一种“扩展性极强、高度可用的数据网格平台”。它基于Java,专门为多核架构设计,提供了分布式缓存功能。

  • 支持的操作系统:与操作系统无关。

  • 相关网站:http://infinispan.org


Redis



  • VMware主持开发工作的Redis提供了一种内存键值存储系统,可以保存到磁盘以获得持久性。它支持许多最流行的编程语言。

  • 支持的操作系统:Linux。

  • 相关网站:


云头条编译|未经授权谢绝转载


大数据群欢迎你的加入,群主微信:aclood



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存