查看原文
其他

使用基于 Redis 的 Java 布隆过滤器

The following article is from ImportNew Author ImportNew

(给数据分析与开发加星标,提升数据技能

转自:ImportNew

布隆过滤器是一种概率数据结构,用来高效地测试集合中是否存在某个元素。使用布隆过滤器有助于减少在磁盘中查找键值的次数,从而降低开销。


在Java开发中,可以使用各种现成的布隆过滤器,包括Google出品的Guava BloomFilter类。


Redis是一款开源内存数据结构存储,可用来实现NoSQL数据库。但是,Java与Redis默认实现不兼容。


Java开发者必须通过Redis Java客户端才能访问类似布隆过滤器这样的功能。本文将讨论如何通过Redisson(一款Redis Java客户端)在Java和Redis中使用布隆过滤器。


通过Redisson在Redis和Java中使用布隆过滤器


Redisson是一款超快速轻量级Redis Java客户端,提供了许多常用的Java对象和功能,包括布隆过滤器。


下面的示例代码演示了如何用Redisson的RBloomFilter接口使用布隆过滤器:


RBloomFilter<SomeObject> bloomFilter = redisson.getBloomFilter("sample");
// 初始化布隆过滤器
// expectedInsertions = 55000000
// falseProbability = 0.03
bloomFilter.tryInit(55000000L, 0.03);

bloomFilter.add(new SomeObject("field1Value", "field2Value"));

bloomFilter.add(new SomeObject("field5Value", "field8Value"));


bloomFilter.contains(new SomeObject("field1Value", "field8Value"));

bloomFilter.count();


布隆过滤器是一种概率数据结构:能确认元素不存在于集合中,但只能提供元素出现在集合中的概率。falseProbability参数定义了使用给定RBloomFilter发生误报的概率。


expectedInsertions参数定义了每个元素的预期插入次数。RBloomFilter对象最多支持2 ^32 bit。


Redisson还能通过RClusteredBloomFilter接口在Redis中支持分布式布隆过滤器。RClusteredBloomFilter的内存效率更高,可以缩小所有Redis节点使用的内存。RClusteredBloomFilter对象最多支持2^64 bit。请注意,RClusteredBloomFilter只支持Redisson集群模式使用。


以下示例代码演示了如何使用RClusteredBloomFilter接口:


RClusteredBloomFilter<SomeObject> bloomFilter = redisson.getClusteredBloomFilter("sample");
// 初始化布隆过滤器
// expectedInsertions = 255000000
// falseProbability = 0.03
bloomFilter.tryInit(255000000L, 0.03);
bloomFilter.add(new SomeObject("field1Value", "field2Value"));
bloomFilter.add(new SomeObject("field5Value", "field8Value"));
bloomFilter.contains(new SomeObject("field1Value", "field8Value"));


就是这样!


推荐阅读  点击标题可跳转
使用 Redis 和 Spring Boot 执行异步任务
Redis从入门到精通,至少要看看这篇!
学 Redis ,至少要看看这篇!7000 字小结


看完本文有收获?请转发分享给更多人

关注「数据分析与开发」加星标,提升数据技能

好文章,我在看❤️

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存