`
ThinkInMyLife
  • 浏览: 47801 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

经验总结1

阅读更多

之前想查找用户id是否已经在我们的系统中出现,这时不想通过查数据库来判断,只能放在内存中快速判断

首先想到的是使用bloomFilter,进行hash4次,分别放入bloom的bit位,置1。由于bloomFilter是有误差在里面

所以为了降低误差率,采用1:8的桶,即10亿的用户需要10*8亿个bit位,误差率还有约2%

。。。。。。。。。。。。

改进:

有userid是数字,且不具有重复性,所以判断用户是否在系统的时候,

采用10亿的数组,uid当做下标数组,这样10亿个bit就行, 且无误差

 

 

.....................

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics