Bloom Filter备忘 - 乎悉 - ITeye博客

`

xbcoil

浏览: 123371 次
性别:
来自: 北京

最近访客更多访客>>

u012363178

xingxiaolin

LegendOfBush

gm1787485092

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

zhenglongfei：我在客户端设置了callback.setPassword(&q ...
CXF密码验证_服务端和客户端配置
赵武艺：写得太乱了，配置文件都分不清那是服务器端的，那是客户端的？麻烦 ...
WebService CXF+struts+spring 示例
smallvq123：好吧。。。你又转自了。。。
Spring的IoC(Inversion of Control)
smallvq123：楼主 iteye不让我发顶啊
Firebug进阶篇
wy8232255：问题解决了，谢谢
struts2.1.6中dojo配置ajax 解决 jsp页面ajax标签不能识别

Bloom Filter备忘

博客分类：

lucene

hash bloom filter

阅读更多

写这个纯属备忘,外加一点感悟.

Bloom Filter是一种去重的算法.

就是将庞大的需要去重的数据,进行Bloom Filter算法,首先新建一个庞大的数组a[],那么每条数据会按照hash算法,得到自己的hash值,然后在这个hash值为x的数组位置 a[x]标志为1,每个数据进行一次Bloom Filter,如果a[x]位置为1,那么表示已经有值,表示是重复数据.

完毕!

错误率就在: 庞大的数据hash值后肯定会有hash值相同的情况.

备忘:

hash值,hashtable貌似是同步的?

分享到：

vi编辑器 | Spring的IoC(Inversion of Control)

2011-10-10 16:49
浏览 989
评论(0)
分类:企业架构
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Bloom Filter概念和原理: Bloom Filter是一种空间效率很高的随机数据结构，它利用位数组很简洁地表示一个集合，并能判断一个元素是否属于这个集合。Bloom Filter的这种高效是有一定代价的：在判断一个元素是否属于某个集合时，有可能会把不...

bloomfilter.js, 使用FNV的JavaScript bloom filter快速散列.zip: bloomfilter.js, 使用FNV的JavaScript bloom filter快速散列 Bloom过滤器This过滤器实现使用非加密 Fowler-Noll-Vo散列函数来实现速度。用法var bloom = new BloomFilter( 32 * 256,//number of bits to all

BloomFilter及其应用综述: Bloom filter是一个简明的空间效率极高的随机的数据结构。用Bloom filter 表示 cache 内容 ,可以高效地实现cache 协作。本文对BloomFilter及其改进型进行了综述性分析，探讨了它的实用性。

分布式环境下改进的BloomFilter过滤技术: 分布式环境下改进的BloomFilter过滤技术

Bloom Filter of 2.5 Million common passwords: This is the bloom filter of 2.5 Million ... BloomFilter bf=new BloomFilter(); BitSet bitSet=bf.readBit(fileName); bf.setBits(bitSet); System.out.println(bf.exist("password")); } it will says true.

leveldb中bloomfilter的优化.pdf: leveldb中bloomfilter的优化。

bloom-filter-scala, 用于 Scala的Bloom过滤器，最快的JVM.zip: bloom-filter-scala, 用于 Scala的Bloom过滤器，最快的JVM Scala的 Bloom filter 概述Bloom过滤器是一种空间高效的数据结构，用于测试某个元素是否是集合的成员。 false 正匹配是可能的，但 false 负数不是。 ...

the original paper about bloom filter: Respect! The original paper about bloom filter. Very beginning of hash error tolerate algorithm to get wanted data faster.

shingling、simhash、bloom filter: 相似项发现主题中的shingling、simhash、bloom filter算法java实现，测试通过，附带测试数据。

论文研究-针对动态集的矩阵型Bloomfilter表示与查找.pdf: 提出一种针对动态集合的矩阵型Bloom filter表示与查找法（matrix Bloom filter，MBF），它使用一个s×m位矩阵对数据集合进行哈希表示与查找，较同类算法SBF和DBF，能继承Bloom filter算法常数查找开销的基本精髓。

bloom filter 相关论文资料: bloom filter的一些论文有综述，有应用，较为详细不过可能需要下载cnki的阅读器，这个比较好下，大家可以自己下个

bloom filter: bloom filter（布隆过滤器）应用很广泛的高效算法，研究研究

bloomFilter hash 函数 java: 这是一个java版的bloomFilter Hash函数集，并带有测试程序。在我的资源里还有一个c版的，函数功能相同，在我的应用中具有良好表现。

介绍Bloom Filter（布隆过滤器）原理、实现及具体应用: 介绍Bloom Filter（布隆过滤器）原理、实现及具体应用，包含9个不同PPT及PDF文档资料，对Bloom Filter感兴趣、想学习的同学可以下载查看下

带bloom filter 的c网络爬虫: linux下编写的网络爬虫，可以实现bloom filter 去重过滤，不过是用来垂直爬取www.8684.cn网站的。运行的时候请输入www.8684.cn

Java-BloomFilter, 在Java中，一个独立的Bloom过滤器.zip: Java-BloomFilter, 在Java中，一个独立的Bloom过滤器 java-bloomfilterJava bloomfilter是一个独立于Java的Bloom过滤器实现。它旨在在不需要额外库开销的情况下包含在现有项目中。第一个版本是由 Ian的博客条目...

BloomFilter源码: 基于bloomfilter的大规模网页去重，判断是否爬过URL

BloomFilter算法: C# 海量数据处理算法BloomFilter算法的实现和测试例子;C# 海量数据处理算法BloomFilter算法的实现和测试例子

bloomFilter 中的hash函数及测试程序: 该文档中包含 bloomFilter过滤器中用到的对于字符串进行hash的hash函数共十一个，并带有测试程序..

多字段矩阵型bloomfilter（支持砍维度）: 改良的bloomfilter，数据支持多字段，可只查询部分字段。创建时，可指定不存储的字段组合（用于节省空间）

Global site tag (gtag.js) - Google Analytics