C#代码
- BloomFilter中文布隆过滤器,主要应用于消重和拼写检查,以上实例实现了一个针对字符串重复检查的过滤器,具体碰撞概率跟内存分配大小及HASH函数有关,可通过增加HASH函数次数或增加内存分配来减小碰撞,具体测试方式可参考测试代码。
- 其算法主要是通过整块的内存申请,得到线性的连续空间,该空间所有位置上默认状态为0,对待测试重复的对象HASH后取模,模数为内存块的大小以控制取模后的值范围在内存可分配范围内,取模的值对应位置上改变状态为1,通过对测试对象重复前面的HASH 取模 对应位置改变状态为1的方式来保存对象在空间内的状态,如有测试对象所有对应空间位置的状态为1则可判断该对象存在重复。 <DIV class=editmark>[Last Modified By King, at 2008-03-07 15:40:57]</DIV>
C#代码
-
C#代码
-
|