七、哈希表(Hash Table)及散列法(Hashing) 数组的特点是:寻址容易,插入和删除困难;而链表的特点是:寻址困难,插入和删除容易。那么我们能不能综合两者的特性,做出一种寻址容易,插入删除也容易的数据结构?答案是肯定的,这就是我们要提起的哈希表,哈希表有多种不同的实现方法,我接下来解释的是最常用的一种方法——拉链法,我们可以理解为“链表的数组”,如图:
元素特征转变为数组下标的方法就是散列法。散列法当然不止一种,我下面列出三种比较常用的。 1,除法散列法 2,平方散列法 3,斐波那契(Fibonacci)散列法 平方散列法的缺点是显而易见的,所以我们能不能找出一个理想的乘数,而不是拿value本身当作乘数呢?答案是肯定的。 1,对于16位整数而言,这个乘数是40503 这几个“理想乘数”是如何得出来的呢?这跟一个法则有关,叫黄金分割法则,而描述黄金分割法则的最经典表达式无疑就是著名的斐波那契数列,如果你还有兴趣,就到网上查找一下“斐波那契数列”等关键字,我数学水平有限,不知道怎么描述清楚为什么,另外斐波那契数列的值居然和太阳系八大行星的轨道半径的比例出奇吻合,很神奇,对么? 对我们常见的32位整数而言,公式: 如果用这种斐波那契散列法的话,那我上面的图就变成这样了:
不过我们要注意了,前面提到的都是针对整数的散列法,那如果不是整数呢?下面给出一些参考算法,我把其它类型的数据转变为32位整数,之后的处理前面已经说了。 1,浮点数的散列法 unsigned int HashingDouble(double d)
{ if (d==0) return 0; else { int exponent; double mantissa = frexp(d, &exponent); return (unsigned int)((2*mantissa-1) * (~0U)); } } 2,字符串的散列法 unsigned int HashingString(char *str, int iLen)
{ unsigned int hsval = 2654435769; int i; int iShift = 0; for(i=0; i<iLen; i++) { hsval ^= (str[i]<<iShift); iShift+=3; if(iShift>24) iShift=0; } return hsval; } 方法就提供那么多,遇到别的情况,比如说Unicode字符串,随机应变吧! |
|