哈希总结_读书人

哈希小结? 上学期就已经学过hash表，最近又将hash重看了一遍，以前只是稍微了解一下hash表的表皮知识，这次对

哈希小结

? 上学期就已经学过hash表，最近又将hash重看了一遍，以前只是稍微了解一下hash表的表皮知识，这次对

hash的代码有了一点的了解，上了一个档次啊，(*^__^*) 嘻嘻……

? ?今日这篇博客，觉得很肤浅，基本上都是理解而已，我现在还没有把hash剖析，我很想把它搞的更深一点再

写，但已经好久没有写关于java的博客了，这叫我感觉自己没有干啥事似的，更何况接下来半个月也不能专注这

个，半个月后可能就没有感觉了，还是决定记下现在的东西，毕竟写博客是很让我头疼的事情，映像会更加深刻

吧。

一.定义

1 何为hash表？

? ?哈希（hash）表是一种表，该表中存储的关键字是由hash函数和处理冲突的方法映射的，存储的地址为hash地

址或散列地址，这一映像过程为散列，或哈希造表。

2. 何为哈希函数？

? ? ?哈希函数就是一种关系f，是关键字与其在哈希表中存储位置的一种确定的对应关系。

3. 冲突

? ? 对不同的关键字，通过哈希函数映射后，可能会得到相同的哈希地址，这就产生了哈希冲突。产生冲突的关键

字叫做同义词。

二.哈希函数的构造方法

1. 直接定址法：关键字或关键字的某个线性函数值就是哈希地址。

适合：地址集合大小=关键字集合大小

2. 数字分析法：取关键字的若干数位组成哈希地址

? 适合：预先估计出全体关键字的每一位上的均匀位数或若干数位

3. 平方取中法：取关键字平方后的中间几位为哈希地址

适合：关键字中的每一位都有某些数字重复出现频度很高的现象

4. 折叠法：将关键字的若干位数分成相同的几部分（最后一部分可以不同），然后将这几部分叠加（舍去进

位）求的和，作为哈希地址。

适合：关键字位数很多，且关键字中的每一位上数字分布较均匀

5. 除留余数法：关键字被某个不大于表长的数字p整除后的余数为哈希地址

6. 随机数法：取关键字的随机函数值为哈希地址

适合：关键字长度不等时

三. 处理冲突方法

1. 开放地址法

Hi=(H(key)+d)MODm ? i=1,2,...k(k<m)

H(key)为哈希函数，m为表长，d为增量序列

d的取法：

①线性探测再散列 d=1,2,...,m-1

②二次探测再散列 d=12，-12，22，-22，32，-32，±k2,(k ≤ m/2)

③伪随机探测再散列，d=伪随机数序列

2. 再哈希法：在产生冲突时，计算另一个哈希函数，直到冲突消除为止

Hi=RHi(key)i=1,2,...k

RHi(key)是不同的哈希函数

优点：不易产生关键字"聚集"

缺点：增加了计算时间

3. 链地址法：将关键字为同义词的存储在同一个线性链表中

4. 建立一个公共溢出区：将发生冲突的关键字放进溢出表

四. HashMap:受初始容量和加载因子的影响

默认的为0.75,这利于节省内存，但影响了查找速度

? ? ? 我将HashMap的加载因子改成0.8后，在100000个数据中的其中一组查找速度快了15ms(放入的关键字数

据是随机获取的),我用除留余数法和链地址法建的哈希表比加载因子为0.75的HashMap查找快31ms，但如此建

表比较耗时间。

? ? ? ?当关键字数量超过了加载因子和初始容量的乘积时，要进行rehash，重构hash表：增大hash表的容量（可

以增加倍数）和将原hash表中的数据要重新放到新的hash表中。