博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
HashMap实现分析
阅读量:6408 次
发布时间:2019-06-23

本文共 2255 字,大约阅读时间需要 7 分钟。

  HashMap最基本的实现思想如下图所示,使用数组加链表的组合形式来完成数据的存储。

   

  Entry在数组中的位置是由keyhashcode决定的。

  向一个数组长度为16,负载因子为0.75HashMap中插入keyhashcode2612613371841231111的对象后的结构为:

  

  1%16 =1 337%16 =1。数组中存储的是最后插入的数据,并用next指针指向之前已经存在的数据。

  

  HashMap查找数据的依据是:现根据keyhashcode查找位于数组中的位置,在使用next依次遍历链表中的元素,调用keyequals方法,如果key equals Entry对应的key,则Entry中的value就是所找的值。所以使用对象作为HashMapkey时,重写hashcode方法的同时需要重写equals方法。

 

  可以参考HashMapget方法的代码,就会更清楚上面的描述:

public V get(Object key) {        if (key == null)            return getForNullKey();        int hash = hash(key.hashCode());        for (Entry
e = table[indexFor(hash, table.length)]; e != null; e = e.next) { Object k; if (e.hash == hash && ((k = e.key) == key || key.equals(k))) return e.value; } return null; }

  HashMap中的Hash算法是经过了优化之后的,可以看到

  int hash = hash(key.hashCode());对hashcode又进行了二次散列操作,这样做的目的是使得计算出的hashhashcode在数组上的分布将更为均匀,HashMap的空间利用率也越高。

  HashMaphashcode的二次散列如下: 

static int hash(int h) {        h ^= (h >>> 20) ^ (h >>> 12);        return h ^ (h >>> 7) ^ (h >>> 4);    }

  HashMap在使用hash计算位于数组中的位置时也不是简单的%操作,而是用的indexFor来完成的。%操作比较耗资源,当HashMap中数组的lengthn次方时,h& (length-1)运算等价于h%length,但是&%具有更高的效率。

static int indexFor(int h, int length) {        return h & (length-1);    }

  理解了二次散列和indexFor,上面的代码就比较的好理解了。table数组就是图中的Entry数组。

 

  HashMap可以存储keynullEntry,该Entry将被放在数组指标为0的位置。

  

  当HashMap中的元素越来越多的时候,hash冲突的几率也就越来越高,因为数组的长度是固定的。所以为了提高查询的效率,就要对HashMap的数组进行扩容,数组扩容这个操作也会出现在ArrayList中。最消耗性能的点就出现了:原数组中的数据必须重新计算其在新数组中的位置,并放进去,这就是rehash 

  那么HashMap什么时候进行扩容呢?当HashMap中的元素个数超过数组大小*loadFactor时,就会进行数组扩容,loadFactor的默认值为0.75,这是一个折中的取值。也就是说,默认情况下,数组大小为16,那么当HashMap中元素个数超过16*0.75=12的时候,就把数组的大小扩展为 2*16=32,即扩大一倍,然后重新计算每个元素在数组中的位置,而这是一个非常消耗性能的操作,所以如果我们已经预知HashMap中元素的个数,那么预设元素的个数能够有效的提高HashMap的性能。

  

  HashMap不是线程安全的,因此如果在使用迭代器的过程中有其他线程修改了map,那么将抛出ConcurrentModificationException,这就是所谓fail-fast策略。

  这一策略在源码中的实现是通过modCount域,modCount顾名思义就是修改次数,对HashMap内容的修改都将增加这个值,那么在迭代器初始化过程中会将这个值赋给迭代器的expectedModCount

  在迭代过程中,判断modCountexpectedModCount是否相等,如果不相等就表示已经有其他线程修改了Map

 

  modCount的修饰符为volatile,保证线程之间修改的可见性。

 

  HashSet的底层也是用HashMap来实现的,使用HashMapkey来进行存储与散列。

 

转载于:https://www.cnblogs.com/lnlvinso/p/4601105.html

你可能感兴趣的文章
vim配置
查看>>
ubuntu 把软件源修改为国内源和更新
查看>>
随机产生四则运算,导入导出文件
查看>>
位运算符
查看>>
winform自定义控件
查看>>
C#编码好习惯
查看>>
避其锋芒,侧翼出击。——司马亮创业回忆录(一)
查看>>
scope
查看>>
一起谈.NET技术,晚绑定场景下对象属性赋值和取值可以不需要PropertyInfo
查看>>
一起谈.NET技术,.Net Framework源代码中的模式之Prototype(原型模式)
查看>>
[shell 命令] find 查找文件
查看>>
windows下启动mysql服务的命令行启动和手动启动方法
查看>>
VTK三维点集轮廓凸包提取
查看>>
【概率论与数理统计】小结9-3 - 区间估计
查看>>
Golang性能调优入门
查看>>
sqlloader外部表
查看>>
golang笔记——数组与切片
查看>>
屏蔽可忽略的js脚本错误
查看>>
散文分享
查看>>
【Vue】vue.js常用指令
查看>>