HashMap的实现原理，源码深度剖析！

01：并发编程

专题目标

系统掌握 Java 多线程和并发编程的技术原理和知识点，写出优秀的并发代码
熟练应用各种并发工具，了解在什么情况下使用哪些具体的技术和方法
分掌握常见的多线程和并发问题分析技巧，知道排查一般问题的具体步骤
构建完整全面的并发编程知识体系，以及常见的面试问题和技巧
精通Java并发编程，彻底掌握 Java 并发编程知识。

详细内容

操作系统的发展历程
多线程、纤程、协程
硬件内存架构
并发和并行
CPU和高速缓存
缓存一致性
指令重排
支撑Java内存模型原理
Volatile的实现源码剖析
内存屏障
经典的单例的双重检测源码剖析
AQS的设计和结构
AQS源码深度剖析
线程通信与状态流转
Synchronized的实现原理及应用
Synchronized锁的膨胀升级过程分析
乐观锁、悲观锁、重入锁、公平锁、非公平锁及锁的粒度详解
ReentrantLock源码深度剖析与实战
可重入锁原理、获取锁和释放锁
ReentrantReadWriteLock源码深度剖析与实战
Condition 条件队列
线程池核心原理
线程池核心参数、拒绝策略、任务流程详解
线程池ThreadPollExecutor
阻塞与非阻塞队列详解
CountDownLatch源码深度剖析与实战
Semaphore源码深度剖析与实战
CyclicBarrier源码深度剖析与实战
ArrayBlockingQueue源码深度剖析
ConcurrentLinkedQueue 源码深度剖析
PriorityBlockingQueue 源码深度剖析
并发Atomic原子
死锁解决方案
CAS算法乐观锁
CAS的ABA问题
ThreadlLocal源码深度解析
ThreadlLocal数据隔离
ThreadlLocal内存溢出
ForkJoin原理解析

02：Java实力筑基

专题目标

扎实的java编程基础
精通JDK 集合、泛型、并发容器
精通反射、类体系等方面的运用
掌握Java NIO网络通信

详细内容

集合容器

Map、List与Set详解
HashMap源码深度剖析
HashMap的数据结构、存储、哈希函数
哈希冲突、get、put源码剖析
HashMap必考点总结
Collections.SynchronizedMap源码剖析
ConcurrentHashMap JDK1.7源码剖析
ConcurrentHashMap JDK1.8源码剖析
ArrayList、LinkedList、CopyOnWriteArrayList的实现原理
阻塞队列的实现原理与应用
非阻塞队列的实现原理与应用
ConcurrentLinkedQueue源码深度剖析
ArrayBlockingQueue源码深度剖析
深入LinkedBlockingQueue实现原理

反射泛型

反射机制
内置Class实例
反射实战
反射与框架结合源码案例
Java自动装箱拆箱
泛型的实现原理
泛型的类型擦除

NIO技术详解

BIO NIO AIO详解
Java NIO实现原理
多路复用
FileChannel
SocketChannel
ServerSocketChannel
Buffer
Selector
NIO源码实战

03：JVM虚拟机

专题目标

掌握JVM内存模型
掌握各类JVM GC 算法的原理
掌握 GC 日志、线程、内存等维度的分析技巧
掌握常见的JVM面试问题和技巧
精通JVM调优

详细内容

深入JVM类加载的7个阶段
类加载器双亲委托机制
JVM加载源码案例详解
JVM整体结构
JVM运行时数据区
JVM堆内存结构
JVM方法区
JVM虚拟机栈
JVM程序计数器
JVM源码案例详解
类字节码文件深度剖析
方法表集合：描述方法
JVM垃圾回收机制
GC判断策略
标记-清除算法
标记-复制算法
标志-整理算法
分代收集算法
垃圾回收算法必考点总结
JVM垃圾收集器
JVM收集器类别
Serial 串行收集器
Parallel并行收集器
CMS G1并发收集器
ZGC并发收集器
JVM垃圾收集器必考点总结
JVM性能优化
性能调优思路
JVM内存泄漏
JVM性能调优目标
JVM调优参数详解
JDK自带Jstat、Jinfo、Jmap、Jhat及Jstack调优命令详解
Jvisualvm、Jconsole调优工具详解
JVM性能调优实战
JVM内存溢出实战

04：MySQL数据库

专题目标

精通MySQL数据库设计
掌握索引、事务、存储引擎等底层原理
优秀的SQL编写以及调优能力
全面掌握MySQL的底层实现机制
全面了解熟悉分库分表、读写分离、主从复制架构

详细内容

MySQL索引原理
MySQL索引类别
MySQL索引数据结构
MySQL B+树索引实现
MySQL 聚集索引和非聚集索引
MySQL MyISAM与InnoDB的索引实现
事务隔离级别
事务的ACID
脏读
不可重复读
幻读
Mysql锁
乐观锁悲观锁
读锁写锁表锁行锁间隙锁
死锁以及优化解决
MySQL架构&SQL查询执行原理
mysql系统架构
mysql逻辑架构
连接器详解
分析器详解
优化器详解
执行器详解
InnoDB存储引擎架构
Buffer Pool
WAL crash-safe
Redo Log
Bin Log
SQL更新全过程解析
两阶段提交
分布式数据库
分库分表、垂直拆分、水平拆分
主从复制、读写分离
MVCC实现原理
MVCC与隔离级别的关系
MVCC涉及的锁机制
快照读/一致性读
Undo Log版本链
Read View读视图

05：性能优化

专题目标

掌握常见的性能优化方案
掌握MySQL性能优化步骤与工具
精通数据库性能调优

详细内容

索引优化攻略
慢查询优化方案？
索引军规有哪些？
怎样做索引优化？
哪些会造成索引失效？
索引优化的级别
Explain执行计划
explain的介绍
explain的作用
explain重点关注
explain详细用法
explain最全实战案例讲解
核心参数优化
MySQL架构
Innodb架构
日志写过程
优化的目标
参数优化维度
核心参数详解
数据库架构优化
CDN基站
分布式缓存
分库分表
读写分离
性能优化实战
慢查询的标准定义
慢查询相关参数
慢查询 SQL 语句的常见原因
explain慢SQL分析
show profile查询
SQL语句调优实战
JVM性能调优实战

06：框架源码剖析

专题目标

掌握框架源码阅读的方法和技巧
主流开发框架的实现原理
深入理解框架背后的核心思想

详细内容

IOC实现原理
IOC耦合关系
IOC控制反转
IOC的底层实现
IOC的整体架构
IOC的源码案例
IOC的源码剖析
Bean生命周期
为什么Spring的作者要这样设计Bean？
Spring Bean生命周期的核心流程有哪些?
Spring Bean 核心流程用了什么核心技术？
Spring Bean 实现为什么要加入繁琐的流程？
Spring AOP的实现在Bean生命周期的哪个阶段？
Spring Bean生命周期源码Debug全流程讲解
什么是循环依赖
循环依赖会造成什么问题？
Spring循环依赖有哪些种类？
如何解决Spring循环依赖？
Spring循环依赖源码深度剖析
一级、二级、三级缓存源码分析
Spring AOP
代理模式的本质
代理模式的源码案例讲解
静态代理源码案例讲解
动态代理源码案例讲解
动态代理源码案例讲解
Spring Boot启动原理
SpringBoot初始化加载过程
怎么实现自动装配的
mybatis架构
mybatis核心配置全解析
mybatis核心执行流程全解析
Mapper的动态代理
核心接口源码详解
Configuration
Mapper
SqlSession
Executor

07：设计模式

专题目标

具备良好的识别和设计能力
通用框架及模块的能力
具备高度的抽象设计能力
具备独立的分析和设计实现能力
熟练应用常用的设计模式

详细内容

设计模式

六大设计原则
单一职责原则
开闭原则
里氏替换原则
迪米特法则
接口隔离原则
依赖倒置原则
高频设计模式
单例模式
懒汉饿汉 DCL单例源码详解
静态枚举单例源码详解
反射攻击详解
工厂模式
简单工厂源码详解
工厂方法源码详解
抽象工厂源码详解
代理模式
静态代理源码详解
动态代理源码详解
模板模式
策略模式
观察者模式
适配器模式

08：综合底层加强

专题目标

查漏补缺底层原理加强
数据结构与算法加强
计算机网络加强
操作系统加强

详细内容

数据结构与算法

数组、链表、队列、栈
树
红黑树
平衡二叉树
红黑树
B树
B+树
排序
冒泡排序
选择排序
插入排序
希尔排序
快速排序
归并排序
算法思想
分治算法
动态规划
贪心算法
限流算法
计数器
滑动窗口
漏桶算法
令牌桶算法

计算机网络

网络七层结构网络通信
HTTP 与HTTPS原理
http核心流程
SSL和TLS
SSL的工作原理
SSL非对称加密过程
网络IO、阻塞IO、非阻塞IO
IO多路复用:select、poll、epoll
网络安全
CSRF
XSS
SQL注入
CC攻击
DDos攻击
Netty
网络通信
线程模型

操作系统

操作系统发展历程
操作系统内核
中断
用户态内核态切换
时钟管理
系统调用
进程管理
进程、线程、纤程
进程通信
进程调度
内存管理
虚拟内存
Linux系统的内存映射
缺页中断
零拷贝
mmap
sendfile

09：分布式缓存

专题目标

通过分布式缓存案例来掌握技术架构选型
深入理解缓存的应用场景和缓存策略
全面掌握几种常见缓存问题的处理方式
全面掌握Redis的底层实现原理
彻底掌握 Redis缓存中间件

详细内容

分布式缓存
架构师技术选型
技术选型的思路
技术选型的工具
技术选型的方法
技术选型案例实战演示
技术选型后需要做的事情
Redis高性能存储
内存
磁盘
阻塞IO
非阻塞IO
IO多路复用
Select Poll Epoll
Redis的Hash底层存储等
网络通信IO深度剖析
网络IO流程
阻塞IO底层实现
非阻塞IO底层实现
多路复用Select Poll Epoll底层实现
Select Poll Epoll的优劣势比较
Redis核心数据结构剖析
Redis字符串底层实现
Redis List底层实现
Redis 散列底层实现
Redis 集合底层实现
Redis 有序集合底层实现
Redis哈希表源码剖析
Redis的存储源码剖析
Redis db源码剖析
Redis dict字典源码剖析
Redis哈希表源码剖析
RedisObject源码实现剖析
Redis内存回收原理
Redis内存统计方式
Redis内存统计实操
Redis内存回收机制
Redis内存淘汰策略
Redis过期策略源码剖析
Redis持久化机制与安全机制详解
RDB持久化实现
AOF持久化实现
COW第层实现
混合持久化实现
Redis缓存穿透，缓存失效，缓存雪崩解析
缓存雪崩与解决方案
缓存穿透与解决方案
缓存击穿与解决方案
缓存与数据库一致性与解决方案
Redis布隆过滤器实现
Redis在微博，微信及电商场景典型应用实践
Redis主从及哨兵架构详解
Redis哨兵模式
Redis哨兵监控的底层实现
Redis的故障转移底层实现
Redis的故障恢复流程与实现
Redis集群深度剖析
Redis Sharding存储实现
Gossip协议的实现
meet ping pong fail消息
Redis的节点数据如何一致
Redis的数据扩容和查询
Redis分布式sharding
分布式分区规则
Redis逻辑与数据分区
Range分区底层实现
固定取模底层实现
一致性Hash算法底层实现
PreSharding算法底层实现
Redis分布式底层实现
twemproxy的底层实现
codis的底层实现
redis cluster的底层实现

10：分布式RPC通信

专题目标

全面掌握 RPC 原理和常见的 RPC 技术
深入掌握RPC的通信底层实现原理
Zookeeper的源码实现讲解
全面掌握Netty Reactor多线程模型
深入Dubbo源码与底层实现原理

详细内容

RPC通信流程
RPC通信的9大步骤
Dubbo通信的流程
Dubbo的通信源码
网络通信IO
网络IO流程
阻塞IO底层实现
非阻塞IO底层实现
多路复用Select Poll Epoll底层实现
Select Poll Epoll的优劣势比较
高性能Netty
IO多路复用底层实现
单Reactor单线程模型
单Reactor多线程模型
多Reactor多线程模型
Netty线程模型以及源码讲解
序列化深度剖析
Object Serialization Stream Protocol
hessian serialization
serialization performance comparison
序列化二进制深度剖析
零拷贝深度剖析
为什么需要零拷贝
零拷贝的发展来源
重点讲解mmap
mmap的底层实现
虚拟内存
Sendfile机制
注册中心剖析
注册中心的实现
注册中心的主流方案
注册中心的方案优劣势比较
注册中心的核心实现
结合Dubbo Zookeeper的源码实现讲解
RPC动态代理
什么是代理模式
代理模式的本质
代理模式的源码案例讲解
静态代理源码案例讲解
动态代理源码案例讲解
RPC传输协议
OSI TCP/IP模型
Http工作原理
TCP三次握手四次挥手
Http通信协议完整流程
RPC Dubbo自定义通信协议
Dubbo源码深度剖析
Dubbo的核心架构设计
Dubbo的核心层级设计
Dubo的核心调用过程
Dubbo的核心源码深度剖析

11：消息中间件

专题目标

从 0 掌握消息队列（MQ）的关键技术，了解核心知识
全面了解各类 MQ 技术的原理和特性，洞悉相关原理
深入理解 MQ 的特点和应用场景
掌握RabbitMQ RocketMQ Kafaka架构设计
全面吃透RocketMQ的源码底层实现

详细内容

消息队列的设计
消息队列的核心组成
消息队列的传输模式
消息队列的消费模式
消息队列的消息协议
消息队列的发送方式
消息队列的应用
异步调用的实现原理
应用解耦的实现原理
削峰填谷的实现原理
消息队列的架构与选型
Kafka的核心架构设计
RabbitMQ的核心架构设计
RocketMQ的核心架构设计
主流消息队列的选型与优劣比较
如何设计一个消息队列
消息队列的整体架构
消息队列的核心流程
消息队列传输过程
消息队列如何数据存储
消息队列如何做消息消费
同步异步编程
同步编程的实现
异步编程的实现
Future的源码剖析
同步、异步源码案例讲解
RocketMQ零拷贝
RocketMQ Mmap的实现
PageCache
Mmap的底层实现原理
虚拟内存
缺页中断
RocketMQ源码深度剖析
RocketMQ异步通信
RocketMQ核心存储
RocketMQ消费队列

12：微服务架构

专题目标

精通微服务架构
熟悉主流的微服务框架
对服务治理有深入理解
对服务监控有深入理解
对服务限流、熔断有深入理解

详细内容

微服务的设计原则
什么时候才需要引入微服务?
微服务的缺点你真的调研和了解吗？
如果确定要做微服务，有哪些基本原则要遵守？
微服务主要解决什么问题？
微服务的核心架构设计是什么？
如何从单体到微服务的演变
如何设计一个微服务框架
服务通信
同步异步
注册中心
服务注册
服务发现
服务治理
服务监控
熔断降级
微服务监控
服务监控中心
服务监控实现
服务监控核心设计
Dubbo的源码监控实现剖析
Dubbo Admin监控案例演示
微服务链路跟踪
链路跟踪源码实现原理
数据采集、埋点、跟踪
Google Dapper
Pinpoint
Zipkin
CAT
Skywalking实现与案例展示
微服务治理剖析
微服务限流实现
微服务熔断实现
微服务降级实现
微服务路由实现
灰度蓝绿发布实现
服务鉴权与负载等
SpringCloud
Spring Cloud体系
服务注册与发现Eureka
服务网关Zuul
服务降级与熔断Hystrix
客户端负载Ribbon/Feign
Spring Cloud架构设计

13：分布式系统架构设计

专题目标

掌握大型网站分布式架构演变历程
精通分布式事务并对其原理有深入理解
精通分布式锁、Session、全局唯一ID等并对其原理有深入理解
掌握分布式数据库并对原理有深入理解
全面了解分布式的协议
全面了解分布式存储方案

详细内容

微服务架构变迁史
淘宝分布式架构演变过程
分布式协议
CAP
一致性模型
Gossip协议
Paxos协议
Raft协议
Zab协议
分布式Session解决方案
session
分布式session
分布式session方案
Session复制
Session存储在Cookie
Session粘性管理
Session集中管理在后端
分布式Session方案优劣势比较
分布式事务解决方案
分布式事务
CAP
BASE
一致性模型
XA两阶段
事务补偿TCC
消息队列最终一致性
分布式锁解决方案
分布式锁的由来
分布式锁的特点
分布式锁解决方案
数据库分布式锁
Redis分布式锁
Zookeeper分布式锁
分布式锁解决方案优劣势比较
分布式全局唯一ID
分布式全局唯一ID的要求
分布式全局唯一ID的方案
分布式全局唯一ID方案的优劣势比较
Snowflake雪花算法详解
大厂分布式全局唯一ID方案
分布式关系SQL数据库解决方案
SQL ->NoSQL->NewSQL发展轨迹
MySQL+分库分表
Spanner
Aurora
NewSQL新型分布式数据库比较
分布式NoSQL数据库解决方案
NoSQL的三大基石
列式数据
文档数据库
图形数据库
内存键值数据库
主流NoSQL数据库比较
分布式文件存储解决方案
TFS
FastDFS
MogileFS
MooserFS
GlusterFS
Ceph

14：亿级高性能架构设计

专题目标

大规模高性能架构设计
对高性能有整体的了解
高性能缓存架构设计
高性能负载架构设计
海量数据库架构设计

详细内容

海量数据库架构设计

数据拆分有哪些原则？
垂直纵向拆分怎样做？
水平横向拆分怎样做？
垂直水平拆分怎样做？
拆分后如何做数据扩容？
NewSQL分布式数据库
Google Spanner
TiDB
Cockroach DB
分布式数据存储
分布式数据一致性
Paxos、ZAB、Raft
MySQL主从复制结构
MySQL主从复制原理
MySQL主从复制模式
MySQL读写分离设计

高性能缓存架构设计

Redis缓存集群
Redis主从同步
Redis读写分离
缓存雪崩与解决方案
缓存穿透与解决方案
缓存击穿与解决方案
缓存与数据库一致性与解决方案

高性能负载架构设计

高性能负载均衡架构设计
负载均衡的作用
负载均衡的算法
负载均衡的实现
负载均衡的方案
高性能负载均衡系统优缺点剖析：Nginx（软件）、F5（硬件）
亿级负载架构设计方案

15：亿级高可用架构设计

专题目标

掌握大规模高可用架构设计
对高可用有整体的了解
高可用集群架构设计
高可用接口架构设计
高可用异地容灾架构设计

详细内容

高可用系统的度量
可用性指标详解
故障可用性指标详解
集群高可用架构设计
主备、主从等详解
分区高可用架构设计
分区、分片等详解
异地多活高可用架构设计
接口高可用架构设计
限流
降级
熔断
全链路压测
运维高可用架构设计
灰度发布
监控运维

16：大规模高并发架构设计与项目实战

专题目标

获取大规模高并发架构设计
获取高性能架构设计
获取高可用架构设计
获取大数据量高并发的研发经验
快速补足简历项目经验

详细内容

需求分析
架构设计
架构选型
技术栈
Redis
RocketMQ
Spring Boot
Spring MVC
Mybatis
MySQL
Sentinel
学习大厂真正的秒杀
百万级qps的解决方案
环境搭建
秒杀系统实战
项目流程图、涉及知识点
表结构设计
商品表
商品库存表
活动信息表
订单表
用户信息表
持久层架构搭建
引入MyBatis依赖
反向代码生成器
核心功能开发
查询产品列表开发
商品产品详情开发
秒杀活动模块开发
库存模块
订单模块
订单号生成 SnowFlake
下单核心逻辑
超时未支付订单处理逻辑
详细架构设计
如何应对高并发架构设计
如何应对高性能架构设计
如何应对高可用架构设计
核心架构实战
大流量高并发读实战
大流量高并发写实战
MQ流量削峰实战
MQ异步解耦实战
订单处理与消息队列的结合
延迟消息超时订单实战
分布式全局唯一ID
雪花算法
库存扣减方案
Lua 脚本解决库存超卖问题
如何预热缓存以降低数据库压力
服务器减压之 CDN 流量分发
服务器减压之页面静态化技术
大流量性能压力测试等实战

17：大厂面试题深度剖析与训练

专题目标

大厂难题深度剖析
必备大厂面试题训练
提前模拟面试训练

专题内容

大厂面试真题深度剖析
大厂面试真题训练
多线程与并发
集合容器
JVM虚拟机
操作系统
网络基础
数据结构与算法
数据库
性能优化
分布式Redis缓存
分布式系统架构
高并发架构
Dubbo
微服务
Nettty
消息中间件等

18：BAT资深面试官简历面试辅导

专题目标

搞定高薪的最后一步(非常重要)
制作高质量简历
搞定简历技术栈
搞定简历项目经验
搞定高薪通关

专题内容

简历指导

手把手教你制作高质量简历
如何写简历标题？
如何介绍个人优势？
如何写简历技术栈？
如何优化项目经验？

面试指导

一面：基础能力，重广度
二面：项目能力，重深度
三面：行业领域经验
四面：HR软素质考察
面试经验分享

一线资深java工程师招聘需求里明确了需要精通集合容器，尤其是今天我谈到的HashMap以及后续我要讲到的ConcurrentHashMap。

HashMap在Java集合的重要性不亚于Volatile在并发编程的重要性(可见性与有序性)，所以需要重点来掌握。

为了助大家掌握好HashMap，这节课我会重点讲解以下10点：

1.HashMap的数据结构

2.HashMap核心成员

3.HashMapd的Node数组

4.HashMap的数据存储

5.HashMap的哈希函数

6.哈希冲突：链式哈希表

7.HashMap的get方法：哈希函数

8.HashMap的put方法

9.为什么槽位数必须使用2^n？

10.HashMap必考点总结

HashMap的数据结构

首先我们从数据结构的角度来看：HashMap是:数组+链表+红黑树（JDK1.8增加了红黑树部分）的数据结构，如下所示:

HashMap的实现原理，源码深度剖析！-mikechen

这里需要搞明白两个问题：

数据底层具体存储的是什么？
这样的存储方式有什么优点呢？

1.核心成员

默认初始容量(数组默认大小):16，2的整数次方
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; 

 最大容量
static final int MAXIMUM_CAPACITY = 1 << 30;

默认负载因子
static final float DEFAULT_LOAD_FACTOR = 0.75f;
装载因子用来衡量HashMap满的程度，表示当map集合中存储的数据达到当前数组大小的75%则需要进行扩容
 
链表转红黑树边界
static final int TREEIFY_THRESHOLD = 8;

红黑树转离链表边界
static final int UNTREEIFY_THRESHOLD = 6;

哈希桶数组
transient Node<K,V>[] table;

实际存储的元素个数
transient int size;

当map里面的数据大于这个threshold就会进行扩容
int threshold   阈值 = table.length * loadFactor

2.Node数组

从源码可知，HashMap类中有一个非常重要的字段，就是 Node[] table，即哈希桶数组，明显它是一个Node的数组。

static class Node<K,V> implements Map.Entry<K,V> {
    final int hash;//用来定位数组索引位置
    final K key;
    V value;
    Node<K,V> next;//链表的下一个Node节点

    Node(int hash, K key, V value, Node<K,V> next) {
        this.hash = hash;
        this.key = key;
        this.value = value;
        this.next = next;
    }


    public final K getKey()        { return key; }
    public final V getValue()      { return value; }
    public final String toString() { return key + "=" + value; }


    public final int hashCode() {
        return Objects.hashCode(key) ^ Objects.hashCode(value);
    }


    public final V setValue(V newValue) {
        V oldValue = value;
        value = newValue;
        return oldValue;
    }


    public final boolean equals(Object o) {
        if (o == this)
            return true;
        if (o instanceof Map.Entry) {
            Map.Entry<?,?> e = (Map.Entry<?,?>)o;
            if (Objects.equals(key, e.getKey()) &&
                Objects.equals(value, e.getValue()))
                return true;
        }
        return false;
    }
}

Node是HashMap的一个内部类，实现了Map.Entry接口，本质是就是一个映射(键值对)。

HashMap的数据存储

1.哈希表来存储

HashMap采用哈希表来存储数据。

哈希表（Hash table，也叫散列表），是根据关键码值(Key value)而直接进行访问的数据结构，只要输入待查找的值即key，即可查找到其对应的值。

哈希表其实就是数组的一种扩展，由数组演化而来。可以说，如果没有数组，就没有散列表。

2.哈希函数

哈希表中元素是由哈希函数确定的,将数据元素的关键字Key作为自变量，通过一定的函数关系（称为哈希函数），计算出的值，即为该元素的存储地址。
表示为：Addr = H（key）,如下图所示：
HashMap的实现原理，源码深度剖析！-mikechen

哈希表中哈希函数的设计是相当重要的，这也是建哈希表过程中的关键问题之一。

3.核心问题

建立一个哈希表之前需要解决两个主要问题：

1)构造一个合适的哈希函数,均匀性 H（key）的值均匀分布在哈希表中

2)冲突的处理

冲突：在哈希表中，不同的关键字值对应到同一个存储位置的现象。

4.哈希冲突：链式哈希表

哈希表为解决冲突，可以采用地址法和链地址法等来解决问题，Java中HashMap采用了链地址法。

链地址法，简单来说，就是数组加链表的结合,如下图所示：

HashMap的实现原理，源码深度剖析！-mikechen

HashMap的哈希函数

/**
* 重新计算哈希值
*/
static final int hash(Object key) {
    
    int h;

     // h = key.hashCode() 为第一步 取hashCode值
     // h ^ (h >>> 16) 为第二步 高位参与运算
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

//计算数组槽位

(n - 1) & hash

对key进行了hashCode运算，得到一个32位的int值h,然后用h 异或 h>>>16位。在JDK1.8的实现中，优化了高位运算的算法，通过hashCode()的高16位异或低16位实现的：(h = k.hashCode()) ^ (h >>> 16)。

HashMap的实现原理，源码深度剖析！-mikechen

这样做的好处是，可以将hashcode高位和低位的值进行混合做异或运算，而且混合后，低位的信息中加入了高位的信息，这样高位的信息被变相的保留了下来。

等于说计算下标时把hash的高16位也参与进来了，掺杂的元素多了，那么生成的hash值的随机性会增大，减少了hash碰撞。

备注：

^异或：不同为1，相同为0
>>> ：无符号右移：右边补0
&运算：两位同时为“1”，结果才为“1，否则为0

h & (table.length -1)来得到该对象的保存位，而HashMap底层数组的长度总是2的n次方。

为什么槽位数必须使用2^n？

1.为了让哈希后的结果更加均匀

HashMap的实现原理，源码深度剖析！-mikechen

假如槽位数不是16，而是17，则槽位计算公式变成：(17 – 1) & hash
HashMap的实现原理，源码深度剖析！-mikechen
从上文可以看出，计算结果将会大大趋同，hashcode参加&运算后被更多位的0屏蔽，计算结果只剩下两种0和16，这对于hashmap来说是一种灾难。2.等价于length取模

当length总是2的n次方时，h& (length-1)运算等价于对length取模，也就是h%length，但是&比%具有更高的效率。

位运算的运算效率高于算术运算，原因是算术运算还是会被转化为位运算。

最终目的还是为了让哈希后的结果更均匀的分部，减少哈希碰撞，提升hashmap的运行效率。

https://www.javacodegeeks.com/2015/09/an-introduction-to-optimising-a-hashing-strategy.html

分析HashMap的put方法：

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    
    // 当前对象的数组是null 或者数组长度时0时，则需要初始化数组
    if ((tab = table) == null || (n = tab.length) == 0) {
        n = (tab = resize()).length;
    }
    
    // 使用hash与数组长度减一的值进行异或得到分散的数组下标，预示着按照计算现在的
    // key会存放到这个位置上，如果这个位置上没有值，那么直接新建k-v节点存放
    // 其中长度n是一个2的幂次数
    if ((p = tab[i = (n - 1) & hash]) == null) {
        tab[i] = newNode(hash, key, value, null);
    }
    
    // 如果走到else这一步，说明key索引到的数组位置上已经存在内容，即出现了碰撞
    // 这个时候需要更为复杂处理碰撞的方式来处理，如链表和树
    else {
        Node<K,V> e; K k;
       
        //节点key存在，直接覆盖value
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k)))) {
            e = p;
        }
        // 判断该链为红黑树
        else if (p instanceof TreeNode) {
            // 其中this表示当前HashMap, tab为map中的数组
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        }
        else {  // 判断该链为链表
            for (int binCount = 0; ; ++binCount) {
                // 如果当前碰撞到的节点没有后续节点，则直接新建节点并追加
                if ((e = p.next) == null) {
                    p.next = newNode(hash, key, value, null);
                    // TREEIFY_THRESHOLD = 8
                    // 从0开始的，如果到了7则说明满8了，这个时候就需要转
                    // 重新确定是否是扩容还是转用红黑树了
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    break;
                }
                // 找到了碰撞节点中，key完全相等的节点，则用新节点替换老节点
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;
            }
        }
        // 此时的e是保存的被碰撞的那个节点，即老节点
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            // onlyIfAbsent是方法的调用参数，表示是否替换已存在的值，
            // 在默认的put方法中这个值是false，所以这里会用新值替换旧值
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            // Callbacks to allow LinkedHashMap post-actions
            afterNodeAccess(e);
            return oldValue;
        }
    }
    // map变更性操作计数器
    // 比如map结构化的变更像内容增减或者rehash，这将直接导致外部map的并发
    // 迭代引起fail-fast问题，该值就是比较的基础
    ++modCount;
   
     // size即map中包括k-v数量的多少
   // 超过最大容量 就扩容
    if (++size > threshold)
        resize();
    // Callbacks to allow LinkedHashMap post-actions
    afterNodeInsertion(evict);
    return null;
}

HashMap的put方法执行过程整体如下：

①.判断键值对数组table[i]是否为空或为null，否则执行resize()进行扩容；

②.根据键值key计算hash值得到插入的数组索引i，如果table[i]==null，直接新建节点添加

③.判断table[i]的首个元素是否和key一样，如果相同直接覆盖value

④.判断table[i] 是否为treeNode，即table[i] 是否是红黑树，如果是红黑树，则直接在树中插入键值对

⑤.遍历table[i]，判断链表长度是否大于8，大于8的话把链表转换为红黑树，在红黑树中执行插入操作，否则进行链表的插入操作；遍历过程中若发现key已经存在直接覆盖value即可；

⑥.插入成功后，判断实际存在的键值对数量size是否超多了最大容量threshold，如果超过，进行扩容。

HashMap必考点总结

评论交流

路正银

1、HashMap是用数据+链表+红黑树（JDK1.8版本之后增加）的数据结构来实现的，
通过哈希函数确定在桶（数组）中的位置，当发生哈希冲突的时候，往后挂链表（JDK1.8版本会有链表转红黑树的逻辑）
2、（1）底层数据结构不一样，1.7是数组+链表，1.8是数组+链表+红黑树
（2）计算哈希值时，jdk1.8版本相比jdk1.7版本多了对hasCode做无符号右移16位,与原hasCode做异或的操作
（3）扩容策略不一样
3、哈希函数的目的是尽量让计算出的哈希值分布均匀，减少哈希碰撞
JDK1.8版本的优化是，将hascode的高16位做移位操作，可以让hascode高位的值也参与运算，掺杂的元素多了，生成的hash的值的随机性会增大，减少了hash碰撞
- mikechenAM@路正银
  
  核心点都谈到了，基本都掌握了，再补充一个点：就是HashMap 1.7版本在多线程的情况下会出现死循环，形成一个链表的死循环这个点，还可以线下有时间再做了解和补充，基本就没问题了。
  
  基本学习快一个月了，依然还在坚持输出作业，这个必须给赞，线下就坚持锻炼(keep见)+坚持作业输出，我就搬个小板凳在旁边给你呐喊加油了，继续加油 ✗咧嘴笑✗ ✗拳头✗