原文:https://www.jianshu.com/p/9c5a7d21c02f
内存模型与运行时数据区
内存模型
JAVA内存模型简称JMM(Java Memory Model ),定义了程序中各个共享变量的访问规则。
Java Memory Model
变量存储在主内存中,每个线程拥有自己的工作内存用来存放变量的拷贝,线程的读写操作是在各自的工作内存中进行的,操作的对象都是变量的拷贝,操作完毕后在刷新到主内存。
JMM规范定义了工作内存和主内存之间变量访问的细节,通过保障原子性、有序性、可见性实现线程安全。
运行时数据区
运行时数据区(JVM Runtime Data Areas)定义了JVM运行期内存的管理划分。
JVM Runtime Data Areas
JVM在运行时把内存划分成多个功能区,每个区域对应着不能的存储内容,生命周期,共享性质,GC策略等。
可以看到,能被线程共享的是方法区和堆中的数据,也就是实例对象、数组和静态变量,这些共享数据受到JMM规范影响。
而局部变量、方法参数、异常处理参数都在虚拟机栈中,这些数据为线程私有的,所以不受JMM规范影响。
原子性、可见性、有序性
原子性
原子操作是指一个操作不会被线程调度机制打断,一旦开始,就一直运行到结束,中间不会有任何线程切换(context switch)。
原子性可以保障读取到的某个属性的值是由一个线程写入的。 变量不会在同一时刻受到多个线程同时写入造成干扰。如在32位的JVM中对64位long 或double值的写操作是分成两次相邻的32位值写操作,在多线程的环境下,可能会有线程只读到了前32位,这种操作就是非原子性的,非原子性操作会受到多线程的干扰而产生结果混乱。
基本类型的单次读写操作是原子的,但是复合操作如:int i=0;i++,就是非原子性的。
JMM保障原子性的方法:volatile语义(保证变量单次操作的的原子性)、锁语义。
可见性
共享内存模型
可见性是指一个线程对变量的值进行了修改,其他线程能够立即得知这个修改。
如上图:在共享内存模型中如果有一个线程对变量i进行了修改,在没有可见性保障的情况下,其他两个线程看到的i的值都是不确定的,变量i在数据争用的情况下不具备不可见性。
可见性是保障多线程操作中数据一致性和结果正确性的基石,多线程环境下影响变量可见性的因素:
1、 指令重排序
2、 线程调度(切换)
3、 工作内存和主内存没有及时刷新
JMM保障可见性的方法:fianl语义、volatile语义、锁语义。
有序性
现代CPU的计算速度远远高于内存的读写速度,CPU会采用高速缓存来抵消内存访问带来的延迟。甚至高速缓存也分成多级,最快的离CPU最近,但是其存取速度还是远远低于CUP指令执行的速度,为了减少CACHE_WAIT,CPU会采用指令级并行重排序来提供执行效率,也可以叫做CPU乱序执行。
CUP的高速缓存与内存之间不是实时同步的,高速缓与高速缓间也不是实时同步,而是通过缓存一致性协议(MESI)将数据新到主内存,缓存和读写缓冲区之间也会通过指令重排序来优化数据的刷新。
JIT编译器也会在代码编译的时候对代码进行重新整理,最大限度的去优化代码的执行效率。
所以一段JAVA代码从执行到获得结果,其执行的顺序其实是经历了2个阶段三种重排序的优化:
代码重排序过程
保障重排序后结果正确性
1、as-if-serial语义
as-if-serial语义的意思指:所有的指令都可以为了优化而被重排序,但是必须保证最终执行的结果和重排序之前的结果是一致的,编译器和处理器都会保证单线程下的as-if-serial语义。主要遵守的规则是重排序不破坏数据的依赖关系,如下图,指令C依赖指令A和指令B,那么重排序只能在指令A和指令B之间发生。
数据依赖关系
as-if-serial语义保证了单线程环境下重排序之后程序执行结果的正确性,JVM在单线程的情况下会遵as-if-serial语义,无需担心重排序会干扰心内存可见性。
2、hAppens-before原则
示例1
按照写代码的主观意愿,可能期望是要么指令1先执行,要么指令3先执行,指令1先执行就不应该看到到指令4写入的值,如果是指令3先执行,就不应该看到指令2写入的值。
如果编译器或者执行CPU进行了重排序,指令4在指令1前先执行了,指令2在指令3之前执行了,就会出现r2 == 2和r1 == 1这种有违直觉的结果。然而,从单个线程的角度,指令1和指令2重排序是遵循as-if-serial语义的,不会影响该线程获得正确的结果。但是,从多线程的角度看,编译器或者指令重排序影响到了代码原本想要表达语义。
示例2
这个示例中指令1和指令2之间没有依赖关系遵循as-if-serial语义重排序,对单线程执行结果的正确性没有影响,但是多线程环境下,如果thread1执行完指令1,thread2执行,那i的值会出现有背预期的情况,因为thread1中对共享变量a的修改,对thread2是不可见的。
基于数据依赖性的as-if-serial语义无法保证多线程环境下,重排序之后程序执行结果的正确性。JMM中happens-before原则就是用来保障多线程环境下变量可见性的。
先行发生原则( happens-before )是JMM用来规定两个操作之间的偏序关系,这两个操作是可以跨线程的。happens-before中确定了8条规则,如果如果两个操作之间的关系可以从下列规则推导出来说明两个操作是有序的。
happens-before并不限定指令重排序,如果如果重排序之后的执行结果与按happens-before关系来执行的结果一致,那么JVM允许这种重排序。happens-before原则保证了前后两个操作间不会被重排序且后者对前者的内存是可见的。
happens-before八条规则:
1、程序次序规则:一个线程中的每个操作,happens-before于该线程中的任意后续操作(一个线程内保证语义的串行性)。
2、锁定规则:对一个锁的解锁,happens-before于随后对这个锁的加锁。
3、volatile变量规则:volatile变量的写操作happens-before于后面对这个变量的读操作。
4、传递规则:如果A happens-before B且Bhappens-before C,那么A happens-before C。
5、线程启动规则:Thread对象的start()方法happens-before于此线程的每个一动作。
6、线程中断规则:对线程interrupt()方法的调用happens-before于被中断线程的代码检测到中断事件的发生。
7、线程终结规则:线程中所有的操作都happens-before于线程的终止。
8、对象终结规则:一个对象的初始化完成happens-before于他的finalize()方法的开始。
小结
1、JMM规范定义了工作内存和主内存之间变量访问的细节,通过保障原子性、有序性、可见性实现线程安全。
2、线程调度(切换)会影响数据操作的原子性,JMM通过fianl语义、volatile语义、锁语义来保障原子性。
3、线程调度(切换)、指令重排序、内存刷新都会影响可见性,JMM通过volatile语义、锁语义来保障可见性。
4、内存系统重排序、指令级并行重排序、编译器优化重排序都会影响到程序执行的有序性,JMM通过happens-before原则保障并发环境下程序执行的有序性。