查看原文
其他

你真的了解 volatile 吗?

风过无痕 Java后端 2020-10-08

点击上方 Java后端,选择 设为星标

优质文章,及时送达
作者:风过无痕
原文:https://urlify.cn/6RnU3i

很早就接触了volatile,但是并没有特别深入的去研究它,只有一个朦胧的概念,就是觉得用它来解决可见性的,但可见性又是什么呢?

最近经过查阅各种资料,并结合自己的思考和实践,对volatile有了比较深刻的认识,在此总结并分享给大家。

可见性

如何理解可见性,还是来看个会出现死循环的例子:

(注意:运行时请加上jvm参数:-server,while循环内不要有标准输出):

这是为什么呢?先来看看java的内存模型,如下图:

java内存分为工作内存和主存

工作内存:即java线程的本地内存,是单独给某个线程分配的,存储局部变量等,同时也会复制主存的共享变量作为本地的副本,目的是为了减少和主存通信的频率,提高效率。

主存:存储类成员变量等

可见性是指的是线程访问变量是否是最新值。

局部变量不存在可见性问题,而共享内存就会有可见性问题,因为本地线程在创建的时候,会从主存中读取一个共享变量的副本,且修改也是修改副本,且并不是立即刷新到主存中去,那么其他线程并不会马上共享变量的修改。

因此,线程B修改共享变量后,线程A并不会马上知晓,就会出现上述死循环的问题。

解决共享变量可见性问题,需要用volatile关键字修饰。

如下图代码就不会出现死循环:

那么为什么能解决死循环的问题呢?

可见性的特性总结为以下2点:

  • 对volatile变量的写会立即刷新到主存
  • 对volatile变量的读会读主存中的新值
可以用如下图更清晰的描述:
如此一来,就不会出现死循环了。
为了能更深刻的理解volatile的语义,我们来看下面的时序图,回答这2个问题:
问题1:t2时刻,如果线程A读取running变量,会读取到false,还是等待线程B执行完呢?
答案是否定的,volatile并没有锁的特性。
问题2:t4时刻,线程A是否一定能读取到线程B修改后的最新值
答案是肯定的,线程A会从重新从主存中读取running的最新值。
还有一种办法也可以解决死循环的问题:
虽然running变量上没有volatile关键字修饰,但是读和写running都是同步方法

同步块存在如下语义:

  • 进入同步块,访问共享变量会去读取主存
  • 退出同步块,本地内存对共享变量的修改会立即刷新到主存
因此上述代码不会出现死循环。

volatile变量的原子性

我看了很多文章,有些文章甚至是出版的书籍都说volatile不是原子的,他们举的例子是i++操作,i++本身不是原子操作,是读并写,我这里要讲的原子性指的是写操作,原子性的特别总结为2点:
  • 对一个volatile变量的写操作,只有所有步骤完成,才能被其它线程读取到。
  • 多个线程对volatile变量的写操作本质上是有先后顺序的。也就是说并发写没有问题。
这样说也许读者感觉不到和非volatile变量有什么区别,我来举个例子:
//线程1初始化User
User user;
user = new User();
//线程2读取user
if(user!=null){
user.getName();
}
在多线程并发环境下,线程2读取到的user可能未初始化完成,具体来看User user = new User的语义:
  • 分配对象的内存空间
  • 初始化对线
  • 设置user指向刚分配的内存地址
步骤2和步骤3可能会被重排序,流程变为
1->3->2
这些线程1在执行完第3步而还没来得及执行完第2步的时候,如果内存刷新到了主存,那么线程2将得到一个未初始化完成的对象。因此如果将user声明为volatile的,那么步骤2,3将不会被重排序。
下面我们来看一个具体案例,一个基于双重检查的懒加载的单例模式实现:
这个单例模式看起来很完美,如果instance为空,则加锁,只有一个线程进入同步块完成对象的初始化,然后instance不为空,那么后续的所有线程获取instance都不用加锁,从而提升了性能。
但是我们刚才讲了对象赋值操作步骤可能会存在重排序,即当前线程的步骤4执行到一半,其它线程如果进来执行到步骤1,instance已经不为null,因此将会读取到一个没有初始化完成的对象。
但如果将instance用volatile来修饰,就完全不一样了,对instance的写入操作将会变成一个原子操作,没有初始化完,就不会被刷新到主存中。
修改后的单例模式代码如下:

对volatile理解的误区

很多人会认为对volatile变量的所有操作都是原子性的,比如自增i++
这其实是不对的。
看如下代码:
如果i++的操作是线程安全的,那么预期结果应该是i=20000
然而运行的结果是:11349
说明i++存在并发问题,i++语义是i=i+1
分为2个步骤
  • 读取i=0
  • 计算i+1=1,并重新赋值给i
那么可能存在2个线程同时读取到i=0,并计算出结果i=1然后赋值给i,那么就得不到预期结果i=2。
这个问题说明了2个问题:
  • i++这种操作不是原子操作
  • volatile 并不会有锁的特性
1. 如何判断一个元素在亿级数据中是否存在?
2. 程序员才能看懂的动图
3. 互联网公司的抗疫情行动!
4. 如何获取靠谱的新型冠状病毒疫情

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存