真实字节二面:什么是伪共享?
The following article is from 艾小仙 Author 艾小仙
这个问题来自最近一个朋友字节面试碰到的,最后他也成功拿到了字节offer,这个问题我想可能挺多人不太清楚,所以想拿出来单独说一说。
好了,让我们进入正题。
什么是伪共享
首先大家都知道,随着CPU和内存的发展速度差异的问题,导致CPU的速度远远快于内存,所以一般现在的CPU都加入了高速缓存,就是常说的解决不同硬件之间的性能差异问题。
这样的话,很简单的道理,加入了缓存,就必然会导致缓存一致性的问题,由此,又引入了缓存一致性协议。(如果你不知道,建议去百度一下,这里不做展开)
CPU缓存,顾名思义,越贴近CPU的缓存速度越快,容量越小,造价成本也越高,而高速缓存一般可以分为L1、L2、L3三级缓存,按照性能的划分:L1>L2>L3。
而事实上,数据在缓存内部都是按照行来存储的,这就叫做缓存行。缓存行一般都是2的整数幂个字节,一般来说范围在32-256个字节之间,现在最为常见的缓存行的大小在64个字节。
所以,按照这个存储方式,缓存中的数据并不是一个个单独的变量的存储方式,而是多个变量会放到一行中。
我们常说的一个例子就是数组和链表,数组的内存地址是连续的,当我们去读取数组中的元素时,CPU会把数组中后续的若干个元素也加载到缓存中,以此提高效率,但是链表则不会,也就是说,内存地址连续的变量才有可能被放到一个缓存行中。
在多个线程并发修改一个缓存行中的多个变量时,由于只能同时有一个线程去操作缓存行,将会导致性能的下降,这个问题就称之为伪共享。
为什么只有一个线程能去操作?我们举个实际的栗子来说明这种情况:
假设缓存中有x,y
两个变量,他们同时已经在不同的三级缓存之中。
这时有两个线程A和B同时去修改位于Core1和Core2的变量x
和y
。
如果线程A去修改Core1的缓存中的x
变量,由于缓存一致性协议,Core2中对应的缓存了x,y
变量的缓存行将会失效,他会被强制从主内存中重新去加载变量。
这样的话,频繁的访问主内存,缓存基本都失效了,将会导致性能的下降,这就是伪共享的问题。
如何避免?
既然已经知道了什么是伪共享,那么怎么避免这种情况的发生?
改变行存储的方式?想都别想了。
剩下可行的方法就是填充,如果这一行只有我这一个数据那不就好了吗?
确实就是这样,解决方式通常有以下两种。
字节填充
在JDK8之前,可以通过填充字节的方式来避免伪共享的问题,如下代码所示:
一般而言,缓存行有64字节,我们知道一个long是8个字节,填充5个long之后,一共就是48个字节。
而 Java 中对象头在32位系统下占用8个字节,64位系统下占用16个字节,这样填充5个long型即可填满64字节,也就是一个缓存行。
@Contented注解
JDK8以及之后的版本 Java 提供了sun.misc.Contended
注解,通过@Contented注解就可以解决伪共享的问题。
使用@Contented注解后会增加128字节的padding,并且需要开启-XX:-RestrictContended
选项后才能生效。
所以,通过以上两种方式你会发现,对象头大小和缓存行的大小都和操作系统位数有关,JDK的注解帮你解决了这个问题,所以推荐尽量使用注解的方式来实现。
虽然解决了伪共享问题,但是这种填充的方式也浪费了缓存资源,明明只有8B的大小,硬是使用了64B缓存空间,造成了缓存资源的浪费。
而且我们知道,缓存又小又贵,时间和空间的取舍要自己酌情考虑。
实际应用
在Java中提供了多个原子变量的操作类,就是比如AtomicLong
、AtomicInteger
这些,通过CAS的方式去更新变量,但是失败会无限自旋尝试,导致CPU资源的浪费。
为了解决高并发下的这个缺点,JDK8中新增了LongAdder
类,他的使用就是对解决伪共享的实际应用。
LongAdder
继承自Striped64
,内部维护了一个Cell
数组,核心思想就是把单个变量的竞争拆分,多线程下如果一个Cell
竞争失败,转而去其他Cell
再次CAS重试。
解决伪共享的真正的核心就在Cell
数组,可以看到,Cell
数组使用了Contented
注解。
在上面我们提到数组的内存地址都是连续的,所以数组内的元素经常会被放入一个缓存行,这样的话就会带来伪共享的问题,影响性能。
这里使用Contented
进行填充,就避免了伪共享的问题,使得数组中的元素不再共享一个缓存行。
好了,今天的内容就到这里,我是艾小仙,我的slogan还没想好,但是我们下次见。
点此查看详情
1、卸载 PyCharm!这才是 Python 小白的最理想的 IDE
识别关注我们
了解更多精彩内容
点分享
点点赞
点在看