深入浅出 CAS,很多想进阿里的倒在了这个知识点
来源:https://blog.biezhi.me/2019/01/head-first-cas.html
后端开发中大家肯定遇到过实现一个线程安全的计数器这种需求,根据经验你应该知道我们要在多线程中实现 共享变量 的原子性和可见性问题,于是锁成为一个不可避免的话题,今天我们讨论的是与之对应的无锁 CAS。本文会从怎么来的、是什么、怎么用、原理分析、遇到的问题等不同的角度带你真正搞懂 CAS。
为什么要无锁
使用锁就需要获得锁、释放锁,CPU 需要通过上下文切换和调度管理来进行这个操作,对于一个 独占锁 而言一个线程在持有锁后没执行结束其他的哥们就必须在外面等着,等到前面的哥们执行完毕 CPU 大哥就会把锁拿出来其他的线程来抢了(非公平)。锁的这种概念基于一种悲观机制,它总是认为数据会被修改,所以你在操作一部分代码块之前先加一把锁,操作完毕后再释放,这样就安全了。其实在 JDK1.5 使用 synchronized
就可以做到。
不论是锁还是无锁都有其优劣势,后面我们也会通过例子说明 CAS 的问题。
什么是 CAS
前面提了无锁的 CAS,那到底 CAS 是个啥呢?我已经迫不及待了,我们来看看维基百科的解释
CAS 给我们提供了一种思路,通过 比较 和 替换 来完成原子性,来看一段代码:比较并交换(compare and swap, CAS),是原子操作的一种,可用于在多线程编程中实现不被打断的数据交换操作,从而避免多线程同时改写某一数据时由于执行顺序不确定性以及中断的不可预知性产生的数据不一致问题。该操作通过将内存中的值与指定数据进行比较,当数值一样时将内存中的数据替换为新的值。
1int cas(long *addr, long old, long new) {
2 /* 原子执行 */
3 if(*addr != old)
4 return 0;
5 *addr = new;
6 return 1;
7}
这是一段 c 语言代码,可以看到有 3 个参数,分别是:只要我们当前传入的进行比较的值和内存里的值相等,就将新值修改成功,否则返回 0 告诉比较失败了。学过数据库的同学都知道悲观锁和乐观锁,乐观锁总是认为数据不会被修改。基于这种假设 CAS 的操作也认为内存里的值和当前值是相等的,所以操作总是能成功,我们可以不需要加锁就实现多线程下的原子性操作。在多线程情况下使用 CAS 同时更新同一个变量时,只有其中一个线程能更新变量的值,而其它线程都失败,失败的线程并不会被阻塞挂起,而是告诉它这次修改失败了,你可以重新尝试,于是可以写这样的代码。
1while (!cas(&addr, old, newValue)) {
2
3}
4// success
5printf("new value = %ld", addr);
不过这样的代码相信你可能看出其中的蹊跷了,这个我们后面来分析,下面来看看 Java 里是怎么用 CAS 的。
Java 里的 CAS
还是前面的问题,如果让你用 Java 的 API 来实现你可能会想到两种方式,一种是加锁(可能是 synchronized 或者其他种类的锁),另一种是使用atomic
类,如 AtomicInteger
,这一系列类是在 JDK1.5 的时候出现的,在我们常用的 java.util.concurrent.atomic
包下,我们来看个例子:1ExecutorService executorService = Executors.newCachedThreadPool();
2AtomicInteger atomicInteger = new AtomicInteger(0);
3
4for (int i = 0; i < 5000; i++) {
5 executorService.execute(atomicInteger::incrementAndGet);
6}
7
8System.out.println(atomicInteger.get());
9executorService.shutdown();
这个例子开启了 5000 个线程去进行累加操作,不管你执行多少次答案都是 5000。这么神奇的操作是如何实现的呢?就是依靠 CAS 这种技术来完成的,我们揭开 AtomicInteger
的老底看看它的代码:
1public class AtomicInteger extends Number implements java.io.Serializable {
2 private static final long serialVersionUID = 6214790243416807050L;
3
4 // setup to use Unsafe.compareAndSwapInt for updates
5 private static final Unsafe unsafe = Unsafe.getUnsafe();
6 private static final long valueOffset;
7
8 static {
9 try {
10 valueOffset = unsafe.objectFieldOffset
11 (AtomicInteger.class.getDeclaredField("value"));
12 } catch (Exception ex) { throw new Error(ex); }
13 }
14
15 private volatile int value;
16
17 /**
18 * Creates a new AtomicInteger with the given initial value.
19 *
20 * @param initialValue the initial value
21 */
22 public AtomicInteger(int initialValue) {
23 value = initialValue;
24 }
25
26 /**
27 * Gets the current value.
28 *
29 * @return the current value
30 */
31 public final int get() {
32 return value;
33 }
34
35 /**
36 * Atomically increments by one the current value.
37 *
38 * @return the updated value
39 */
40 public final int incrementAndGet() {
41 return unsafe.getAndAddInt(this, valueOffset, 1) + 1;
42 }
43
44}
这里我只帖出了我们前面例子相关的代码,其他都是类似的,可以看到 incrementAndGet
调用了 unsafe.getAndAddInt
方法。Unsafe
这个类是 JDK 提供的一个比较底层的类,它不让我们程序员直接使用,主要是怕操作不当把机器玩坏了。。。(其实可以通过反射的方式获取到这个类的实例)你会在 JDK 源码的很多地方看到这家伙,我们先说说它有什么能力:
内存管理:包括分配内存、释放内存
操作类、对象、变量:通过获取对象和变量偏移量直接修改数据
挂起与恢复:将线程阻塞或者恢复阻塞状态
CAS:调用 CPU 的 CAS 指令进行比较和交换
内存屏障:定义内存屏障,避免指令重排序
这里只是大致提一下常用的操作,具体细节可以在文末的参考链接中查看。下面我们继续看 unsafe
的 getAndAddInt
在做什么。
1public final int getAndAddInt(Object var1, long var2, int var4) {
2 int var5;
3 do {
4 var5 = this.getIntVolatile(var1, var2);
5 } while(!this.compareAndSwapInt(var1, var2, var5, var5 + var4));
6
7 return var5;
8}
9
10public native int getIntVolatile(Object var1, long var2);
11public final native boolean compareAndSwapInt(Object var1, long var2, int var4, int var5);
其实很简单,先通过 getIntVolatile
获取到内存的当前值,然后进行比较,展开 compareAndSwapInt
方法的几个参数:
所以 this.compareAndSwapInt(var1, var2, var5, var5 + var4)
的意思就是,比较一下 var2
和内存当前值 var5
是否相等,如果相等那我就将内存值 var5
修改为 var5 + var4
(var4
就是 1,也可以是其他数)。
这里我们还需要解释一下 偏移量 是个啥?你在前面的代码中可能看到这么一段:
1// setup to use Unsafe.compareAndSwapInt for updates
2private static final Unsafe unsafe = Unsafe.getUnsafe();
3private static final long valueOffset;
4
5static {
6 try {
7 valueOffset = unsafe.objectFieldOffset
8 (AtomicInteger.class.getDeclaredField("value"));
9 } catch (Exception ex) { throw new Error(ex); }
10}
11
12private volatile int value;
可以看出在静态代码块执行的时候将 AtomicInteger
类的 value
这个字段的偏移量获取出来,拿这个 long 数据干嘛呢?在 Unsafe
类里很多地方都需要传入 obj
和偏移量,结合我们说 Unsafe
的诸多能力,其实就是直接通过更底层的方式将对象字段在内存的数据修改掉。
使用上面的方式就可以很好的解决多线程下的原子性和可见性问题。由于代码里使用了 do while
这种循环结构,所以 CPU 不会被挂起,比较失败后重试,就不存在上下文切换了,实现了无锁并发编程。
CAS 存在的问题
自旋的劣势
你留意上面的代码会发现一个问题,while
循环如果在最坏情况下总是失败怎么办?会导致 CPU 在不断处理。像这种 while(!compareAndSwapInt)
的操作我们称之为自旋,CAS 是乐观的,认为大家来并不都是修改数据的,现实可能出现非常多的线程过来都要修改这个数据,此时随着并发量的增加会导致 CAS 操作长时间不成功,CPU 也会有很大的开销。所以我们要清楚,如果是读多写少的情况也就满足乐观,性能是非常好的。
ABA 问题
1int stamp = 10001;
2
3AtomicStampedReference<Integer> stampedReference = new AtomicStampedReference<>(0, stamp);
4
5stampedReference.compareAndSet(0, 10, stamp, stamp + 1);
6
7System.out.println("value: " + stampedReference.getReference());
8System.out.println("stamp: " + stampedReference.getStamp());
它的构造函数是 2 个参数,多传入了一个初始 时间戳,用这个戳来给数据加了一个版本,这样的话多个线程来修改如果提供的戳不同。在修改数据的时候除了提供一个新的值之外还要提供一个新的戳,这样在多线程情况下只要数据被修改了那么戳一定会发生改变,另一个线程拿到的是旧的戳所以会修改失败。
尝试应用
既然 CAS 提供了这么好的 API,我们不妨用它来实现一个简易版的独占锁。思路是当某个线程进入 lock
方法就比较锁对象的内存值是否是 false,如果是则代表这把锁它可以获取,获取后将内存之修改为 true,获取不到就自旋。在 unlock
的时候将内存值再修改为 false 即可,代码如下:
1public class SpinLock {
2
3 private AtomicBoolean mutex = new AtomicBoolean(false);
4
5 public void lock() {
6 while (!mutex.compareAndSet(false, true)) {
7 // System.out.println(Thread.currentThread().getName()+ " wait lock release");
8 }
9 }
10
11 public void unlock() {
12 while (!mutex.compareAndSet(true, false)) {
13 // System.out.println(Thread.currentThread().getName()+ " wait lock release");
14 }
15 }
16
17}
这里使用了 AtomicBoolean
这个类,当然用 AtomicInteger
也是可以的,因为我们只保存一个状态 boolean
占用比较小就用它了。这个锁的实现比较简单,缺点非常明显,由于 while
循环导致的自旋会让其他线程都在占用 CPU,但是也可以使用,关于锁的优化版本实现我会在后续的文章中进行改进和说明,正因为这些问题我们也会在后续研究 AQS
这把利器的优点。
CAS 源码
看了上面的这些代码和解释相信你对 CAS 已经理解了,下面我们要说的原理是前面的 native
方法中的 C++ 代码写了什么,在 openjdk 的 /hotspot/src/share/vm/prims
目录中有一个 Unsafe.cpp 文件中有这样一段代码:
注意:这里以 hotspot 实现为例
1UNSAFE_ENTRY(jboolean, Unsafe_CompareAndSwapInt(JNIEnv *env, jobject unsafe, jobject obj, jlong offset, jint e, jint x))
2 UnsafeWrapper("Unsafe_CompareAndSwapInt");
3 oop p = JNIHandles::resolve(obj);
4 // 通过偏移量获取对象变量地址
5 jint* addr = (jint *) index_oop_from_field_offset_long(p, offset);
6 // 执行一个原子操作
7 // 如果结果和现在不同,就直接返回,因为有其他人修改了;否则会一直尝试去修改。直到成功。
8 return (jint)(Atomic::cmpxchg(x, addr, e)) == e;
9UNSAFE_END
参考资料
cas wiki
https://zh.wikipedia.org/wiki/%E6%AF%94%E8%BE%83%E5%B9%B6%E4%BA%A4%E6%8D%A2
说一说Java的Unsafe类
https://www.cnblogs.com/pkufork/p/java_unsafe.html
Java Magic. Part 4: sun.misc.Unsafe
http://mishadoff.com/blog/java-magic-part-4-sun-dot-misc-dot-unsafe/
正文结束
1.不认命,从10年流水线工人,到谷歌上班的程序媛,一位湖南妹子的励志故事
4.“37岁,985毕业,年薪50万,被裁掉只用了10分钟”
5.37岁程序员被裁,120天没找到工作,无奈去小公司,结果懵了...
一个人学习、工作很迷茫?
点击「阅读原文」加入我们的小圈子!