面試官:說說 Java CAS 原理?

在併發編程中我們都知道i++操作是非線程安全的,這是因爲 i++操作不是原子操作。

如何保證原子性呢?常用的方法就是加鎖。在Java語言中可以使用 Synchronized和CAS實現加鎖效果。

Synchronized是悲觀鎖,線程開始執行第一步就是獲取鎖,一旦獲得鎖,其他的線程進入後就會阻塞等待鎖。如果不好理解,舉個生活中的例子:一個人進入廁所後首先把門鎖上(獲取鎖),然後開始上廁所,這個時候有其他人來了只能在外面等(阻塞),就算再急也沒用。上完廁所完事後把門打開(解鎖),其他人就可以進入了。

CAS是樂觀鎖,線程執行的時候不會加鎖,假設沒有衝突去完成某項操作,如果因爲衝突失敗了就重試,最後直到成功爲止。

1. 什麼是 CAS?

CAS(Compare-And-Swap)是比較並交換的意思,它是一條 CPU 併發原語,用於判斷內存中某個值是否爲預期值,如果是則更改爲新的值,這個過程是原子的。下面用一個小示例解釋一下。

CAS機制當中使用了3個基本操作數:內存地址V,舊的預期值A,計算後要修改後的新值B。

(1)初始狀態:在內存地址V中存儲着變量值爲 1。



(2)線程1想要把內存地址爲 V 的變量值增加1。這個時候對線程1來說,舊的預期值A=1,要修改的新值B=2。



(3)在線程1要提交更新之前,線程2捷足先登了,已經把內存地址V中的變量值率先更新成了2。

(4)線程1開始提交更新,首先將預期值A和內存地址V的實際值比較(Compare),發現A不等於V的實際值,提交失敗。



(5)線程1重新獲取內存地址 V 的當前值,並重新計算想要修改的新值。此時對線程1來說,A=2,B=3。這個重新嘗試的過程被稱爲自旋。如果多次失敗會有多次自旋。

(6)線程 1 再次提交更新,這一次沒有其他線程改變地址 V 的值。線程1進行Compare,發現預期值 A 和內存地址 V的實際值是相等的,進行 Swap 操作,將內存地址 V 的實際值修改爲 B。

總結:更新一個變量的時候,只有當變量的預期值 A 和內存地址 V 中的實際值相同時,纔會將內存地址 V 對應的值修改爲 B,這整個操作就是CAS。

2. CAS 基本原理

CAS 主要包括兩個操作:Compare和Swap,有人可能要問了:兩個操作能保證是原子性嗎?可以的。

CAS 是一種系統原語,原語屬於操作系統用語,原語由若干指令組成,用於完成某個功能的一個過程,並且原語的執行必須是連續的,在執行過程中不允許被中斷,也就是說 CAS 是一條 CPU 的原子指令,由操作系統硬件來保證。

在 Intel 的 CPU 中,使用 cmpxchg 指令。

回到 Java 語言,JDK 是在 1.5 版本後才引入 CAS 操作,在sun.misc.Unsafe這個類中定義了 CAS 相關的方法。

public final native boolean compareAndSwapObject(Object o, long offset, Object expected, Object x);

public final native boolean compareAndSwapInt(Object o, long offset, int expected, int x);

public final native boolean compareAndSwapLong(Object o, long offset, long expected, long x);

可以看到方法被聲明爲native,如果對 C++ 比較熟悉可以自行下載 OpenJDK 的源碼查看 unsafe.cpp,這裏不再展開分析。需要詳細瞭解的小夥伴可以去下載『阿里師兄總結的Java知識筆記 總共 283 頁,超級詳細』。

3. CAS 在 Java 語言中的應用

在 Java 編程中我們通常不會直接使用到 CAS,都是通過 JDK 封裝好的併發工具類來間接使用的,這些併發工具類都在java.util.concurrent包中。

J.U.C 是java.util.concurrent的簡稱,也就是大家常說的 Java 併發編程工具包,面試常考,非常非常重要。

目前 CAS 在 JDK 中主要應用在 J.U.C 包下的 Atomic 相關類中。


比如說 AtomicInteger 類就可以解決 i++ 非原子性問題,通過查看源碼可以發現主要是靠 volatile 關鍵字和 CAS 操作來實現,具體原理和源碼分析後面的文章會展開分析。

4. CAS 的問題

CAS 不是萬能的,也有很多問題。

敲黑板:CAS有哪些問題,這是面試高頻考點,需要重點掌握。

4.1. 典型 ABA 問題

ABA 是 CAS 操作的一個經典問題,假設有一個變量初始值爲 A,修改爲 B,然後又修改爲 A,這個變量實際被修改過了,但是 CAS 操作可能無法感知到。

如果是整形還好,不會影響最終結果,但如果是對象的引用類型包含了多個變量,引用沒有變實際上包含的變量已經被修改,這就會造成大問題。

如何解決?思路其實很簡單,在變量前加版本號,每次變量更新了就把版本號加一,結果如下:


最終結果都是 A 但是版本號改變了。

從 JDK 1.5 開始提供了AtomicStampedReference類,這個類的 compareAndSe方法首先檢查當前引用是否等於預期引用,並且當前標誌是否等於預期標誌,如果全部相等,則以原子方式將該引用和該標誌的值設置爲給定的更新值。

4.2. 自旋開銷問題

CAS 出現衝突後就會開始自旋操作,如果資源競爭非常激烈,自旋長時間不能成功就會給 CPU 帶來非常大的開銷。

解決方案:可以考慮限制自旋的次數,避免過度消耗 CPU;另外還可以考慮延遲執行。

4.3. 只能保證單個變量的原子性

當對一個共享變量執行操作時,可以使用 CAS 來保證原子性,但是如果要對多個共享變量進行操作時,CAS 是無法保證原子性的,比如需要將 i 和 j 同時加 1:

i++;j++;

這個時候可以使用 synchronized 進行加鎖,有沒有其他辦法呢?有,將多個變量操作合成一個變量操作。從 JDK1.5 開始提供了AtomicReference 類來保證引用對象之間的原子性,你可以把多個變量放在一個對象裏來進行CAS操作。

5. 有態度的總結

CAS 是 Compare And Swap,是一條 CPU 原語,由操作系統保證原子性。

Java語言從 JDK1.5 版本開始引入 CAS , 並且是 Java 併發編程J.U.C 包的基石,應用非常廣泛。

當然 CAS 也不是萬能的,也有很多問題:典型 ABA 問題、自旋開銷問題、只能保證單個變量的原子性。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章