死鎖的 4 種排查工具 !

死鎖(Dead Lock)指的是兩個或兩個以上的運算單元(進程、線程或協程),都在等待對方停止執行,以取得系統資源,但是沒有一方提前退出,就稱爲死鎖。
image.png

死鎖示例

接下來,我們先來演示一下 Java 中最簡單的死鎖,我們創建兩個鎖和兩個線程,讓線程 1 先擁有鎖 A,然後在 1s 後嘗試獲取鎖 B,同時我們啓動線程 2,讓它先擁有鎖 B,然後在 1s 之後嘗試獲取鎖 A,這時就會出現相互等待對方釋放鎖的情況,從而造成死鎖的問題,具體代碼如下:

public class DeadLockExample {
    public static void main(String[] args) {
        Object lockA = new Object(); // 創建鎖 A
        Object lockB = new Object(); // 創建鎖 B

        // 創建線程 1
        Thread t1 = new Thread(new Runnable() {
            @Override
            public void run() {
                // 先獲取鎖 A
                synchronized (lockA) {
                    System.out.println("線程 1:獲取到鎖 A!");
                    try {
                        Thread.sleep(1000);
                    } catch (InterruptedException e) {
                        e.printStackTrace();
                    }
                    // 嘗試獲取鎖 B
                    System.out.println("線程 1:等待獲取 B...");
                    synchronized (lockB) {
                        System.out.println("線程 1:獲取到鎖 B!");
                    }
                }
            }
        });
        t1.start(); // 運行線程

        // 創建線程 2
        Thread t2 = new Thread(new Runnable() {
            @Override
            public void run() {
                // 先獲取鎖 B
                synchronized (lockB) {
                    System.out.println("線程 2:獲取到鎖 B!");
                    try {
                        Thread.sleep(1000);
                    } catch (InterruptedException e) {
                        e.printStackTrace();
                    }
                    // 嘗試獲取鎖 A
                    System.out.println("線程 2:等待獲取 A...");
                    synchronized (lockA) {
                        System.out.println("線程 2:獲取到鎖 A!");
                    }
                }
            }
        });
        t2.start(); // 運行線程
    }
}

以上程序的執行結果如下:
image.png
從上述結果可以看出,線程 1 和線程 2 都在等待對方釋放鎖,這樣就造成了死鎖問題。

死鎖產生原因

通過以上示例,我們可以得出結論,要產生死鎖需要滿足以下 4 個條件

  1. 互斥條件:指運算單元(進程、線程或協程)對所分配到的資源具有排它性,也就是說在一段時間內某個鎖資源只能被一個運算單元所佔用。
  2. 請求和保持條件:指運算單元已經保持至少一個資源,但又提出了新的資源請求,而該資源已被其它運算單元佔有,此時請求運算單元阻塞,但又對自己已獲得的其它資源保持不放。
  3. 不可剝奪條件:指運算單元已獲得的資源,在未使用完之前,不能被剝奪。
  4. 環路等待條件:指在發生死鎖時,必然存在運算單元和資源的環形鏈,即運算單元正在等待另一個運算單元佔用的資源,而對方又在等待自己佔用的資源,從而造成環路等待的情況。

只有以上 4 個條件同時滿足,纔會造成死鎖問題。

死鎖排查

如果程序出現死鎖問題,可通過以下 4 種方案中的任意一種進行分析和排查。

方案 1:jstack

我們在使用 jstack 之前,先要通過 jps 得到運行程序的進程 ID,使用方法如下:
image.png
“jps -l”可以查詢本機所有的 Java 程序,jps(Java Virtual Machine Process Status Tool)是 Java 提供的一個顯示當前所有 Java 進程 pid 的命令,適合在 linux/unix/windows 平臺上簡單察看當前 Java 進程的一些簡單情況,“-l”用於輸出進程 pid 和運行程序完整路徑名(包名和類名)。

有了進程 ID(PID)之後,我們就可以使用“jstack -l PID”來發現死鎖問題了,如下圖所示:
image.png
jstack 用於生成 Java 虛擬機當前時刻的線程快照,“-l”表示長列表(long),打印關於鎖的附加信息。

PS:可以使用 jstack -help 查看更多命令使用說明。

方案 2:jconsole

使用 jconsole 需要打開 JDK 的 bin 目錄,找到 jconsole 並雙擊打開,如下圖所示:
image.png
然後選擇要調試的程序,如下圖所示:
image.png
之後點擊連接進入,選擇“不安全的連接”進入監控主頁,如下圖所示:
image.png
image.png
之後切換到“線程”模塊,點擊“檢測死鎖”按鈕,如下圖所示:
image.png
之後稍等片刻就會檢測出死鎖的相關信息,如下圖所示:
image.png

方案 3:jvisualvm

jvisualvm 也在 JDK 的 bin 目錄中,同樣是雙擊打開:
image.png
稍等幾秒之後,jvisualvm 中就會出現本地的所有 Java 程序,如下圖所示:
image.png
雙擊選擇要調試的程序:
image.png
單機鼠標進入“線程”模塊,如下圖所示:
image.png
從上圖可以看出,當我們切換到線程一欄之後就會直接顯示出死鎖信息,之後點擊“線程 Dump”生成死鎖的詳情信息,如下圖所示:
image.png

方案 4:jmc

jmc 是 Oracle Java Mission Control 的縮寫,是一個對 Java 程序進行管理、監控、概要分析和故障排查的工具套件。它也是在 JDK 的 bin 目錄中,同樣是雙擊啓動,如下圖所示:
image.png
jmc 主頁信息如下:
image.png
之後選中要排查的程序,右鍵“啓動 JMX 控制檯”查看此程序的詳細內容,如下圖所示:
image.png
image.png
然後點擊“線程”,勾中“死鎖檢測”就可以發現死鎖和死鎖的詳情信息,如下圖所示:
image.png

總結

死鎖是因爲兩個或兩個以上的運算單元,都在等待對方停止執行,以取得系統資源,但沒有一方提前退出,於是就出現了死鎖。死鎖的排查工具總共有 4 種:

  • jstack
  • jconsole
  • jvisualvm
  • jmc

從易用性和性能方面來考慮,推薦使用 jconsole 或 jvisualvm 來排查死鎖。

參考 & 鳴謝

blog.csdn.net/u010648555/article/details/80721815

cnblogs.com/cxuanBlog/p/13202898.html

zh.wikipedia.org/zh-hans/死鎖

併發原創文章推薦

  1. 線程的 4 種創建方法和使用詳解!
  2. Java中用戶線程和守護線程區別這麼大?
  3. 深入理解線程池 ThreadPool
  4. 線程池的7種創建方式,強烈推薦你用它...
  5. 池化技術到達有多牛?看了線程和線程池的對比嚇我一跳!
  6. 併發中的線程同步與鎖
  7. synchronized 加鎖 this 和 class 的區別!
  8. volatile 和 synchronized 的區別
  9. 輕量級鎖一定比重量級鎖快嗎?
  10. 這樣終止線程,竟然會導致服務宕機?
  11. SimpleDateFormat線程不安全的5種解決方案!
  12. ThreadLocal不好用?那是你沒用對!
  13. ThreadLocal內存溢出代碼演示和原因分析!
  14. Semaphore自白:限流器用我就對了!
  15. CountDownLatch:別浪,等人齊再團!
  16. CyclicBarrier:人齊了,司機就可以發車了!
  17. synchronized 優化手段之鎖膨脹機制!
  18. synchronized 中的 4 個優化,你知道幾個?
  19. ReentrantLock 中的 4 個坑!
  20. 圖解:爲什麼非公平鎖的性能更高?

關注公號「Java中文社羣」查看更多有意思、漲知識的 Java 併發文章。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章