死鎖是兩個或更多線程阻塞着等待其它處於死鎖狀態的線程所持有的鎖。死鎖通常發生在多個線程同時但以不同的順序請求同一組鎖的時候。
例如,如果線程1鎖住了A,然後嘗試對B進行加鎖,同時線程2已經鎖住了B,接着嘗試對A進行加鎖,這時死鎖就發生了。線程1永遠得不到B,線程2也永遠得不到A,並且它們永遠也不會知道發生了這樣的事情。爲了得到彼此的對象(A和B),它們將永遠阻塞下去。這種情況就是一個死鎖。
該情況如下:
Thread 1 locks A, waits for B
Thread 2 locks B, waits for A
這裏有一個TreeNode類的例子,它調用了不同實例的synchronized方法:
public class TreeNode {
TreeNode parent = null;
List children = new ArrayList();
public synchronized void addChild(TreeNode child){
if(!this.children.contains(child)) {
this.children.add(child);
child.setParentOnly(this);
}
}
public synchronized void addChildOnly(TreeNode child){
if(!this.children.contains(child){
this.children.add(child);
}
}
public synchronized void setParent(TreeNode parent){
this.parent = parent;
parent.addChildOnly(this);
}
public synchronized void setParentOnly(TreeNode parent){
this.parent = parent;
}
}
如果線程1調用parent.addChild(child)方法的同時有另外一個線程2調用child.setParent(parent)方法,兩個線程中的parent表示的是同一個對象,child亦然,此時就會發生死鎖。下面的僞代碼說明了這個過程:
Thread 1: parent.addChild(child); //locks parent
--> child.setParentOnly(parent);
Thread 2: child.setParent(parent); //locks child
--> parent.addChildOnly()
首先線程1調用parent.addChild(child)。因爲addChild()是同步的,所以線程1會對parent對象加鎖以不讓其它線程訪問該對象。
然後線程2調用child.setParent(parent)。因爲setParent()是同步的,所以線程2會對child對象加鎖以不讓其它線程訪問該對象。
現在child和parent對象被兩個不同的線程鎖住了。接下來線程1嘗試調用child.setParentOnly()方法,但是由於child對象現在被線程2鎖住的,所以該調用會被阻塞。線程2也嘗試調用parent.addChildOnly(),但是由於parent對象現在被線程1鎖住,導致線程2也阻塞在該方法處。現在兩個線程都被阻塞並等待着獲取另外一個線程所持有的鎖。
注意:像上文描述的,這兩個線程需要同時調用parent.addChild(child)和child.setParent(parent)方法,並且是同一個parent對象和同一個child對象,纔有可能發生死鎖。上面的代碼可能運行一段時間纔會出現死鎖。
這些線程需要同時獲得鎖。舉個例子,如果線程1稍微領先線程2,然後成功地鎖住了A和B兩個對象,那麼線程2就會在嘗試對B加鎖的時候被阻塞,這樣死鎖就不會發生。因爲線程調度通常是不可預測的,因此沒有一個辦法可以準確預測什麼時候死鎖會發生,僅僅是可能會發生。
更復雜的死鎖
死鎖可能不止包含2個線程,這讓檢測死鎖變得更加困難。下面是4個線程發生死鎖的例子:
Thread 1 locks A, waits for B
Thread 2 locks B, waits for C
Thread 3 locks C, waits for D
Thread 4 locks D, waits for A
線程1等待線程2,線程2等待線程3,線程3等待線程4,線程4等待線程1。
數據庫的死鎖
更加複雜的死鎖場景發生在數據庫事務中。一個數據庫事務可能由多條SQL更新請求組成。當在一個事務中更新一條記錄,這條記錄就會被鎖住避免其他事務的更新請求,直到第一個事務結束。同一個事務中每一個更新請求都可能會鎖住一些記錄。
當多個事務同時需要對一些相同的記錄做更新操作時,就很有可能發生死鎖,例如:
Transaction 1, request 1, locks record 1 for update
Transaction 2, request 1, locks record 2 for update
Transaction 1, request 2, tries to lock record 2 for update.
Transaction 2, request 2, tries to lock record 1 for update.
因爲鎖發生在不同的請求中,並且對於一個事務來說不可能提前知道所有它需要的鎖,因此很難檢測和避免數據庫事務中的死鎖。