JAVA併發二:併發編程的優缺點

推薦閱讀:阿里P8架構師談:工作1-5年的Java工程師,怎樣提高核心競爭力

                  阿里架構師直言:“沒有實戰都是紙上談兵”!Redis實戰PDF分享

                  奮發圖強半年多,終於四面阿里如願拿到心儀offer定級P7

一直以來併發編程對於剛入行的小白來說總是覺得高深莫測,於是乎,就誕生了想寫點東西記錄下,以提升理解和堆併發編程的認知。爲什麼需要用的併發?凡事總有好壞兩面,之間的trade-off是什麼,也就是說併發編程具有哪些缺點?以及在進行併發編程時應該瞭解和掌握的概念是什麼?這篇文章主要以這三個問題來談一談。

1. 爲什麼要用到併發

一直以來,硬件的發展極其迅速,也有一個很著名的"摩爾定律",可能會奇怪明明討論的是併發編程爲什麼會扯到了硬件的發展,這其中的關係應該是多核CPU的發展爲併發編程提供的硬件基礎。摩爾定律並不是一種自然法則或者是物理定律,它只是基於認爲觀測數據後,對未來的一種預測。按照所預測的速度,我們的計算能力會按照指數級別的速度增長,不久以後會擁有超強的計算能力,正是在暢想未來的時候,2004年,Intel宣佈4GHz芯片的計劃推遲到2005年,然後在2004年秋季,Intel宣佈徹底取消4GHz的計劃,也就是說摩爾定律的有效性超過了半個世紀戛然而止。但是,聰明的硬件工程師並沒有停止研發的腳步,他們爲了進一步提升計算速度,而不是再追求單獨的計算單元,而是將多個計算單元整合到了一起,也就是形成了多核CPU。短短十幾年的時間,家用型CPU,比如Intel i7就可以達到4核心甚至8核心。而專業服務器則通常可以達到幾個獨立的CPU,每一個CPU甚至擁有多達8個以上的內核。因此,摩爾定律似乎在CPU核心擴展上繼續得到體驗。因此,多核的CPU的背景下,催生了併發編程的趨勢,通過併發編程的形式可以將多核CPU的計算能力發揮到極致,性能得到提升

頂級計算機科學家Donald Ervin Knuth如此評價這種情況:在我看來,這種現象(併發)或多或少是由於硬件設計者無計可施了導致的,他們將摩爾定律的責任推給了軟件開發者。

另外,在特殊的業務場景下先天的就適合於併發編程。比如在圖像處理領域,一張1024X768像素的圖片,包含達到78萬6千多個像素。即時將所有的像素遍歷一邊都需要很長的時間,面對如此複雜的計算量就需要充分利用多核的計算的能力。又比如當我們在網上購物時,爲了提升響應速度,需要拆分,減庫存,生成訂單等等這些操作,就可以進行拆分利用多線程的技術完成。面對複雜業務模型,並行程序會比串行程序更適應業務需求,而併發編程更能吻合這種業務拆分 。正是因爲這些優點,使得多線程技術能夠得到重視,也是一名CS學習者應該掌握的:

  • 充分利用多核CPU的計算能力;
  •  方便進行業務拆分,提升應用性能;

 2. 併發編程有哪些缺點

多線程技術有這麼多的好處,難道就沒有一點缺點麼,就在任何場景下就一定適用麼?很顯然不是。

2.1 頻繁的上下文切換

時間片是CPU分配給各個線程的時間,因爲時間非常短,所以CPU不斷通過切換線程,讓我們覺得多個線程是同時執行的,時間片一般是幾十毫秒。而每次切換時,需要保存當前的狀態起來,以便能夠進行恢復先前狀態,而這個切換時非常損耗性能,過於頻繁反而無法發揮出多線程編程的優勢。通常減少上下文切換可以採用無鎖併發編程,CAS算法,使用最少的線程和使用協程。

  • 無鎖併發編程:可以參照concurrentHashMap鎖分段的思想,不同的線程處理不同段的數據,這樣在多線程競爭的條件下,可以減少上下文切換的時間;
  • CAS算法,利用Atomic下使用CAS算法來更新數據,使用了樂觀鎖,可以有效的減少一部分不必要的鎖競爭帶來的上下文切換;
  • 使用最少線程:避免創建不需要的線程,比如任務很少,但是創建了很多的線程,這樣會造成大量的線程都處於等待狀態;
  • 協程:在單線程裏實現多任務的調度,並在單線程裏維持多個任務間的切換

由於上下文切換也是個相對比較耗時的操作,所以在"java併發編程的藝術"一書中有過一個實驗,併發累加未必會比串行累加速度要快。 可以使用Lmbench3測量上下文切換的時長,vmstat測量上下文切換次數。

 2.2 線程安全

多線程編程中最難以把握的就是臨界區線程安全問題,稍微不注意就會出現死鎖的情況,一旦產生死鎖就會造成系統功能不可用。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
	public class DeadLockDemo {
	    private static String resource_a = "A";
	    private static String resource_b = "B";
 
	    public static void main(String[] args) {
	        deadLock();
	    }
 
	    public static void deadLock() {
	        Thread threadA = new Thread(new Runnable() {
	            @Override
	            public void run() {
	                synchronized (resource_a) {
	                    System.out.println("get resource a");
	                    try {
	                        Thread.sleep(3000);
	                        synchronized (resource_b) {
	                            System.out.println("get resource b");
	                        }
	                    } catch (InterruptedException e) {
	                        e.printStackTrace();
	                    }
	                }
	            }
	        });
	        Thread threadB = new Thread(new Runnable() {
	            @Override
	            public void run() {
	                synchronized (resource_b) {
	                    System.out.println("get resource b");
	                    synchronized (resource_a) {
	                        System.out.println("get resource a");
	                    }
	                }
	            }
	        });
	        threadA.start();
	        threadB.start();
 
	    }
	}

在上面的這個demo中,開啓了兩個線程threadA, threadB,其中threadA佔用了resource_a, 並等待被threadB釋放的resource _b。threadB佔用了resource _b正在等待被threadA釋放的resource _a。因此threadA,threadB出現線程安全的問題,形成死鎖。同樣可以通過jps,jstack證明這種推論:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
"Thread-1":
waiting to lock monitor 0x000000000b695360 (object 0x00000007d5ff53a8, a java.lang.String),
which is held by "Thread-0"
"Thread-0":
waiting to lock monitor 0x000000000b697c10 (object 0x00000007d5ff53d8, a java.lang.String),
which is held by "Thread-1"
 
Java stack information for the threads listed above:
===================================================
"Thread-1":
at learn.DeadLockDemo$2.run(DeadLockDemo.java:34)
- waiting to lock <0x00000007d5ff53a8(a java.lang.String)
- locked <0x00000007d5ff53d8(a java.lang.String)
at java.lang.Thread.run(Thread.java:722)
"Thread-0":
at learn.DeadLockDemo$1.run(DeadLockDemo.java:20)
- waiting to lock <0x00000007d5ff53d8(a java.lang.String)
- locked <0x00000007d5ff53a8(a java.lang.String)
at java.lang.Thread.run(Thread.java:722)
 
Found 1 deadlock.

如上所述,完全可以看出當前死鎖的情況。那麼,通常可以用如下方式避免死鎖的情況:

1. 避免一個線程同時獲得多個鎖;
2. 避免一個線程在鎖內部佔有多個資源,儘量保證每個鎖只佔用一個資源;
3. 嘗試使用定時鎖,使用lock.tryLock(timeOut),當超時等待時當前線程不會阻塞;
4. 對於數據庫鎖,加鎖和解鎖必須在一個數據庫連接裏,否則會出現解鎖失敗的情況

所以,如何正確的使用多線程編程技術有很大的學問,比如如何保證線程安全,如何正確理解由於JMM內存模型在原子性,有序性,可見性帶來的問題,比如數據髒讀,DCL等這些問題(在後續篇幅會講述)。而在學習多線程編程技術的過程中也會讓你收穫頗豐。

 3. 應該瞭解的概念

 3.1 同步VS異步

同步和異步通常用來形容一次方法調用。同步方法調用一開始,調用者必須等待被調用的方法結束後,調用者後面的代碼才能執行。而異步調用,指的是,調用者不用管被調用方法是否完成,都會繼續執行後面的代碼,當被調用的方法完成後會通知調用者。比如,在超時購物,如果一件物品沒了,你得等倉庫人員跟你調貨,直到倉庫人員跟你把貨物送過來,你才能繼續去收銀臺付款,這就類似同步調用。而異步調用了,就像網購,你在網上付款下單後,什麼事就不用管了,該幹嘛就幹嘛去了,當貨物到達後你收到通知去取就好。

3.2 併發與並行

併發和並行是十分容易混淆的概念。併發指的是多個任務交替進行,而並行則是指真正意義上的“同時進行”。實際上,如果系統內只有一個CPU,而使用多線程時,那麼真實系統環境下不能並行,只能通過切換時間片的方式交替進行,而成爲併發執行任務。真正的並行也只能出現在擁有多個CPU的系統中。

3.3 阻塞和非阻塞

阻塞和非阻塞通常用來形容多線程間的相互影響,比如一個線程佔有了臨界區資源,那麼其他線程需要這個資源就必須進行等待該資源的釋放,會導致等待的線程掛起,這種情況就是阻塞,而非阻塞就恰好相反,它強調沒有一個線程可以阻塞其他線程,所有的線程都會嘗試地往前運行。

3.4 臨界區

臨界區用來表示一種公共資源或者說是共享數據,可以被多個線程使用。但是每個線程使用時,一旦臨界區資源被一個線程佔有,那麼其他線程必須等待。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章