簡單直觀-實戰體會Java多線程編程的精要

簡單直觀-實戰體會Java多線程編程的精要

Java 程序中使用多線程要比在 C C++ 中容易得多,這是因爲 Java 編程語言提供了語言級的支持。本文通過簡單的編程示例來說明 Java 程序中的多線程是多麼直觀。讀完本文以後,用戶應該能夠編寫簡單的多線程程序。

爲什麼會排隊等待?

下面的這個簡單的 Java 程序完成四項不相關的任務。這樣的程序有單個控制線程,控制在這四個任務之間線性地移動。此外,因爲所需的資源打印機、磁盤、數據庫和顯示屏 -- 由於硬件和軟件的限制都有內在的潛伏時間,所以每項任務都包含明顯的等待時間。因此,程序在訪問數據庫之前必須等待打印機完成打印文件的任務,等等。如果您正在等待程序的完成,則這是對計算資源和您的時間的一種拙劣使用。改進此程序的一種方法是使它成爲多線程的。

四項不相關的任務

class myclass {

static public void main(String args[]) {

    print_a_file();

    manipulate_another_file();

    access_database();

    draw_picture_on_screen();

    }

}

在本例中,每項任務在開始之前必須等待前一項任務完成,即使所涉及的任務毫不相關也是這樣。但是,在現實生活中,我們經常使用多線程模型。我們在處理某些任務的同時也可以讓孩子、配偶和父母完成別的任務。例如,我在寫信的同時可能打發我的兒子去郵局買郵票。用軟件術語來說,這稱爲多個控制(或執行)線程。

可以用兩種不同的方法來獲得多個控制線程:

多個進程
在大多數操作系統中都可以創建多個進程。當一個程序啓動時,它可以爲即將開始的每項任務創建一個進程,並允許它們同時運行。當一個程序因等待網絡訪問或用戶輸入而被阻塞時,另一個程序還可以運行,這樣就增加了資源利用率。但是,按照這種方式創建每個進程要付出一定的代價:設置一個進程要佔用相當一部分處理器時間和內存資源。而且,大多數操作系統不允許進程訪問其他進程的內存空間。因此,進程間的通信很不方便,並且也不會將它自己提供給容易的編程模型。

線程

線程也稱爲輕型進程 (LWP)。因爲線程只能在單個進程的作用域內活動,所以創建線程比創建進程要廉價得多。這樣,因爲線程允許協作和數據交換,並且在計算資源方面非常廉價,所以線程比進程更可取。線程需要操作系統的支持,因此不是所有的機器都提供線程。Java 編程語言,作爲相當新的一種語言,已將線程支持與語言本身合爲一體,這樣就對線程提供了強健的支持。

 使用 Java 編程語言實現線程

Java編程語言使多線程如此簡單有效,以致於某些程序員說它實際上是自然的。儘管在 Java 中使用線程比在其他語言中要容易得多,仍然有一些概念需要掌握。要記住的一件重要的事情是 main() 函數也是一個線程,並可用來做有用的工作。程序員只有在需要多個線程時才需要創建新的線程。

Thread
Thread
類是一個具體的類,即不是抽象類,該類封裝了線程的行爲。要創建一個線程,程序員必須創建一個從 Thread 類導出的新類。程序員必須覆蓋 Thread run() 函數來完成有用的工作。用戶並不直接調用此函數;而是必須調用 Thread start() 函數,該函數再調用 run()。下面的代碼說明了它的用法:

創建兩個新線程

import java.util.*;

 

class TimePrinter extends Thread {

    int pauseTime;

    String name;

    public TimePrinter(int x, String n) {

        pauseTime = x;

        name = n;

    }

 

    public void run() {

        while(true) {

            try {

                System.out.println(name + ":" + new

                    Date(System.currentTimeMillis()));

                Thread.sleep(pauseTime);

            } catch(Exception e) {

                System.out.println(e);

            }

        }

    }

 

    static public void main(String args[]) {

        TimePrinter tp1 = new TimePrinter(1000, "Fast Guy");

        tp1.start();

        TimePrinter tp2 = new TimePrinter(3000, "Slow Guy");

        tp2.start();

   

    }

}

在本例中,我們可以看到一個簡單的程序,它按兩個不同的時間間隔(1 秒和 3 秒)在屏幕上顯示當前時間。這是通過創建兩個新線程來完成的,包括 main() 共三個線程。但是,因爲有時要作爲線程運行的類可能已經是某個類層次的一部分,所以就不能再按這種機制創建線程。雖然在同一個類中可以實現任意數量的接口,但 Java 編程語言只允許一個類有一個父類。同時,某些程序員避免從 Thread 類導出,因爲它強加了類層次。對於這種情況,就要 runnable 接口

Runnable 接口

此接口只有一個函數,run(),此函數必須由實現了此接口的類實現。但是,就運行這個類而論,其語義與前一個示例稍有不同。我們可以用 runnable 接口改寫前一個示例。(不同的部分用黑體表示。)

創建兩個新線程而不強加類層次

import java.util.*;

 

class TimePrinter implements Runnable {

    int pauseTime;

    String name;

    public TimePrinter(int x, String n) {

        pauseTime = x;

        name = n;

    }

 

    public void run() {

        while(true) {

            try {

                System.out.println(name + ":" + new

                    Date(System.currentTimeMillis()));

                Thread.sleep(pauseTime);

            } catch(Exception e) {

                System.out.println(e);

            }

        }

    }

 

    static public void main(String args[]) {

        Thread t1 = new Thread(new TimePrinter(1000, "Fast Guy"));

        t1.start();

        Thread t2 = new Thread(new TimePrinter(3000, "Slow Guy"));

        t2.start();

   

    }

}

請注意,當使用 runnable 接口時,您不能直接創建所需類的對象並運行它;必須從 Thread 類的一個實例內部運行它。許多程序員更喜歡 runnable 接口,因爲從 Thread 類繼承會強加類層次。

synchronized 關鍵字
到目前爲止,我們看到的示例都只是以非常簡單的方式來利用線程。只有最小的數據流,而且不會出現兩個線程訪問同一個對象的情況。但是,在大多數有用的程序中,線程之間通常有信息流。試考慮一個金融應用程序,它有一個 Account 對象,如下例中所示:

一個銀行中的多項活動

public class Account {

    String holderName;

    float amount;

    public Account(String name, float amt) {

        holderName = name;

        amount = amt;

    }

 

    public void deposit(float amt) {

        amount += amt;

    }

 

    public void withdraw(float amt) {

        amount -= amt;

    }

 

    public float checkBalance() {

        return amount;

    }

}

在此代碼樣例中潛伏着一個錯誤。如果此類用於單線程應用程序,不會有任何問題。但是,在多線程應用程序的情況中,不同的線程就有可能同時訪問同一個 Account 對象,比如說一個聯合帳戶的所有者在不同的 ATM 上同時進行訪問。在這種情況下,存入和支出就可能以這樣的方式發生:一個事務被另一個事務覆蓋。這種情況將是災難性的。但是,Java 編程語言提供了一種簡單的機制來防止發生這種覆蓋。每個對象在運行時都有一個關聯的鎖。這個鎖可通過爲方法添加關鍵字 synchronized 來獲得。這樣,修訂過的 Account 對象(如下所示)將不會遭受像數據損壞這樣的錯誤:

對一個銀行中的多項活動進行同步處理

public class Account {

    String holderName;

    float amount;

    public Account(String name, float amt) {

        holderName = name;

        amount = amt;

    }

 

    public synchronized void deposit(float amt) {

        amount += amt;

    }

 

    public synchronized void withdraw(float amt) {

        amount -= amt;

    }

 

    public float checkBalance() {

        return amount;

    }

}

deposit() withdraw() 函數都需要這個鎖來進行操作,所以當一個函數運行時,另一個函數就被阻塞。請注意, checkBalance() 未作更改,它嚴格是一個讀函數。因爲 checkBalance() 未作同步處理,所以任何其他方法都不會阻塞它,它也不會阻塞任何其他方法,不管那些方法是否進行了同步處理。

 Java 編程語言中的高級多線程支持

線程組

線程是被個別創建的,但可以將它們歸類到線程組中,以便於調試和監視。只能在創建線程的同時將它與一個線程組相關聯。在使用大量線程的程序中,使用線程組組織線程可能很有幫助。可以將它們看作是計算機上的目錄和文件結構。

線程間發信

當線程在繼續執行前需要等待一個條件時,僅有 synchronized 關鍵字是不夠的。雖然 synchronized 關鍵字阻止併發更新一個對象,但它沒有實現線程間發信Object 類爲此提供了三個函數:wait()notify() notifyAll()。以全球氣候預測程序爲例。這些程序通過將地球分爲許多單元,在每個循環中,每個單元的計算都是隔離進行的,直到這些值趨於穩定,然後相鄰單元之間就會交換一些數據。所以,從本質上講,在每個循環中各個線程都必須等待所有線程完成各自的任務以後才能進入下一個循環。這個模型稱爲 屏蔽同步,下例說明了這個模型:

屏蔽同步

public class BSync {

    int totalThreads;

    int currentThreads;

 

    public BSync(int x) {

        totalThreads = x;

        currentThreads = 0;

    }

 

    public synchronized void waitForAll() {

        currentThreads++;

        if(currentThreads < totalThreads) {

            try {

                wait();

            } catch (Exception e) {}

        }

        else {

            currentThreads = 0;

            notifyAll();

        }

    }

}

 

當對一個線程調用 wait() 時,該線程就被有效阻塞,只到另一個線程對同一個對象調用 notify() notifyAll() 爲止。因此,在前一個示例中,不同的線程在完成它們的工作以後將調用 waitForAll() 函數,最後一個線程將觸發 notifyAll() 函數,該函數將釋放所有的線程。第三個函數 notify() 只通知一個正在等待的線程,當對每次只能由一個線程使用的資源進行訪問限制時,這個函數很有用。但是,不可能預知哪個線程會獲得這個通知,因爲這取決於 Java 虛擬機 (JVM) 調度算法。

CPU 讓給另一個線程

當線程放棄某個稀有的資源(如數據庫連接或網絡端口)時,它可能調用 yield() 函數臨時降低自己的優先級,以便某個其他線程能夠運行。

守護線程

有兩類線程:用戶線程和守護線程。用戶線程是那些完成有用工作的線程。 守護線程是那些僅提供輔助功能的線程。Thread 類提供了 setDaemon() 函數。Java 程序將運行到所有用戶線程終止,然後它將破壞所有的守護線程。在 Java 虛擬機 (JVM) 中,即使在 main 結束以後,如果另一個用戶線程仍在運行,則程序仍然可以繼續運行。

避免不提倡使用的方法

不提倡使用的方法是爲支持向後兼容性而保留的那些方法,它們在以後的版本中可能出現,也可能不出現。Java 多線程支持在版本 1.1 和版本 1.2 中做了重大修訂,stop()suspend() resume() 函數已不提倡使用。這些函數在 JVM 中可能引入微妙的錯誤。雖然函數名可能聽起來很誘人,但請抵制誘惑不要使用它們。

調試線程化的程序

在線程化的程序中,可能發生的某些常見而討厭的情況是死鎖、活鎖、內存損壞和資源耗盡。

死鎖
死鎖可能是多線程程序最常見的問題。當一個線程需要一個資源而另一個線程持有該資源的鎖時,就會發生死鎖。這種情況通常很難檢測。但是,解決方案卻相當好:在所有的線程中按相同的次序獲取所有資源鎖。例如,如果有四個資源 —ABC D — 並且一個線程可能要獲取四個資源中任何一個資源的鎖,則請確保在獲取對 B 的鎖之前首先獲取對 A 的鎖,依此類推。如果線程 1”希望獲取對 B C 的鎖,而線程 2”獲取了 AC D 的鎖,則這一技術可能導致阻塞,但它永遠不會在這四個鎖上造成死鎖。

活鎖
當一個線程忙於接受新任務以致它永遠沒有機會完成任何任務時,就會發生活鎖。這個線程最終將超出緩衝區並導致程序崩潰。試想一個祕書需要錄入一封信,但她一直在忙於接電話,所以這封信永遠不會被錄入。

內存損壞

如果明智地使用 synchronized 關鍵字,則完全可以避免內存錯誤這種氣死人的問題。

資源耗盡
某些系統資源是有限的,如文件描述符。多線程程序可能耗盡資源,因爲每個線程都可能希望有一個這樣的資源。如果線程數相當大,或者某個資源的侯選線程數遠遠超過了可用的資源數,則最好使用 資源池。一個最好的示例是數據庫連接池。只要線程需要使用一個數據庫連接,它就從池中取出一個,使用以後再將它返回池中。資源池也稱爲 資源庫

調試大量的線程

有時一個程序因爲有大量的線程在運行而極難調試。在這種情況下,下面的這個類可能會派上用場:

public class Probe extends Thread {

    public Probe() {}

    public void run() {

 

        while(true) {

            Thread[] x = new Thread[100];

            Thread.enumerate(x);

 

            for(int i=0; i<100; i++) {

            Thread t = x[i];

            if(t == null)

                break;

            else

                System.out.println(t.getName() + "/t" + t.getPriority()

                + "/t" + t.isAlive() + "/t" + t.isDaemon());

            }

        }

    }

}

 限制線程優先級和調度

Java 線程模型涉及可以動態更改的線程優先級。本質上,線程的優先級是從 1 10 之間的一個數字,數字越大表明任務越緊急。JVM 標準首先調用優先級較高的線程,然後才調用優先級較低的線程。但是,該標準對具有相同優先級的線程的處理是隨機的。如何處理這些線程取決於基層的操作系統策略。在某些情況下,優先級相同的線程分時運行;在另一些情況下,線程將一直運行到結束。請記住,Java 支持 10 個優先級,基層操作系統支持的優先級可能要少得多,這樣會造成一些混亂。因此,只能將優先級作爲一種很粗略的工具使用。最後的控制可以通過明智地使用 yield() 函數來完成。通常情況下,請不要依靠線程優先級來控制線程的狀態。

小結

本文說明了在 Java 程序中如何使用線程。像是否應該使用線程這樣的更重要的問題在很大程序上取決於手頭的應用程序。決定是否在應用程序中使用多線程的一種方法是,估計可以並行運行的代碼量。並記住以下幾點:

  • 使用多線程不會增加 CPU 的能力。但是如果使用 JVM 的本地線程實現,則不同的線程可以在不同的處理器上同時運行(在多 CPU 的機器中),從而使多 CPU 機器得到充分利用。

  • 如果應用程序是計算密集型的,並受 CPU 功能的制約,則只有多 CPU 機器能夠從更多的線程中受益。

  • 當應用程序必須等待緩慢的資源(如網絡連接或數據庫連接)時,或者當應用程序是非交互式的時,多線程通常是有利的。

基於 Internet 的軟件有必要是多線程的;否則,用戶將感覺應用程序反映遲鈍。例如,當開發要支持大量客戶機的服務器時,多線程可以使編程較爲容易。在這種情況下,每個線程可以爲不同的客戶或客戶組服務,從而縮短了響應時間。

某些程序員可能在 C 和其他語言中使用過線程,在那些語言中對線程沒有語言支持。這些程序員可能通常都被搞得對線程失去了信心。

參考資料

作者簡介
Neel V. Kumar
是一位軟件工程師,他有八年的面向對象編程經驗,所使用的語言爲 C++ Java 編程語言。他出生於 Iowa,目前住在加利福尼亞的 Menlo Park,剛剛涉足電信領域。以前他對許多項目提供過諮詢服務,樂意與他人分享他的知識。可以通過 [email protected] 與他聯繫。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章