java參數傳遞的祕密

Java基本功——Reference

版權聲明:轉載時請以超鏈接形式標明文章原始出處和作者信息及本聲明
http://www.blogbus.com/dreamhead-logs/1189478.html

這是一篇一年多之前便已寫就的文章,那時,因爲很多Java程序員只求追隨新生的事物,卻連基本的概念都沒有,很多討論中,很明顯是基本功不過硬,於是萌生寫一個系列文章,討論Java的基本功,下面便是在這個想法下催生出的第一篇文章。可事實上,真正完成的也只有這一篇。因爲未能及時發佈,它就被我遺忘在硬盤的角落中。今天,JavaEye上關於Java傳值還是傳引用的論戰讓我記起了自己曾經寫過的這篇文章,願與大家共享。

Java基本功——Reference

有這樣一種說法,如今爭鋒於IT戰場的兩大勢力,MS一族偏重於底層實現,Java一族偏重於系統架構。說法根據無從考證,但從兩大勢力各自的社區力量和圖書市場已有佳作不難看出,此說法不虛。於是,事情的另一面讓人忽略了。
偏巧,我是一個喜歡探究底層實現的Java程序員,雖然我的喜好並非純正咖啡,劍走偏鋒卻別是一番風味。

Reference
Java世界泰山北斗級大作《Thinking In Java》切入Java就提出“Everything is Object”。在Java這個充滿Object的世界中,reference是一切謎題的根源,所有的故事都是從這裏開始的。

Reference是什麼?
如果你和我一樣在進入Java世界之前曾經浪跡於C/C++世界,就一定不會對指針陌生。談到指針,往日種種不堪回首的經歷一下子涌上心頭,這裏不是抱怨的地方,讓我們暫時忘記指針的痛苦,回憶一下最初接觸指針的甜蜜吧!還記得你看過的教科書中,如何講解指針嗎?留在我印象中的一種說法是,指針就是地址,如同門牌號碼一樣,有了地址,你可以輕而易舉找到一個人家,而不必費盡心力的大海撈針。
C++登上歷史舞臺,reference也隨之而來,容我問個小問題,指針和reference區別何在?我的答案來自於在C++世界享譽盛名的《More Effective C++》。

  1. 沒有null reference。
  2. reference必須有初值。
  3. 使用reference要比使用指針效率高。因爲reference不需要測試其有效性。
  4. 指針可以重新賦值,而reference總是指向它最初獲得的對象

設計選擇:
當你指向你需要指向的某個東西,而且絕不會改指向其它東西,或是當你實作一個運算符而其語法需要無法有指針達成,你就應該選擇reference。其它任何時候,請採用指針。

這和Java有什麼關係?
初學Java,鑑於reference的名稱,我毫不猶豫的將它和C++中的reference等同起來。不過,我錯了。在Java中,reference可以隨心所欲的賦值置空,對比一下上面列出的差異,就不難發現,Java的reference如果要與C/C++對應,它不過是一個穿着reference外衣的指針而已。
於是,所有關於C中關於指針的理解方式,可以照搬到Java中,簡而言之,reference就是一個地址。我們可以把它想象成一個把手,抓住它,就抓住了我們想要操縱的數據。如同掌握C的關鍵在於掌握指針,探索Java的鑰匙就是reference。

一段小程序
我知道,太多的文字總是令人犯困,那就來段代碼吧!
public class ReferenceTricks {
  public static void main(String[] args) {
    ReferenceTricks r = new ReferenceTricks();
    // reset integer
    r.i = 0;
    System.out.println("Before changeInteger:" + r.i);
    changeInteger(r);
    System.out.println("After changeInteger:" + r.i);

    // just for format
    System.out.println();
  
    // reset integer
    r.i = 0;
    System.out.println("Before changeReference:" + r.i);
    changeReference(r);
    System.out.println("After changeReference:" + r.i);
  }

  private static void changeReference(ReferenceTricks r) {
   r = new ReferenceTricks();
   r.i = 5;
   System.out.println("In changeReference: " + r.i);
  }

  private static void changeInteger(ReferenceTricks r) {
   r.i = 5;
   System.out.println("In changeInteger:" + r.i);
  }

  public int i;
}

對不起,我知道,把一個字段設成public是一種不好的編碼習慣,這裏只是爲了說明問題。
如果你有興趣自己運行一下這個程序,我等你!

OK,你已經運行過了嗎?結果如何?是否如你預期?下面是我在自己的機器上運行的結果:
Before changeInteger:0
In changeInteger:5
After changeInteger:5

Before changeReference:0
In changeReference: 5
After changeReference:0

這裏,我們關注的是兩個change——changeReference和changeInteger。從輸出的內容中,我們可以看出,兩個方法在調用前和調用中完全一樣,差異出現在調用後的結果。

糊塗的講解
先讓我們來分析一下changeInteger的行爲。
前面說過了,Java中的reference就是一個地址,它指向了一個內存空間,這個空間存放着一個對象的相關信息。這裏我們暫時不去關心這個內存具體如何排布,只要知道,通過地址,我們可以找到r這個對象的i字段,然後我們給它賦成5。既然這個字段的內容得到了修改,從函數中返回之後,它自然就是改動後的結果了,所以調用之後,r對象的i字段依然是5。下圖展示了changeInteger調用前後內存變化。

     Reference +--------+                Reference +--------+
    ---------->| i = 0  |               ---------->| i = 5  |
               |--------|                          |--------|
               | Memory |                          | Memory |
               |        |                          |        | 
               |        |                          |        |
               +--------+                          +--------+

    調用changeInteger之前               調用changeInteger之後

讓我們把目光轉向changeReference。
從代碼上,我們可以看出,同changeInteger之間的差別僅僅在於多了這麼一句。
r = new ReferenceTricks();
這條語句的作用是分配一塊新的內存,然後將r指向它。
執行完這條語句,r就不再是原來的r,但它依然是一個ReferenceTricks的對象,所以我們依然可以對這個r的i字段賦值。到此爲止,一切都是那麼自然。

     Reference +--------+                          +--------+
    ---------->| i = 0  |                          | i = 0  |
               |--------|                          |--------|
               | Memory |                          | Memory |
               |        |                Reference |--------| 
               |        |               ---------->| i = 5  |
               +--------+                          +--------+

    調用changeReference之前              調用changeReference之後

順着這個思路繼續下去的話,執行完changeReference,輸出的r的i字段,那麼應該是應該是新內存中的i,所以應該是5。至於那塊被我們拋棄的內存,Java的GC功能自然會替我們善後的。
事與願違。
實際的結果我們已經看到了,輸出的是0。
肯定哪個地方錯了,究竟是哪個地方呢?

參數傳遞的祕密
知道方法參數如何傳遞嗎?
記得剛開始學編程那會兒,老師教導,所謂參數,有形式參數和實際參數之分,參數列表中寫的那些東西都叫形式參數,在實際調用的時候,它們會被實際參數所替代。
編譯程序不可能知道每次調用的實際參數都是什麼,於是寫編譯器的高手就出個辦法,讓實際參數按照一定順序放到一個大家都可以找得到的地方,以此作爲方法調用的一種約定。所謂“沒有規矩,不成方圓”,有了這個規矩,大家協作起來就容易多了。這個公共數據區,現在編譯器的選擇通常是“棧”,而所謂的順序就是形式參數聲明的順序。
顯然,程序運行的過程中,作爲實際參數的變量可能遍佈於內存的各個位置,而並不一定要老老實實的呆在棧裏。爲了守“規矩”,程序只好將變量複製一份到棧中,也就是通常所說的將參數壓入棧中。
打起精神,謎底就要揭曉了。
我剛纔說什麼來着?將變量複製一份到棧中,沒錯,“複製”!
這就是所謂的值傳遞。
C語言的曠世經典《The C Programming Language》開篇的第一章中,談到實際參數時說,“在C中,所有函數的實際參數都是傳‘值’的”。
馬上會有人站出來,“錯了,還有傳地址,比如以指針傳遞就是傳地址”。
不錯,傳指針就是傳地址。在把指針視爲地址的時候,是否考慮過這樣一個問題,它也是一個變量。前面的討論中說過了,參數傳遞必須要把參數壓入棧中,作爲地址的指針也不例外。所以,必須把這個指針也複製一份。函數中對於指針操作實際上是對於這個指針副本的操作。
Java的reference等於C的指針。所以,在Java的方法調用中,reference也要複製一份壓入堆棧。在方法中對reference的操作就是對這個reference副本的操作。
謎底揭曉
好,讓我們回到最初的問題上。
在changeReference中對於reference的賦值實際上是對這個reference的副本進行賦值,而對於reference的本尊沒有產生絲毫的影響。
回到調用點,本尊醒來,它並不知道自己睡去的這段時間內發生過什麼,所以只好當作什麼都沒發生過一般。就這樣,副本消失了,在方法中對它的修改也就煙消雲散了。
 
也許你會問出這樣的問題,“聽了你的解釋,我反而對changeInteger感到迷惑了,既然是對於副本的操作,爲什麼changeInteger可以運作正常?”
呵呵,很有趣的大腦短路現象。
好,那我就用前面的說法解釋一下changeInteger的運作。
所謂複製,其結果必然是副本完全等同於本尊。reference複製的結果必然是兩個reference指向同一塊內存空間。
雖然在方法中對於副本的操作並不會影響到本尊,但對內存空間的修改確實實實在在的。
回到調用點,雖然本尊依然不知道曾經發生過的一切,但它按照原來的方式訪問內存的時候,取到的確是經過方法修改之後的內容。
於是方法可以把自己的影響擴展到方法之外。
 
多說幾句
這個問題起源於我對C/C++中同樣問題的思考。同C/C++相比,在changeReference中對reference賦值可能並不會造成什麼很嚴重的後果,而在C/C++中,這麼做卻會造成臭名昭著的“內存泄漏”,根本的原因在於Java擁有了可愛的GC功能。即便這樣,我仍不推薦使用這種的手法,畢竟GC已經很忙了,我們怎麼好意思再麻煩人家。
在C/C++中,這個問題還可以繼續引申。既然在函數中對於指針直接賦值行不通,那麼如何在函數中修改指針呢?答案很簡單,指針的指針,也就是把原來的指針看作一個普通的數據,把一個指向它的指針傳到函數中就可以了。
同樣的問題到了Java中就沒有那麼美妙的解決方案了,因爲Java中可沒有reference的reference這樣的語法。可能的變通就是將reference進行封裝成類。至於值不值,公道自在人心。

參考文獻
1 《Thinking in Java》
2 《More Effective C++》
3 《The C Programming Language》

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章