一個Java方法能使用多少個參數?

我最近給我fork的項目QuickTheories增加了一個接口:

@FunctionalInterface
public interface QuadFunction<A, B, C, D, E> {
    E apply(A a, B b, C c, D d);
}

這讓非常好奇一個方法能夠有多少個類型參數呢?據我所知,Java的語言規範並沒有提到這個問題。1

關於在實現上這個閾值的定義,我有兩個猜測:

  1. 編譯器會強制一個可預測的閾值,例如255或者65535。
  2. 由於實現細節的原因,編譯器的異常處理會施加意想不到的限制。

我不想通過我薄弱的C++技能來測試源代碼,所以我決定直接來測試編譯器2。我寫了一個Python腳本,通過二分法找到一個會觸發錯誤的最小值。完整的代碼請見連接Github Repo

最直接的辦法就是生成方法。幸運的是,我們不必使用任何已有的類型參數,只需要按照<A,B,C..>的形式來生成:

def write_type_plain(count):
    with open('Test.java', 'w') as f:
        f.write("public class Test {\n")
        f.write("public <")
        for i in range(count):
            if (i > 0):
                f.write(", ")
            f.write("A" + str(i + 1))
        f.write("> void testMethod() {}")
        f.write("}")

運行這個二分法的代碼會有如下輸出:

>>> error: UTF8 representation for string "<A1:Ljava/lang/Objec..." is too long for the constant pool 
>>> largest type: 2776

這個錯誤讓人有點費解,但是從事後來看還是可以理解的。編譯器生成的類文件包含多個字符串,包括每個方法的方法簽名。這些字符串保存在常量池內,而常量池的內容有最大65535字節數的限制,這個是JVM的所定義的。

所以,我之前的猜測都不是完全的正確。類型參數的最大個數是一個意料之外的值,而不是一個確定值。但是,編譯器的實現本身並不是導致錯誤的原因3。相反,是JVM類文件的格式要求限制了類型參數可使用的數量。其實JVM對泛型本身一無所知。

這同時也表示類型參數的最大個數取決於你寫的方法代碼4。我嘗試用另外一種類型參數的編碼方案(先前鏈接文中的write_type_compact),使用全部合法的ASCII字符。這個實現是有點繁瑣的,因爲字符0-9是合法的,但不能作爲標識符的首字母,並且Java關鍵字也不能作爲類型參數。我僅僅將ifdo替換爲等長的UTF-8字符。採用這種更緊湊的編碼方案讓類型參數的個數從2776提升到了3123。

還是有一些不太方便的地方,例如_A是一個合法的Java標識符,但是_不是。我的編碼在不使用_作爲首字幕的情況下,最高生成了3392個2字節的類型參數。所以我覺得不用考慮_作爲首字母的情況了。

另外一個技巧

通過反編譯類文件,我觀察到65536個字符中大部分都不是我生成的類型參數,而是重複的字符串Ljava/lang/Object;。這是因爲類型參數沒有包含額外的信息,所以類文件將其視爲Object的繼承,並將它們編入方法簽名內。我通過修改我的生成器來優化這個問題。

循環的關鍵代碼修改爲:

s = type_var(i)
f.write(s)
if (s != 'A'):
    f.write(" extends A")

除開一個實例之外,所有的類型參數都從繼承java/lang/Object改爲繼承A。這個修改將類型參數的數量提升到9851個。

類型參數的數量提升了非常多,而我所使用的編碼方法還可以繼續改進。例如使用非ASCII unicode標識符,不過我已經比較滿意現在的效果了。

這些都不重要

在實際情況中是不太可能達到上述數量限制的。代碼生成時可能會達到語言或者編譯器的某些極限,就算罕見的遇到了生成上百個類型參數的情況,那距離幾千個的限制仍然還相距很遠。

儘管如此,如果我是規則的制定者,我將不允許任何類或者方法使用超過255個類型參數的情況。即使隻影響了百萬分之一的程序,有明確的限制會更好。

  1. §4.4, §8.1.2, §9.1.2, §8.4.4, §8.8.4 這些章節都和方法或者類的類型參數有關,但是都沒有指明允許有多少個類型參數。
  2. 當我寫這段話時,我想起了Hotspot是C++寫的,javac是Java寫的。就算這樣我依然會選擇做代碼實驗,而不是閱讀代碼。閱讀別人代碼是種煎熬
  3. 逗號之後的空格不會影響,因爲編譯器會規範化它的輸出。
  4. 這也表示與我使用哪個JVM無關。爲了完整性,我在Fedora 29上使用了1.8.0_191-b13版本的OpenJdk。

本文作者:justinblank, 翻譯:1 Way
原文鏈接:https://justinblank.com/experiments/howmanytypeparameterscanajavamethodhave.html
譯文首發:http://blog.didispace.com/howmanytypeparameterscanajavamethodhave/

本文有spring4all技術翻譯組完成,更多國外前沿知識和乾貨好文,歡迎關注公衆號:後端面試那些事兒。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章