[019] C#基礎:理解裝箱與拆箱

.NET大牛之路 • 王亮@精緻碼農 • 2021.08.27

前面我們講到 .NET 平臺支持的兩大數據類型:值類型和引用類型。值類型比引用類型更高效,因爲它沒有指針引用,不用分配在託管堆中,也不用被 GC 回收。但有時候你可能偶爾需要將一種類型的變量表示爲另一種類型的變量。爲此,C# 提供了裝箱拆箱的機制。

1理解裝箱

簡單地說,裝箱就是將一個值類型的數據存儲在一個引用類型的變量中。

假設你一個方法中創建了一個 int 類型的本地變量,你要將這個值類型表示爲一個引用類型,那麼就表示你對這個值進行了裝箱操作,如下所示:

static void SimpleBox()
{
  int myInt = 25;

  // 裝箱操作
  object boxedInt = myInt;
}

確切地說,裝箱的過程就是將一個值類型分配給 Object 類型變量的過程。當你裝箱一個值時,CoreCLR 會在堆上分配一個新的對象,並將該值類型的值複製到該對象實例。返回給你的是一個在託管堆中新分配的對象的引用。

2理解拆箱

反過來,將 Object 引用類型變量的值轉換回棧中相應的值類型的過程則稱爲拆箱

從語法上講,拆箱操作看起來就像一個正常的轉換操作。然而,其語義是完全不同的。CoreCLR 首先驗證接收的數據類型是否等同於被裝箱的類型,如果是,它就把值複製回基於棧存儲的本地變量中。

例如,如果下面的 boxedInt 的底層類型確實是 int,那就完成了拆箱操作:

static void SimpleBoxUnbox()
{
  int myInt = 25;

  // 裝箱操作
  object boxedInt = myInt;

  // 拆箱操作
  int unboxedInt = (int)boxedInt;
}

記住,與執行典型的類型轉換不同,你必須將其拆箱到一個恰當的數據類型中。如果你試圖將一塊數據拆箱到不正確的數據類型中,將會拋出 InvalidCastException 異常。爲了安全起見,如果你不能保證 Object 類型背後的類型,最好使用 try/catch 邏輯把拆箱操作包起來,儘管這樣會有些麻煩。考慮下面的代碼,它將拋出一個錯誤,因爲你正試圖將裝箱的 int 類型拆箱成一個 long 類型:

static void SimpleBoxUnbox()
{
  int myInt = 25;

  // 裝箱操作
  object boxedInt = myInt;

  // 拆箱到錯誤的數據類型,將觸發運行時異常
  try
  {
    long unboxedLong = (long)boxedInt;
  }
  catch (InvalidCastException ex)
  {
    Console.WriteLine(ex.Message);
  }
}

3生成的 IL 代碼

當 C# 編譯器遇到裝箱/拆箱語法時,它會生成包含裝箱/拆箱操作的 IL 代碼。如果你用 ildasm.exe 查看編譯的程序集,你會看到裝箱和拆箱操作對應的 boxunbox 指令:

.method assembly hidebysig static
    void  '<<Main>$>g__SimpleBoxUnbox|0_0'() cil managed
{
  .maxstack  1
  .locals init (int32 V_0, object V_1, int32 V_2)
    IL_0000:  nop
    IL_0001:  ldc.i4.s   25
    IL_0003:  stloc.0
    IL_0004:  ldloc.0
    IL_0005:  box        [System.Runtime]System.Int32
    IL_000a:  stloc.1
    IL_000b:  ldloc.1
    IL_000c:  unbox.any  [System.Runtime]System.Int32
    IL_0011:  stloc.2
    IL_0012:  ret
  } // end of method '<Program>$'::'<<Main>$>g__SimpleBoxUnbox|0_0'

乍一看,裝箱/拆箱似乎是一個沒啥用的語言特性,學術性大於實用性。畢竟,你很少需要在一個本地 Object 變量中存儲一個本地值類型。然而,事實是裝箱/解箱過程是相當有用的,因爲它允許你假設一切都可以被當作 Object 類型來處理,而 CoreCLR 會自動幫你處理與內存有關的細節。

4實際應用

讓我們來看看裝箱/拆箱的實際應用,我們以 C# 的 ArrayList 類爲例,用它來保存一批在棧中存儲的整型數據。ArrayList 類的相關方法成員列舉如下:

public class ArrayList : IList, ICloneable
{
...
  public virtual int Add(object? value);
  public virtual void Insert(int index, object? value);
  public virtual void Remove(object? obj);
  public virtual object? this[int index] { get; set; }
}

請注意,上面 ArrayList 的方法都是對 Object 類型數據進行操作。ArrayList 是爲操作對象(代表任何類型)而設計的,而對象是在託管堆上分配的數據。請考慮下面代碼:

static void WorkWithArrayList()
{
  // 當傳遞給對象的方法時,值類型會自動被裝箱
  ArrayList myInts = new ArrayList();
  myInts.Add(10);
}

儘管你直接將數字數據傳入需要 Object 參數的方法中,但運行時自動將分配在棧中的數據裝箱。如果你想使用索引器從 ArrayList 中檢索一條數據,你必須使用轉換操作將堆分配的對象拆箱爲棧分配的整型,因爲 ArrayList 的索引器返回的是 Object 類型,而不是 int 類型。

static void WorkWithArrayList()
{
  // 當傳遞給需要對象參數的方法時,值類型就自動被裝箱
  ArrayList myInts = new ArrayList();
  myInts.Add(10);

  // 當對象被轉換回基於棧存儲的數據時,就會發生拆箱
  int i = (int)myInts[0];

  // 由於 WriteLine() 需要的 object 參數,又重新裝箱了
  Console.WriteLine("Value of your int: {0}", i);
}

在調用 ArrayList.Add() 之前,在棧中分配的 int 數值被裝箱了,所以它可以被傳入參數爲 Object 類型的方法中。從 ArrayList 中檢索到 Object 類型的數據時,通過轉換操作,它就被拆箱成 int 類型。最後,當它被傳遞給 Console.WriteLine() 方法時,又被裝箱了,因爲這個方法的參數是 Object 類型。

5小結

從程序員的角度來看,裝箱和拆箱是很方便的,我們不需要手動去複製和轉移內存中的值類型和引用類型的數據。

但裝箱和拆箱背後的棧/堆內存轉移也帶來了性能問題。下面總結一下對一個簡單的整型數進行裝箱和拆箱所需要的步驟:

  1. 在託管堆中分配一個新對象;

  2. 在棧中的數據值被轉移到該託管堆中的對象上;

  3. 當拆箱時,存儲在堆中對象上的值被轉移回棧中;

  4. 堆上未使用的對象將最終被 GC 回收。

儘管很多時候裝箱和拆箱操作不會在性能方面造成重大影響,但如果一個像 ArrayList 這樣的集合包含成千上萬條數據,而你的程序又會頻繁操作這些數據,性能的影響還是會很明顯的。

所以,我們平時在編程時應當儘量避免發生裝箱和拆箱操作。比如對於上面 ArrayList 的示例,如果集合元素類型是一致的,則應當使用泛型的集合類型,比如改用 List<T>LinkedList<T> 等。

本文分享自微信公衆號 - 一線碼農聊技術(dotnetfly)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章