enum類型的本質

                                                            enum類型的本質
    至從C語言開始enum類型就被作爲用戶自定義分類有限集合常量的方法被引入到了語言
當中,而且一度成爲C++中定義編譯期常量的唯一方法(後來在類中引入了靜態整型常量)。
    根據上面對enum類型的描述,到底enum所定義出來的類型是一個什麼樣的類型呢?作爲
一個用戶自定義的類型其所佔用的內存空間是多少呢?使用enum類型是否真的能夠起到有限
集合常量的邊界約束呢?大家可能都知道enum類型和int類型具有隱示(自動)轉換的規則,
那麼是否真的在任何地方都可以使用enum類型的變量來代替int類型的變量呢?下面會逐一
回答這些問題。
    1. 到底enum所定義出來的類型是一個什麼樣的類型呢?
       在C++中大家都知道僅僅有兩種大的類型分類:POD類型和類類型(不清楚的可以參
       見我的其他文章)。enum所定義的類型其實屬於POD類型,也就是說它會參與到POD
       類型的隱示轉換規則當中去,所以纔會出現enum類型與int類型之間的隱示轉換現象。
       那麼也就是說enum所定義的類型不具備名字空間限定能力(因爲不屬於類類型),
       其所定義的常量子具備和enum類型所在名字空間相同的可見性,由於自身沒有名字
       限定能力,所以會出現名字衝突現象。如:
           struct CEType
           {
               enum EType1 { e1, e2 };
               enum EType2 { e1, e2 };
           };
       上面的例子會出現e1、e2名字衝突編譯時錯誤,原因就在於枚舉子(e1、e2)是
       CEType名字空間中的名字,同樣在引用該CEType中的枚舉子時必須採用CEType::e1
       這樣的方式進行,而不是CEType::EType1::e1來進行引用。
    2. 作爲一個用戶自定義的類型其所佔用的內存空間是多少呢?
       該問題就是sizeof( EType1 )等於多少的問題,是不是每一個用戶自定義的枚舉類
       型都具有相同的尺寸呢?在大多數的32位編譯器下(如:VC++、gcc等)一個枚舉類
       型的尺寸其實就是一個sizeof( int )的大小,難道枚舉類型的尺寸真的就應該是int
       類型的尺寸嗎?其實不是這樣的,在C++標準文檔(ISO14882)中並沒有這樣來定義,
       標準中是這樣說明的:“枚舉類型的尺寸是以能夠容納最大枚舉子的值的整數的尺寸”,
       同時標準中也說名了:“枚舉類型中的枚舉子的值必須要能夠用一個int類型表述”,
       也就是說,枚舉類型的尺寸不能夠超過int類型的尺寸,但是是不是必須和int類型
       具有相同的尺寸呢?上面的標準已經說得很清楚了,只要能夠容納最大的枚舉子的
       值的整數就可以了,那麼就是說可以是char、short和int。例如:
           enum EType1 { e1 = CHAR_MAX };
           enum EType2 { e2 = SHRT_MAX };
           enum EType3 { e3 = INT_MAX  };
       上面的三個枚舉類型分別可以用char、short、int的內存空間進行表示,也就是:
           sizeof( EType1 ) == sizeof( char  );
           sizeof( EType2 ) == sizeof( short );
           sizeof( EType3 ) == sizeof( int   );
       那爲什麼在32位的編譯器下都會將上面三個枚舉類型的尺寸編譯成int類型的尺寸呢?
       主要是從32位數據內存對其方面的要求進行考慮的,在某些計算機硬件環境下具有對
       齊的強制性要求(如:sun SPARC),有些則是因爲採用一個完整的32位字長CPU處理
       效率非常高的原因(如:IA32)。所以不可以簡單的假設枚舉類型的尺寸就是int類
       型的尺寸,說不定會遇到一個編譯器爲了節約內存而採用上面的處理策略。
    3. 使用enum類型是否真的能夠起到有限集合常量的邊界約束呢?
       首先看一下下面這個例子:
           enum EType { e1 = 0, e2 };
           void func1( EType e )
           {
               if ( e == e1 )
               {
                   // do something
               }
               // do something because e != e1 must e == e2
           }
           void func2( EType e )
           {
               if ( e == e1 )
               {
                   // do something
               }
               else if ( e == e2 )
               {
                   // do something
               }
           }
           
           func1( static_cast<EType>( 2  ) );
           func2( static_cast<EType>( -1 ) );
       上面的代碼應該很清楚的說明了這樣一種異常的情況了,在使用一個操出範圍的整
       型值調用func1函數時會導致函數採取不該採取的行爲,而第二個函數可能會好一些
       他僅僅是忽略了超出範圍的值。這就說明枚舉所定義的類型並不是一個真正強類型
       的有限常量集合,這樣一種條件下和將上述的兩個函數參數聲明成爲整數類型沒有
       任何差異。所以以後要注意標準定義中枚舉類型的陷阱。(其實只有類類型纔是真
       正的強類型)
      
    4. 是否真的在任何地方都可以使用enum類型的變量來代替int類型的變量呢?
       通過上面的討論,其實枚舉類型的變量和整型變量具有了太多的一致性和可互換性,
       那麼是不是在每一個可以使用int類型的地方都可以很好的用枚舉類型來替代呢?
       其實也不是這樣的,畢竟枚舉類型是一個在編譯時可區分的類型,同時第2點的分析
       枚舉類型不一定和int類型具有相同的尺寸,這兩個差異就決定了在某些場合是不可
       以使用枚舉類型來代替int類型的。如:
           第一種情況:
               enum EType { e1 = 0, e2, e3 };
               EType val;
               std::cin >> val;
           第二種情況:
               enum EType { e1 = 0, e2, e3 };
               EType val;
               std::scanf( "%d", &val );
       上面的兩種情況看是基本上屬於同一種類型的問題,其實不然。第一種情況會導致
       編譯時錯誤,會因爲std::cin沒有定義對應的枚舉類型的重載>>運算符而出錯,這
       就說明枚舉類型是一種獨立和鑑別的類型;而第二種情況不會有任何編譯時問題,
       但是可能會導致scanf函數棧被破壞而使得程序運行非法,爲什麼會這樣呢?上面
       已經分析過了枚舉類型變量的尺寸不一定和int類型相同,這樣一來我們採用%d就
       是說將枚舉類型變量val當作4字節的int變量來看待並進行參數壓棧,而在某些編
       譯器下sizeof( val )等於1字節,這樣scanf函數就會將val變量地址中的後續的三
       字節地址也壓入棧中,並對其進行賦值,也許val變量後續的三個字節的地址沒有
       特殊含義可以被改寫(比如是字節對齊的空地址空間),可能會認爲他不會出現錯
       誤,其實不然,在scanf函數調用結束後會進行棧清理,這樣一來會導致scanf函數
       清理了過多的地址空間,從而破壞了外圍函數的棧指針的指向,從而必然會導致程
       序運行時錯誤。

    由上面的說明枚舉類型有那麼多的缺點,那我們怎樣才能夠有一個類型安全的枚舉類型
呢?其實可以採用類類型來模擬枚舉類型的有限常量集合的概念,同時得到類型安全的好處,
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章