C/C++/Java數據類型比較及Java位操作運算講解

Java 位操作這是一項很基礎很基礎的知識內容,在所有 Android 和 Java 開發者的學習之路上,大家都接觸過,但是實際運用的場景卻很少見,很多人估計都忘記有這個知識點了。事實上,在 C/C++ 開發領域因爲與硬件的聯繫更緊密,所以位操作運算應用的更普遍。Java 因爲面向對象的特性很多時候不需要接觸位操作,但是在某些特定場景下,巧妙運用位操作,能夠起到非常高效的的表現。這篇博文不談應用,只詳細講解與位操作有關的知識點。

基礎大講堂

所有數值都是2進制

軟件開發者都知道 10 進制、16 進制、8 進制。
比如數字 10 的各位進制形式表現如下。

十進制:10
八進制:012
十六進制:0x0a
二進制:1010

雖然有很多種進制,但是實際上計算機所認識的數據只有 0 和 1,因此所有的數值不管它是十進制、十六進制也好都會統統在底層被翻譯成二進制數值。

int a = 5;
//0101 就是 a 的二進制表示。  

int b = 520;
//1000001000 就是 b 的二進制表示

bit、byte、world

  1. bit (位) bit 電腦記憶體中最小的單位,在二進位電腦系統中,每一 bit 可以代表 0 或 1 的數位訊號。所以它能表示的數字範圍就是 0 ~ 1。
  2. byte (字節) 一個 byte 由 8 bit 組成,所以理論上一個 byte 能表示的數據範圍是 0 ~ 255。
  3. word (字) 一個 word 由 2 byte 組成,所以理論上一個 word 能表示的數據範圍是 0 ~ 65535。

大家可以看這張圖加深下理解。
這裏寫圖片描述

32 位與 64 位操作系統。

一般計算機設備上,CPU 主要有 32 位和 64 位(當然,單片機有 8 位和 16 位),32 位 CPU 能夠尋址的範圍是 4 GB。所以過去的電腦設備內存最高一般只能到達 4 GB。後來,隨着芯片技術的發展,越來越多的機器採用了 64 位 CPU。這使得機器的最大內存可以爲 16 GB。

那麼好,我們再來談談 32 位操作系統與 64 位操作系統。實際上它們分別是針對 CPU 類型設計的軟件系統。

32 bit 是 4 byte。通常一條 CPU 指令是 4 byte。在 32 位操作系統上,如果一條 CPU 指令是 4 byte,那麼 CPU 執行一次能夠讀取 32 bit 內容,所以一個指令週期內就能夠完成指令,如果一條 CPU 指令是 8 byte 的話,那麼 32 位操作系統就需要通過 2 個指令週期才能完成指令的讀取,而對應的 64 位操作系統因爲一次能夠讀取 64 bit 內容,所以它在一個指令週期就能夠讀取指令。所以,理論上,64 位的操作系統是要比 32 位操作系統要快 1 倍。

但還有幾個需要大家注意的地方是:
1. 64 位 CPU 機器可以安裝 32 位操作系統,但效率自然跟 32 位操作系統一樣。
2. 32 位 CPU 機器也可以安裝 64 位操作系統。
3. 64 位 CPU 機器安裝 64 位操作系統才最有效率,但跟軟件優化也有關係。

不同的操作系統平臺,給 C/C++ 基本數據類型變量分配的字節是不一樣的。

32位編譯器:

  char :1個字節
  char*(即指針變量): 4個字節(32位的尋址空間是2^32, 即32個bit,也就是4個字節。同理64位編譯器)
  short int : 2個字節
  int:  4個字節
  unsigned int : 4個字節
  float:  4個字節
  double:   8個字節
  long:   4個字節
  long long:  8個字節
  unsigned long:  4個字節

64位編譯器:

  char :1個字節
  char*(即指針變量): 8個字節
  short int : 2個字節
  int:  4個字節
  unsigned int : 4個字節
  float:  4個字節
  double:   8個字節
  long:   8個字節
  long long:  8個字節
  unsigned long:  8個字節

上面講的是 C/C++ 在不同平臺上的字節長度差別,但是對於 Java 而言,由於 Java 是跨平臺語言,所以 JVM 表現下的基礎數據字節長度其實都是一致的。


int4 個字節。

short2 個字節。

long8 個字節。

byte1 個字節。

float4 個字節。

double8 個字節。

char2 個字節。

booleanboolean屬於布爾類型,在存儲的時候不使用字節,僅僅使用 1 位來存儲,範圍僅僅爲01,其字面量爲truefalse

我們可以看到 Java 與 C/C++ 的基本數據類型字節長度有些不一致,所以涉及到網絡通信交互或者是 JNI 開發時,數據的轉換有時需要考慮下基礎的字節長度。

本篇文章的主要內容是 Java 中的位操作,所以基礎數據長度也是以 Java 中定義的爲準。

原碼 反碼 補碼

我們已經知道了一個 int 型數值是 4 個字節。每個字節有 8 位。但對於一個 int 或者其它整數類型如 (long)的數值而言還要注意的是,它的最高位是符號位。

  • 最高位爲0表示正數。
  • 最高位爲1表示負數

原碼 將一個數字轉換成二進制就是這個數值的原碼。

int a = 5; //原碼  0000 0000 0000 0101
int b = -3;  //原碼  1000 0000 0000 0011

反碼
分兩種情況:正數和負數

  • 正數 正數的反碼就是原碼。
  • 負數 負數的反碼是在原碼的基礎上,符號位不變 其它位都取反。
5 的原碼:0000 0000 0000 0101

-3 的原碼:1000 0000 0000 0011
-3 的反碼:1111 1111 1111 1100

補碼
仍然分正數和負數兩種情況

  • 正數 正數的補碼就是原碼。
  • 負數 負數的補碼在反碼的基礎上加1。
5 的補碼:0000 0000 0000 0101


-3 的反碼:1111 1111 1111 1100
-3 的補碼: 1111 1111 1111 1101

計算機在進行數值運算的時候,是通過補碼錶示每個數值的。

比如

5 - 3 = 5 + ( -3 )
相當於 0000 0000 0000 0101 + 1111 1111 1111 1101
    = 1 0000 0000 0000 0010

最後的結果是1 0000 0000 0000 0010 這樣的二進制,由於 int 類型只有 4 byte,所以最高位產生了溢出,進位 1 被丟棄。結果就變成了 0010 也就是 2,5 - 3 = 2 沒有毛病。

這裏寫圖片描述

位運算符 &、|、~、^、>>、<<

位運算符包含與運算符、或運算符、取反運算符、異或運算符、左移運算符和右移運算符。在下面的內容中,我將會一一講解。

需要注意的是,下面測試用的數據都是 int 類型,int 類型是 4 個字節長度,但是爲了方便說明示例中用的數值我都用 1 個字節表示。希望不會給大家造成困擾。

& 與運算符

規則 與運算時,進行運算的兩個數,從最低位到最高位,一一對應。如果某 bit 的兩個數值對應的值都是 1,則結果值相應的 bit 就是 1,否則爲 0.

0 & 0 = 0,

0 & 1 = 0,

1 & 1 = 1

3 & 5 = 1 這是因爲

0000 0011

&

0000 0101

=

0000 0001

按照規則,將兩個數值按照低位到高位一一對齊運算,因爲只有第 0 位都爲 1,所以計算結果爲 1.

| 或運算符

規則 與運算時,進行運算的兩個數,從最低位到最高位,一一對應。如果某 bit 的兩個數值對應的值只要 1 個爲 1,則結果值相應的 bit 就是 1,否則爲 0。

0 | 0 = 0,

0 | 1 = 1,

1 | 1 = 1

3 | 5 = 7 這是因爲

0000 0011

|

0000 0101

=

0000 0111

~ 取反運算符

規則 對操作數的每一位進行操作,1 變成 0,0 變成 1。

~5 =>  0000 0101   ~  => 1111 1010

^ 異或運算符

規則 兩個操作數進行異或時,對於同一位上,如果數值相同則爲 0,數值不同則爲 1。

1 ^ 0 = 1,

1 ^ 1 = 0,

0 ^ 0 = 0;

3 ^ 5 = 6,這是因爲

0000 0011

^

0000 0101

=

0000 0110

值得注意的是 3 ^ 5 = 6,而 6 ^ 5 = 3

0000 0110

^

0000 0101

=

0000 0011

針對這個特性,我們可以將異或運算作爲一個簡單的數據加密的形式。比如,將一個mp4文件所有數值與一個種子數值進行異或得到加密後的數據,解密的時候再將數據與種子數值進行異或一次就可以了。

所以說異或運算可以作爲簡單的加解密運算算法

>> 右移運算符

規則 a >> b 將數值 a 的二進制數值從 0 位算起到第 b - 1 位,整體向右方向移動 b 位,符號位不變,高位空出來的位補數值 0。

5 >> 1 ===>  0000 0000 0000 0101 >> 1  = 0000 0000 0000 0010 = 2
7 >> 2 ===>  0000 0000 0000 0111 >> 2  = 0000 0000 0000 0001 = 1
9 >> 3 ===>  0000 0000 0000 1001 >> 3  = 0000 0000 0000 0001 = 1
11 >> 2 ===> 0000 0000 0000 1011 >> 2 = 0000 0000 0000 0010 = 2

大家發現什麼規律沒有?a >> b = a / ( 2 ^ b ) ,所以 5 >> 1= 5 / 2 = 2,11 >> 2 = 11 / 4 = 2。

<< 左移運算符

規則 a << b 將數值 a 的二進制數值從 0 位算起到第 b - 1 位,整體向左方向移動 b 位,符號位不變,低位空出來的位補數值 0。

5 << 1 ===>  0000 0000 0000 0101 << 1  = 0000 0000 0000 1010 = 10
7 << 2 ===>  0000 0000 0000 0111 << 2  = 0000 0000 0001 1100 = 28
9 << 3 ===>  0000 0000 0000 1001 << 3  = 0000 0000 0100 1000 = 72
11 << 2 ===> 0000 0000 0000 1011 << 2 = 0000 0000 0010 1100 = 44

很明顯就可以看出 a << b = a * (2 ^ b)

綜合上面兩個可以看到,如果某個數值(僅指正數,正數的原反補在計算機中一致;因爲負數在計算機中以補碼形式存在)右移 n 位,就相當於拿這個數值去除以 2 的 n 次冪。如果某個數值(正數/負數)左移 n 位,就相當於這個數值乘以 2 ^ n。

參考內容

32位機和64位機的區別及基本數據類型佔字節數

轉載:https://juejin.im/entry/58f9b6118d6d8100588060d6

發佈了3 篇原創文章 · 獲贊 3 · 訪問量 4萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章