【轉】二進制數的相關基礎

1.如果你不知道二進制怎麼編碼,請繼續,否則請跳到2

    1字節 = 8位,所以它能表示的最大數當然是8位都是1(既然2進制的數只能是0或1,如果是我們常見的10進制,那就8位都爲9,這樣說,你該懂了?)

1字節的二進制數中,最大的數:11111111。

    這個數的大小是多少呢?讓我們來把它轉換爲十進制數。

    無論是什麼進制,都是左邊是高位,右邊是低位。10進制是我們非常習慣的計數方式,第一位代表有幾個1(即幾個100),第二位代表有幾個10(即幾個101),第三位代表有幾個100(即有幾個102)…,用小學課本上的說法就是:個位上的數表示幾個1,十位上的數表示向個10,百位上的數表示幾個100……

    同理可證,二進制數則是:第1位數表示幾個1 (20),第2位數表示幾個2(21),第3位數表示幾個4(22),第4位數表示向個8(23)……

    以前我們知道1個字節有8位,現在通過計算,我們又得知:1個字節可以表達的最大的數是255,也就是說表示0~255這256個數。

    那麼兩個字節(雙字節數)呢?雙字節共16位。 1111111111111111,這個數並不大,但長得有點眼暈,從現在起,我們要學會這樣來表達二制數:

1111 1111 1111 1111,即每4位隔一空格。

雙字節數最大值爲:

1 * 215 + 1 *214 + 1* 213 +1 * 212 + 1 * 211 + 1 * 210 + …… + 1 * 22 + 1 * 21 +1* 20 = 65535

    很自然,我們可以想到,一種數據類型允許的最大值,和它的位數有關。具體的計算方法方法是,如果它有n位,那麼最大值就是:

n位二進制數的最大值:1 * 2(n-1) + 1 * 2(n-2) + ... + 1 *20

2、理解有符號數和無符號數

負數在計算機中如何表示呢?這一點,你可能聽過兩種不同的回答。

一種是教科書,它會告訴你:計算機用“補碼”表示負數。可是有關“補碼”的概念一說就得一節課,這一些我們需要在第6章中用一章的篇幅講2進制的一切。

再者,用“補碼”表示負數,其實一種公式,公式的作用在於告訴你,想得問題的答案,應該如何計算。卻並沒有告訴你爲什麼用這個公式就可以和答案。

另一種是一些程序員告訴你的:用二進制數的最高位表示符號,最高位是0,表示正數,最高位是1,表示負數。這種說法本身沒錯,可是如果沒有下文,那麼它就是錯的。至少它不能解釋,爲什麼字符類型的-1用二進制表示是“1111 1111”(16進製爲FF);而不是我們更能理解的“1000 0001”。(爲什麼說後者更好理解呢?因爲既然說最高位是1時表示負數,那1000 0001不是正好是-1嗎?

讓我們從頭說起。

2.1、你自已決定是否需要有正負。

就像我們必須決定某個量使用整數還是實數,使用多大的範圍數一樣,我們必須自已決定某個量是否需要正負。如果這個量不會有負值,那麼我們可以定它爲帶正負的類型。

在計算機中,可以區分正負的類型,稱爲有符類型,無正負的類型(只有正值),稱爲無符類型。

數值類型分爲整型或實型,其中整型又分爲無符類型或有符類型,而實型則只有符類型。

字符類型也分爲有符和無符類型。

比如有兩個量,年齡和庫存,我們可以定前者爲無符的字符類型,後者定爲有符的整數類型。

2、使用二制數中的最高位表示正負。

首先得知道最高位是哪一位?1個字節的類型,如字符類型,最高位是第7位,2個字節的數,最高位是第15位,4個字節的數,最高位是第31位。不同長度的數值類型,其最高位也就不同,但總是最左邊的那位(如下示意)。字符類型固定是1個字節,所以最高位總是第7位。

(紅色爲最高位)

單字節數: 1111 1111

雙字節數: 1111 1111 1111 1111

四字節數: 1111 1111 1111 1111 1111 1111 1111 1111

當我們指定一個數量是無符號類型時,那麼其最高位的1或0,和其它位一樣,用來表示該數的大小。

當我們指定一個數量是有符號類型時,此時,最高數稱爲“符號位”。爲1時,表示該數爲負值,爲0時表示爲正值。

3、無符號數和有符號數的範圍區別。

無符號數中,所有的位都用於直接表示該值的大小。有符號數中最高位用於表示正負,所以,當爲正值時,該數的最大值就會變小。我們舉一個字節的數值對比:

無符號數: 1111 1111   值:255        1* 27 +1* 26 + 1* 25 + 1* 24 + 1* 23 +1* 22 + 1* 21 + 1* 20

有符號數: 0111 1111   值:127       符號位  1* 26 + 1* 25 + 1* 24 + 1* 23 +1* 22 + 1* 21 + 1* 20

  同樣是一個字節,無符號數的最大值是255,而有符號數的最大值是127。原因是有符號數中的最高位被挪去表示符號了。並且,我們知道,最高位的權值也是最高的(對於1字節數來說是2的7次方=128),所以僅僅少於一位,最大值一下子減半。

不過,有符號數的長處是它可以表示負數。因此,雖然它的在最大值縮水了,卻在負值的方向出現了伸展。我們仍一個字節的數值對比:

無符號數:                                                 0 ----------------- 255

有符號數:        -128 --------- 0---------- 127

同樣是一個字節,無符號的最小值是 0 ,而有符號數的最小值是-128。所以二者能表達的不同的數值的個數都一樣是256個。只不過前者表達的是0到255這256個數,後者表達的是-128到+127這256個數。

一個有符號的數據類型的最小值是如何計算出來的呢?

有符號的數據類型的最大值的計算方法完全和無符號一樣,只不過它少了一個最高位(見第3點)。但在負值範圍內,數值的計算方法不能直接使用1* 26 +1* 25 的公式進行轉換。在計算機中,負數除爲最高位爲1以外,還採用補碼形式進行表達。所以在計算其值前,需要對補碼進行還原。這裏,先直觀地看一眼補碼的形式:

以我們原有的數學經驗,在10進制中:1 表示正1,而加上負號:-1 表示和1相對的負值。

那麼,我們會很容易認爲在2進制中(1個字節): 00000001 表示正1,則高位爲1後:1000 0001應該表示-1。然而,事實上計算機中的規定有些相反,請看下錶:

二進制值(1字節)

十進制值

1000 0000紅色的1代表負數藍色的是補碼(補碼=反碼+1)

-128

1000 0001藍色部分代表多大的值?:將補碼還原爲原碼

-127想化成負數?:先減去1按位取反

1000 0010還原方法:補碼-1再取反

-126

1000 0011

-125

...

...

1111 1110

-2

1111 1111

-1

首先我們看到,從-1到-128,其二進制的最高位都是1(表中標爲紅色),正如我們前面的學。

然後我們有些奇怪地發現,1000 0000 並沒有拿來表示 -0;而1000 0001也不是拿來直觀地表示-1。事實上,-1 用1111 1111來表示。

怎麼理解這個問題呢?先得問一句是-1大還是-128大?

當然是 -1 大。-1是最大的負整數。以此對應,計算機中無論是字符類型,或者是整數類型,也無論這個整數是幾個字節。它都用全1來表示 -1。比如一個字節的數值中:1111 1111表示-1,那麼,11111111 - 1 是什麼呢?和現實中的計算結果完全一致。1111 1111 - 1 = 11111110,而1111 1110就是-2。這樣一直減下去,當減到只剩最高位用於表示符號的1以外,其它低位全爲0時,就是最小的負值了,在一字節中,最小的負值是1000 0000,也就是-128。


我們以-1爲例,來看看不同字節數的整數中,如何表達-1這個數:

字節數

二進制值

十進制值

單字節數

1111 1111紅色表示負數藍色部分的補碼爲值1

-1

負數:原碼就是原來的表示方法、反碼是除符號位(最高位)外取反、補碼=反碼+1雙字節數

1111 1111 1111 1111

-1

四字節數

1111 1111 1111 1111 1111 1111 1111 1111

-1

可能有同學這時會混了:爲什麼 1111 1111 有時表示255,有時又表示-1?

所以我再強調一下本節前面所說的第2點:你自已決定一個數是有符號還是無符號的。

寫程序時,指定一個量是有符號的,那麼當這個量的二進制各位上都是1時,它表示的數就是-1;

相反,如果事選聲明這個量是無符號的,此時它表示的就是該量允許的最大值,對於一個字節的數來說,最大值就是255。



    在計算機內部,所有信息都是用二進制數串的形式表示的。整數通常都有正負之分,計算機中的整數分爲無符號的和帶符號的。無符號的整數用來表示0和正整數, 帶符號的證書可以表示所有的整數。由於計算機中符號和數字一樣,都必須用二進制數串來表示,因此,正負號也必須用0、1來表示。通常我們用最高的有效位來 表示數的符號(當用8位來表示一個整數時,第8位即爲最高有效位,當用16位來表示一個整數時,第16位即爲最高有效位。)0表示正號、1表示負號,這種 正負號數字化的機內表示形式就稱爲“機器數”,而相應的機器外部用正負號表示的數稱爲“真值”。將一個真值表示成二進制字串的機器數的過程就稱爲編碼。

    無符號數沒有原碼、反碼和補碼一說。只有帶符號數才存在不同的編碼方式。

帶符號整數有原碼、反碼、補碼等幾種編碼方式。原碼即直接將真值轉換爲其相應的二進制形式,而反碼和補碼是對原碼進行某種轉換編碼方式。正整數的原 碼、反碼和補碼都一樣,負數的反碼是對原碼的除符號位外的其他位進行取反後的結果(取反即如果該位爲0則變爲1,而該位爲1則變爲0的操作)。而補碼是先 求原碼的反碼,然後在反碼的末尾位加1 後得到的結果,即補碼是反碼+1。IBM-PC中帶符號整數都採用補碼形式表示。(注意,只是帶符號的整數採用補碼存儲表示的,浮點數另有其存儲方式。)

    採用補碼的原因或好處如下。

    採用補碼運算具有如下兩個特徵:

    1)因爲使用補碼可以將符號位和其他位統一處理,同時,減法也可以按加法來處理,即如果是補碼錶示的數,不管是加減法都直接用加法運算即可實現。

    2)兩個用補碼錶示的數相加時,如果最高位(符號位)有進位,則進位被捨棄。

    這樣的運算有兩個好處:

    1)使符號位能與有效值部分一起參加運算,從而簡化運算規則。從而可以簡化運算器的結構,提高運算速度;(減法運算可以用加法運算表示出來。)

    2)加法運算比減法運算更易於實現。使減法運算轉換爲加法運算,進一步簡化計算機中運算器的線路設計。

    下面深入分析上面所陳述的採用補碼的原因(目的)。

    用帶符號位的原碼進行乘除運算時結果正確,而在加減運算的時候就出現了問題,如下:假設字長爲8bits

    ( 1 ) 10- ( 1 )10 = ( 1 )10 + ( -1 )10 = ( 0 )10

    (00000001)原 + (10000001)原 = (10000010)原 = ( -2 ) 顯然不正確.。

    因爲在兩個整數的加法運算中是沒有問題的,於是就發現問題出現在帶符號位的負數身上,對除符號位外的其餘各位逐位取反就產生了反碼。反碼的取值空間和原碼相同且一一對應。下面是反碼的減法運算:

     ( 1 )10 - ( 1 ) 10= ( 1 ) 10+ ( -1 ) 10= ( 0 )10

     (00000001) 反+ (11111110)反 = (11111111)反 = ( -0 ) 有問題。

    ( 1 )10 - ( 2)10 = ( 1 )10 + ( -2 )10 = ( -1 )10

     (00000001) 反+ (11111101)反 = (11111110)反 = ( -1 ) 正確

    問題出現在(+0)和(-0)上,在人們的計算概念中零是沒有正負之分的。

於是就引入了補碼概念。負數的補碼就是對反碼加一,而正數不變,正數的原碼反碼補碼是一樣的。在補碼中用(-128)代替了(-0),所以補碼的表示範圍爲:

(-128~0~127)共256個。

    注意:(-128)沒有相對應的原碼和反碼, (-128) = (10000000) 補碼的加減運算如下:

    ( 1 ) 10- ( 1 ) 10= ( 1 )10 + ( -1 )10 = ( 0 )10

    (00000001)補 + (11111111)補 = (00000000)補 = ( 0 ) 正確

     ( 1 ) 10- ( 2) 10= ( 1 )10 + ( -2 )10 = ( -1 )10

    (00000001) 補+ (11111110) 補= (11111111)補 = ( -1 ) 正確

    採用補碼錶示還有另外一個原因,那就是爲了防止0的機器數有兩個編碼。原碼和反碼錶示的0有兩種形式+0和-0,而我們知道,+0和-0是相同的。這 樣,8位的原碼和反碼錶示的整數的範圍就是-127~+127(11111111~01111111),而採用補碼錶示的時候,00000000是+0, 即0;10000000不再是-0,而是-128,這樣,補碼錶示的數的範圍就是-128~+127了,不但增加了一個數得表示範圍,而且還保證了0編碼 的唯一性。

    整數和0的原碼、反碼和補碼都相同,下面介紹手工快速求負數補碼的方法。這個方法在教材的第8頁已經提到了,這裏再寫出來以便能引起大家的注意。其方法如下:

    先寫出該負數的相反數(正數),再將該正數的二進制形式寫出來,然後對這個二進制位串按位取反,即若是1則改爲0,若是0則改爲1,最後在末位加1。

接下來的問題是,如何能將減法運算轉換成加法運算呢?

    我們已經知道,原碼錶示簡單直觀,與真值轉換容易。但如果用原碼錶示,其符號位不能參加運算。在計算機中用原碼實現算術運算時,要取絕對值參加運算,符號 位單獨處理,這對乘除運算是很容易實現的,但對加減運算是非常不方便的,如兩個異號數相加,實際是要做減法,而兩個異號數相減,實際是要做加法。在做減法 時,還要判斷操作數絕對值的大小,這些都會使運算器的設計變得很複雜。而補碼這種編碼方式實際上正是針對上述問題的。通過用補碼進行表示,就可以把減法運 算化爲加法運算。

    在日常生活中,有許多化減爲加的例子。例如,時鐘是逢12進位,12點也可看作0點。當將時針從10點調整到5點時有以下兩種方法:

    一種方法是時針逆時針方向撥5格,相當於做減法:

        10-5=5

    另一種方法是時針順時針方向撥7格,相當於做加法:

      10+7=12+5=5    (MOD 12)

    這是由於時鐘以12 爲模,在這個前提下,當和超過12時,可將12捨去。於是,減5相當於加7。同理,減4可表示成加8,減3可表示成加9,…。

    在數學中,用“同餘”概念描述上述關係,即兩整數A、B用同一個正整數M (M稱爲模)去除而餘數相等,則稱A、B對M同餘,記作:

       A=B     (MOD M)

    具有同餘關係的兩個數爲互補關係,其中一個稱爲另一個的補碼。當M=12時,-5和+7,-4和+8,-3和+9就是同餘的,它們互爲補碼。

    從同餘的概念和上述時鐘的例子,不難得出結論:對於某一確定的模,用某數減去小於模的另一個數,總可以用加上“模減去該數絕對值的差”來代替。因此,在有模運算中,減法就可以化作加法來做。

    可以看出,補碼的加法運算所依據的基本關係爲:

[x]補+ [y]補= [x+y]補

    補碼減法所依據的基本關係式:

[x-y]補 =[x+(-y)]補= [x]補+ [-y]補

    至於加法運算爲什麼比減法運算易於實現以及CPU如何實現各種算術運算等問題,則需要通過對數字電路的學習來理解CPU的運算器的硬件實現問題的相關內容了。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章