Linux 學習基礎 - 數據表示方式

數據表示方式

1. 數字系統

早期的計算機使用的是利用通電與否的特性的真空管,如果通電就是1,沒有通電就是0,後來沿用至今,我們稱這種只有0/1的環境稱爲二進制,英文稱爲 binary。所謂二進制也就是逢2進1;十進制就是逢10進1。下面舉例十進制向二進制的轉換:


2. 文字編碼系統

既然計算機都只有記錄0/1而已,甚至記錄的數據都是使用byte/bit等單位來記錄的,文字該怎麼記錄呢?這就需要“編碼系統”處理了(在查看文件時是否經常會看到“UTF8”這個東東?接下來馬上就幫你答疑解惑)
編碼系統:可以想象成一個“字碼對照表”,文字數據會由編碼對照表將文字轉成數字後,再存入文件當中。如圖:

常用的英文編碼表爲ASCII系統,在這個系統中,每個符號(英文、數字或符號等)都會佔用1 bytes 的記錄(別忘了1 bytes=8 bits),因此總共會有2的8次方即256種變化。
中文字當中的編碼系統最早最常用的是 big5 這個編碼表,每個中文會佔用2 bytes,理論上最多有2的16次方即65536箇中文字,但由於並非所有的位都用來成爲對照,因而並非可達那麼多的中文字碼。也正是因爲如此,我們從網上下載一些很早之前的文件,打開容易出現亂碼的緣故。
爲了解決這個問題,由國際組織ISO/IEC跳出來制定了所謂的Unicode編碼系統,我們常常稱呼的UTF8或萬國碼的編碼就是它。因爲這個編碼系統打破了所有國家的不同編碼,因此目前因特網社會大多朝向這個編碼系統再走。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章