非數值數據
沒有具體值得數據,在座標軸上找不到對應點。如邏輯真假,西文字符,漢字,音頻,圖片等等。
邏輯數據
- 0表示假
- 1表示真
邏輯數據會進行的運算,按位與,按位或,邏輯左移,邏輯右移等等。
西文字符
如a至z,A至Z,=,空格,0至9等等。
字符總數不超過256,所以可以用8個2進製表示。
使用ASCII碼表示西文字符。
幾個常見字母的ASCII碼大小: “A”爲65;“a”爲97;“0”爲 48。
前32位包括控制字符和空格
漢字
漢字不像西文字符,數量巨大,超過6萬個漢字。所以需要特殊處理。所以需要引入輸入碼,內碼,字形碼。
輸入碼(外碼)
對漢字用相應按鍵進行編碼表示,用於輸入。
輸入的幾種方式:手寫,語言,鍵盤拼寫等。
西文字符無輸入碼,按下按鍵就能輸入進去
內碼
用於在系統中進行查找,儲存,傳送等處理。
西文字符的內碼就是ASCII
區位碼
將漢字按一定順序排列存放在一個二維表格中,這個表有94行,94列(由漢字個數決定),每行的行數是區號,列數是位號,每個漢字都有唯一對應的位置。用7個二進制數可表示94個數,所以各佔7位。共14位,左7位是區號,右7位是位號。
國標碼
在區位碼的區號和位號各加32得到國標碼,爲什麼是32呢,因爲ASCII碼的前32包括控制字符和空格。
在計算機中爲了方便處理,在左右7位前面各加1個0,構成兩個字節。
一種內碼
爲了與西文字符區別,將國標碼的每個字節第一位換成1,得到一種內碼。
比如說:漢字裏的“大”位於第20行,第83列。20對應二進制是00010100,83對應的二進制是01010011。區號和位號各加32,32對應的二進制是00100000,得到的國標碼是00110100 01110011,即3473H,34H是字符4的ASCII碼,73H是字符s的ASCII碼。所以最高位設1,得到的內碼是10110100 11110011,即B4F3,這樣就不會和西文字符混淆。
字形碼(機內碼)
描述漢字字形或輪廓,用於顯示或打印。
- 不同的字體(宋體,黑體,楷體等)有不同的字庫。
- 無論什麼字,都有字形碼,除非你不想讓人們看到字。
描述方式:
- 點陣描述,類似於像素畫。
可以這樣表示漢字“十”。 - 輪廓描述,有直線的,也有曲線的。