ASCII編碼
一個字節
字母A
的ASCII編碼爲十進制的65
,二進制的01000001
。
Unicode編碼
世界上所有語言都統一到一套編碼中,通常爲兩個字節。
字母A
的ASCII編碼爲十進制的65
,二進制的00000000 01000001
(在ASCII編碼基礎上,在前面補8位0);
漢字中
,Unicode編碼是十進制的20013
,二進制的01001110 00101101
。
⚠️缺點:文本中的英文用Unicode編碼比ASCII編碼需多一倍多存儲空間。
UTF-8編碼
解決上述存儲空間浪費的問題,爲"可變長編碼":將Unicode字符根據不同的數字大小編碼成1~6個字節,常用的英文字母被編碼成一個字節,漢字通常是3個字節,生僻字編碼成4~6個字節
⚠️好處:ASCII編碼是UTF-8編碼的一部分,ASCII編碼的歷史遺留軟件可以在UTF-8編碼下繼續工作。
計算機系統通用字符編碼工作方式
計算機內存中,統一使用Unicode編碼,傳輸或存儲到硬盤時,爲了節約空間,使用UTF-8編碼。
-
記事本編輯
-
瀏覽網頁