編碼格式ASCII、Unicode、UTF-8

ASCII編碼

一個字節
字母A的ASCII編碼爲十進制的65,二進制的01000001

Unicode編碼

世界上所有語言都統一到一套編碼中,通常爲兩個字節。

字母A的ASCII編碼爲十進制的65,二進制的00000000 01000001(在ASCII編碼基礎上,在前面補8位0);

漢字,Unicode編碼是十進制的20013,二進制的01001110 00101101

⚠️缺點:文本中的英文用Unicode編碼比ASCII編碼需多一倍多存儲空間。

UTF-8編碼

解決上述存儲空間浪費的問題,爲"可變長編碼":將Unicode字符根據不同的數字大小編碼成1~6個字節,常用的英文字母被編碼成一個字節,漢字通常是3個字節,生僻字編碼成4~6個字節
在這裏插入圖片描述

⚠️好處:ASCII編碼是UTF-8編碼的一部分,ASCII編碼的歷史遺留軟件可以在UTF-8編碼下繼續工作。

計算機系統通用字符編碼工作方式

計算機內存中,統一使用Unicode編碼,傳輸或存儲到硬盤時,爲了節約空間,使用UTF-8編碼。

  • 記事本編輯
    在這裏插入圖片描述

  • 瀏覽網頁
    在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章