JavaIO字符、字節和編碼

【聲明】本文參考自極客學院視頻

1、字節(Byte)
字節是通過網絡傳輸信息或在硬盤或內存中存儲信息的單位,是計算機信息技術用於計量存儲容量和傳輸容量的一種計量單位。
1個字節等於8位二進制,即一個8位的二進制數,是一個很具體的存儲空間。
如0x01,0x45,0xFA…

2、字符(char)
字符是人們使用的記號,抽象意義上的一個符號。
如’1’,‘中’,‘a’,’$’,‘¥’…

3、字符集(charset)
字符集也成爲“編碼”。
各個國家和地區所制定的不同ANSI編碼標準中,都只規定了各自語言所需的“字符”。
這些ANSI編碼標準所規定的內容包括兩層含義:
(1)字符集。使用哪些字符。
(2)編碼。規定每個字符分別用一個字節還是多個字節存儲,用哪些字節來存儲。
各個國家和地區在制定編碼標準時,字符集和編碼一般都是同時制定的。

4、ANSI
字符串在內存中,如果字符以ANSI編碼形式存在的,一個字符可能使用一個字節或多個字節來表示,那麼我們稱這種字符串爲ANSI字符串或多字節字符串。不同ANSI編碼所規定的標準是不同的。因此,對於一個給定的多字節字符串,我們必須知道它採用的是哪一種編碼規則,才能知道它包含了哪些字符。

5、UNICODE
字符串在內存中,如果字符以UNICODE編碼形式存在的,那麼我們稱這種字符串爲UNICODE字符串或寬字節字符串。對於UNICODE字符串來說,不管在什麼環境下,它所代表的字符內容總是不變的。用來給UNICODE字符集編碼的標準有很多種,比如:UTF-8,UTF-7,UTF-16,UnicodeLittle,UnicodeBig等。
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章