ASCII,DBCS(GBK),unicode,utf8編碼規範的區別

下面我們粗略的區分一下這幾種編碼規範。
1ASSCII:佔用一個字節(即8位,故可以表示的最大字符數是256)。其中第0到127主要用來儲存與英文相關的字符(是不能表示中文的)
2DBCS(GBK):佔用兩個字節。若第一個字節是0到127之間的,與原來ASCII相同。若第一個字節是127之後,那麼共有(2的4次方乘2的8次方)中表示方式來表示中文等字符。
3UNICODE:佔用兩個字節(即16位)。對於ASCII的編碼不變(造成了一定的浪費,有8位永遠是0),剩餘的位置給全世界其他文化語言使用(包括中文)
4utf8:由於Unicode與ASCII不兼容,utf8就應運而生了。UTF-8最大的一個特點,就是它是一種變長的編碼方式。它可以使用1~4個字節表示一個符號,根據不同的符號而變化字節長度,當字符在ASCII碼的範圍時,就用一個字節表示,保留了ASCII字符一個字節的編碼做爲它的一部分,注意的是unicode一箇中文字符佔2個字節,而UTF-8一箇中文字符佔3個字節)。從unicode到uft-8並不是直接的對應,而是要過一些算法和規則來轉換。
下面附上一個幽默風趣的介紹相關知識的鏈接點擊打開鏈接
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章