UTF-8/UTF-16/UTF-32、Unicode和GB18030編碼的關係


1、除了極其少量的API,操作系統內部操作串已經是UNICODE的了,使用ANSI版本的API只會增加額外的轉換操作,性能其實降低了。
2、對於多語言混合的字符串,如果採用ANSI編碼,顯示一定亂碼。但UNICODE編碼則無此問題。
3、UNICODE分成幾種,UTF-8/UTF-16/UTF-32,用途各不相同。UTF-8往往用於網絡存儲和傳輸,雖然每個字符佔用的字節數不同(英文1字節、中文3字節),但浪費的存儲空間少。UTF-16是計算機常用的UNICODE編碼方式,每個字符佔用字節數恆爲2,長度計算方便,且便於解析,所以處理效率高,大量字符串處理通常使用這種編碼。UTF-32目前用得很少,解決的就是UTF-16不能表達全部漢字的問題(GB18030編碼用的就是UTF-32),使用時需要專用的API支持。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章