UTF-8/UTF-16/UTF-32、Unicode和GB18030編碼的關係

原創

2018-09-03 06:41

1、除了極其少量的API，操作系統內部操作串已經是UNICODE的了，使用ANSI版本的API只會增加額外的轉換操作，性能其實降低了。
2、對於多語言混合的字符串，如果採用ANSI編碼，顯示一定亂碼。但UNICODE編碼則無此問題。
3、UNICODE分成幾種，UTF-8/UTF-16/UTF-32，用途各不相同。UTF-8往往用於網絡存儲和傳輸，雖然每個字符佔用的字節數不同（英文1字節、中文3字節），但浪費的存儲空間少。UTF-16是計算機常用的UNICODE編碼方式，每個字符佔用字節數恆爲2，長度計算方便，且便於解析，所以處理效率高，大量字符串處理通常使用這種編碼。UTF-32目前用得很少，解決的就是UTF-16不能表達全部漢字的問題（GB18030編碼用的就是UTF-32），使用時需要專用的API支持。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

UTF-8/UTF-16/UTF-32、Unicode和GB18030編碼的關係

解決Win和ubuntu雙系統時間不對的問題

HM配置參數介紹（1）

計算機行業的默認層次劃分（非原創，但是經典）

TBB（Intel Threading Building Blocks）學習筆記

CUDA中grid、block、thread、warp與SM、SP的關係

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結