字符編碼方案

字符編碼方案

簡單說,字符編碼方案 CES 等於 字符編碼表CEF 加上字節序列化的方案。也就是說,通過CEF得到碼元序列,還需要對其字節排序,得到的就是最後的編碼結果。


對於一個字符按照UTF16拆成了若干個碼元組成的碼元序列,因爲每個碼元都是一個unsigned short,實際上是兩個字節。因此將碼元序列化爲字節序列的時候,就會遇到一些問題。


大小端序問題:每個碼元究竟是高位字節在前還是低位字節在前呢?

字節序標記問題:另一個程序如何知道當文本是什麼端序的呢?這些都是CEF需要操心的問題。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章