[iOS]把字符串漢字轉換成UTF-8編碼

ASCII碼相信很熟悉了,只是自己一直都記不住基本規律,有時候用起來十分不爽。

ASCII,共7位,表示128個字符,一般都在前面加0補全8位形成一個Bit。0~31以及127爲控制字符,不能打印;32爲空格;48(HEX: 0x30)爲0;65(HEX: 0x41)爲A;97(HEX: 0x61)爲a。


GB2312:ANSI編碼中的一種,對ASNI編碼最初始的ASCII編碼進行擴充,爲了滿足國內在計算機中使用漢字的需要,中國國家標準總局發佈了一系列的漢子字符集國家標準編碼,統稱爲GB碼,或國標碼。其中最有影響的是於1980年發佈的《信息交換用漢字編碼字符集 基本集》,標準號爲GB 2312-1980,因其使用非常普遍,也常被通稱爲國標碼。GB2312是一個簡體中文字符集,由6763個常用漢字和682個全角的非漢字字符組成。GB2312編碼用兩個字節表示一個漢字,所以理論上最多可以表示256x256=65536個漢字。(摘自百度百科)


GBK:漢字內碼擴展規範,K爲擴展的漢語拼音中“擴”字的聲母。GBK兼容GB2312,共收錄漢字21003個、符號883個,並提供1894個造字碼位。(摘自百度百科)


Unicode:把世界上所有的符號都納入其中,包括英文、日本、中文等等,現在能容納100多萬個符號。這樣效率上就不好,於是UTF-8出現了,它可以根據不同的符號自動選擇編碼的長短。


iOS中對字符串進行UTF-8編碼:輸出str字符串的UTF-8格式

[str stringByAddingPercentEscapesUsingEncoding:NSUTF8StringEncoding];


解碼:把str字符串以UTF-8規則進行解碼

[str stringByReplacingPercentEscapesUsingEncoding:NSUTF8StringEncoding];

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章