UTF-8

UTF-8編碼

變長編碼,每個文字符號用1~4個字節表示。

編碼規則:

0xxxxxxx                //文字符號0~127(ASCII)
110xxxxx 10xxxxxx            //128~2047
1110xxxx 10xxxxxx 10xxxxxx        //2048~65535
11110xxx 10xxxxxx 10xxxxxx 10xxxxxx    //65535~0x10ffff

go注意

Go的源文件總是以UTF-8編碼,文本字符串也優先採用UTF-8編碼。
將字符串轉換成Unicode碼點序列r := []rune(string)

碼點值小於256的文字符號可以寫成單個十六進制轉義的形式,例如:'A'寫成'\x41'
更高的碼點必須用\u\U轉義

發佈了322 篇原創文章 · 獲贊 163 · 訪問量 6萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章