UTF-8編碼
變長編碼,每個文字符號用1~4個字節表示。
編碼規則:
0xxxxxxx //文字符號0~127(ASCII)
110xxxxx 10xxxxxx //128~2047
1110xxxx 10xxxxxx 10xxxxxx //2048~65535
11110xxx 10xxxxxx 10xxxxxx 10xxxxxx //65535~0x10ffff
go注意
Go
的源文件總是以UTF-8
編碼,文本字符串也優先採用UTF-8
編碼。
將字符串轉換成Unicode
碼點序列r := []rune(string)
碼點值小於256
的文字符號可以寫成單個十六進制轉義的形式,例如:'A'
寫成'\x41'
更高的碼點必須用\u
或\U
轉義