如上圖所以,是utf-8表示了的世界上所有的字符,左邊是十六進制表示,右邊是二進制表示,比如第三行1110xxxx 10xxxxxx 10xxxxxx
(漢字主要落在第三第四行),表示這個範圍的漢字用三個字節表示,第一個字節就是1110xxxx(於是lex中的換成十六進制的表示就是:[/xe0-/xef][/x80-/xbf]{2}),嗯,就是這樣,很要好理解了把~
如上圖所以,是utf-8表示了的世界上所有的字符,左邊是十六進制表示,右邊是二進制表示,比如第三行1110xxxx 10xxxxxx 10xxxxxx
(漢字主要落在第三第四行),表示這個範圍的漢字用三個字節表示,第一個字節就是1110xxxx(於是lex中的換成十六進制的表示就是:[/xe0-/xef][/x80-/xbf]{2}),嗯,就是這樣,很要好理解了把~