utf-8中文正則表達式

 

 

 

如上圖所以,是utf-8表示了的世界上所有的字符,左邊是十六進制表示,右邊是二進制表示,比如第三行1110xxxx 10xxxxxx 10xxxxxx
(漢字主要落在第三第四行),表示這個範圍的漢字用三個字節表示,第一個字節就是1110xxxx(於是lex中的換成十六進制的表示就是:[/xe0-/xef][/x80-/xbf]{2}),嗯,就是這樣,很要好理解了把~

發佈了37 篇原創文章 · 獲贊 11 · 訪問量 14萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章