數字unicode碼

阿拉伯數字的unicode編碼範圍:\u0030——\u0039

Java中Unicode的中文範圍

若要判斷是否是中文
只需要用以下代碼:
for (int i = 0; i < sentence.length(); i++){
    char c = sentence.charAt(i);
    if ((c >= 0x4e00)&&(c <= 0x9fbb)){
        System.out.println("中文");
    }
}
下面是各語言在Unicode中的範圍:

0000:Basic Latin 基本拉丁語
0080:Latin-1 Supplement 拉丁語-1補遺
0100:Latin Extended-A 拉丁語擴充-A
0180:Latin Extended-B 拉丁語擴充-B
0250:IPA Extensions 國際音標
02B0:Spacing Modifier Letters
0300:Combining Diacritical Marks 組合變音符
0370:Greek and Coptic 希臘語和埃及語
0400:Cyrillic 西里爾文
0500:Cyrillic Supplement 西里爾文補遺
0530:Armenian 亞美尼亞語
0590:Hebrew 希伯來語
0600:Arabic 阿拉伯語
0700:Syriac 敘利亞語
0780:Thaana 馬爾代夫語
0900:Devanagari 梵文
0980:Bengali 孟加拉語
0A00:Gurmukhi 果魯穆奇語
0A80:Gujarati 古吉特拉語
0B00:Oriya 奧裏雅語
0B80:Tamil 泰米爾語
0C00:Telugu 泰盧固語
0C80:Kannada 埃納德語
0D00:Malayalam 馬拉雅拉姆語
0D80:Sinhala 錫蘭語
0E00:Thai 泰國語
0E80:Lao 老撾語
0F00:Tibetan 西藏語
1000:Myanmar 瑪雅語
10A0:Georgian 格魯吉亞語
1100:Hangul Jamo (一種特殊韓文)
1200:ethiopic 埃塞俄比亞語
13A0:Cherokee 切羅基語
1400:Unified Canadian Aboriginal Syllabic
1680:Ogham 歐甘字母
16A0:Runic 古代北歐文字
1700:Tagalog 塔加拉語
1720:Hanunoo
1740:Buhid
1760:Tagbanwa
1780:Khmer 高棉語
1800:Mongolian 蒙古語
1900:Limbu
1950:Tai Le
19E0:Khmer Symbols 孟高棉語符號
1D00:Phonetic Extensions 語音擴充
1E00:Latin Extended Additional 拉丁擴充附加
1F00:Greek Extended 希臘語擴充
2000:General Punctuation 通用標點
2070:Superscripts and Subscripts 上標和下標
20A0:Currency Symbols 貨幣符號
20D0:Combining Marks for Symbols
2100:Letterlike Symbols
2150:Number Forms 數字形式
2190:Arrows 箭頭
2200:Mathematical Operators 數學運算符
2300:Miscellaneous Technical 零雜技術用符號
2400:Control Pictures
2440:Optical Character Recognition
2460:enclosed Alphanumerics 帶圈和括號的數字與字母
2500:Box Drawing 邊框
2580:Block Elements 方塊
25A0:Geometric Shapes 幾何形狀
2600:Miscellaneous Symbols 零雜符號
2700:Dingbats 丁貝符
27D0:Miscellaneous Mathematical Symbols-A 零雜數學符號
27F0:Supplemental Arrows-A 擴充箭頭A
2800:Braille Patterns 盲文
2900:Supplemental Arrows-B 擴充箭頭B
2980:Miscellaneous Mathematical Symbols-B 零雜數學符號B
2A00:Supplemental Mathematical Operators 擴充的數學運算符
2B00:Miscellaneous Symbols and Arrows 零雜符號和箭頭
2E80:CJK Radicals Supplement CJK詞根補遺
2F00:Kangxi Radicals Kangxi詞根
2FF0:Ideographic Description Characters 表意符號
3000:CJK Symbols and Punctuation CJK符號和標點
3040:Hiragana 平假名
30A0:Katakana 片假名
3100:Bopomofo 漢語注音符號
3130:Hangul Compatibility Jamo
3190:Kanbun
31A0:Bopomofo Extended 漢語注音符號擴充
31F0:Katakana Phonetic Extensions
3200:enclosed CJK Letters and Months 帶圈的CJK字母和月份
3300:CJK Compatibility CJK兼容
3400:CJK Unified Ideographs Extension A (1.5MB) CJK統一象形文字擴展A
4DC0:Yijing Hexagram Symbols 易經符號
4E00:CJK Unified Ideographs (5MB) CJK統一象形文字
A000:Yi Syllables 彝語音節
A490:Yi Radicals 彝語詞根
AC00:Hangul Syllables (7MB) Hangul音節
D800:High Surrogates 高代用品
DC00:Low Surrogates 低代用品
E000:Private Use Area 私人保留區
F900:CJK Compatibility Ideographs CJK兼容象形文字
FB00:Alphabetic Presentation Forms 字母序的表象符
FB50:Arabic Presentation Forms-A 阿拉伯表象符A
FE00:Variation Selectors
FE20:Combining Half Marks
FE30:CJK Compatibility Forms
FE50:Small Form Variants
FE70:Arabic Presentation Forms-B 阿拉伯表象符-B
FF00:Halfwidth and Fullwidth Forms 半寬和全寬形式
FFF0:Specials 特殊符號
這裏可見字體編輯用中日韓漢字Unicode編碼表

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章