Java的中文編程與配置心得 [huxf]

Java的中文編程與配置心得 huxf(原作)

關鍵字 java 中文 javaw



Java的中文編程與配置心得

Java的中文問題歷史悠久,連綿不絕,至今也沒有完全解決,但是上有政策下有對策,我們總是有辦法搞定它的。跟Java相關的中文問題主要有兩類,一類是編程的問題,涉及到I/O,內碼轉換等。第二類是Java運行環境的配置,涉及字體,屬性配置等。我剛剛用了一天的時間解決這些問題,覺得很有必要給自己寫個備忘錄之類的。
我看還是從問題入手吧,這樣不致於讓大家打瞌睡。我想寫個程序,這個程序有個基本功能就是顯示文件內容,我用JTextArea來做顯示的事情,程序簡單的到家了,但是就是中文都是亂碼。我的配置是JBuilder7,JBuilder自帶的JDK1.3.3_b24,我自己裝的JDK是JDK1.4.0_02_b02,都是主流的JDK。操作系統是英文Windows2000加中文支持包。
我嘗試換JDK,1.3.3和1.4.0都不行,down一個最新的j2sdk-1_4_1-rc也是不行,好像不是JDK的問題,於是我就把精力集中到I/O的編碼轉換上,我查閱了網上若干關於JAVA中文問題的文章,把編碼轉換搞的倍兒清楚,可是怎麼試,換什麼編碼折騰都不行,反而顯示的更糟糕,當初還是亂的有些規矩,就是象在純英文系統上顯示的那樣,好歹我還知道那是漢字,只是顯示不出來,等我折騰編碼,就變得都是問號了。唉,鬱悶!

編碼轉換心得:
JAVA內部是UNICODE編碼,在I/O時如果使用Reader/Writer就要發生編碼轉換,使用系統屬性file.encoding作爲編碼方式。如果使用Stream就沒有轉換的事情了,那是Binary的數據。
有用的方法有:1。在Reader/Writer上加encoding的選項,注意編碼的方向,在Reader中的encoding表示把數據從encoding轉換成Unicode,writer就是把Unicode的字符轉換成encoding格式的。2。用String.getByte()把字符串轉換成指定編碼。
常用的編碼格式:ISO8859_1,這個是英文系統缺省的8bit編碼,因爲是8bit的,所以不會把漢字的高位刪去,所以用它也是可以處理漢字的(我自己這麼理解,總覺得有些不妥,但又不知道不妥在何處,還望高人指出)。GB2312和GBK,漢字編碼,推薦使用GBK,它兼容GB2312並且支持更多漢字。UNICODE,一個大的字符集,不知是不是國際標準反正大家都支持,使用16位對每個字符編碼,漢字雖然正合適,但英文卻吃虧了,要用多一倍的空間來存儲,所以很多人還是老大不樂意,寫的程序不支持UNICODE。
JSP/Servlet的中文問題有兩種解決辦法:1。不在程序中進行編碼轉換,把這個工作交給瀏覽器,方法就是用javac –encoding GBK *.java來編譯所有的bean,然後在JSP頁面上加

或者是在HTML中直接加:

到底加那個,試試就知道了,我也搞不清楚了。
2。在程序中指定編碼,用javac –encoding ISO8859_1 *.java來編譯所有的bean,在涉及到中文顯示的程序上加
str=new String(str.getBytes("ISO8859_1"));
上面兩種方法不能混用,意思就是要麼就是GBK,要麼就是ISO8859_1,從裏到外都一樣就好了。
數據庫JDBC的中文問題,一般只要按照數據庫指定的編碼進行轉換,比如按照ISO8859_1讀,ISO8859_1寫,一般就沒什麼問題了。

雖然有這些編碼上的心得,但是並不能解決我的問題。看來我的程序輸入輸出用的都是ISO8859_1,我的問題跟編碼沒什麼關係。是不是字體的問題呢?在Swing的組件中,字體總是那麼幾個,基本上是定死的,選那個都不行。但是我突然發現可以更改這些字體的配置,就是font.properties 這個文件,一般JDK都帶了中文的字體配置文件,可能是font.properties.zh之類的,不同版本的JDK名字有些差別,你要做的就是用中文的配置覆蓋font.properties文件。我滿心歡喜的以爲成功了,但是失敗無情的又一次打擊了我。不是這種方法不對,但是在Windows系統中,java能夠比較自動的檢查你的系統編碼,使用最合適的字體配置文件,一般不需要你改動了,在JDK1.2之前確實是要這麼改的,難怪那篇文章是JDK1.1的文檔呢。
連font.properties也不靈了,唉,是不是JBuilder有問題呀?到了這兒,我不得不懷疑它了,雖然它從沒讓我失望過,我關掉JBuilder,拿起JDK命令行,哎呀!可愛的中文竟然出來了!簡直是.....莫名其妙呀,因爲JBuilder也是用的這個JDK呀?沒理由呀,我再次打開JBuilder,運行,亂碼!怪事.......我來看看.....我把JBuilder裏面的執行命令拷貝到DOS窗口裏手動執行....沒有中文.....怪怪怪,我仔細對照我手敲的命令和JBuilder拷出來的命令,除了我用的是java它用的是javaw之外,別的幾乎都一樣,難道.......這個java和javaw竟然會不一樣?
唉.......要我說什麼呢,答案就是這個了,javaw會使用與java不同的Local配置進行工作,導致了我一直看不到中文,而java就是好好的。JBuilder也是好好的,沒有問題,調用javaw也不是它的錯,難道你想每次運行或者調試的時候蹦出個DOS黑框麼?呵呵。這是JDK的一個Bug,我在java的網站上查到這個bug,描述的情況跟我的一樣,然後Sun說這個Bug已經修復了,嘿嘿,簡直就是扯淡!修復個茄子!Bug編號是:4629351。不信可以去看看。
但是難道我就不能在JBuilder裏面看我可愛的中文了嗎?好像JBuilder5的時候還能選擇是用java還是javaw,現在好像沒法兒選了。怎麼才能讓javaw支持中文呢?經過又是一番苦苦查找,竟然沒有什麼結果,鬱悶!正當苦悶之時,突然想起當初配置過UNIX下的TOMCAT,好像加了些啓動參數,就能讓tomcat支持中文了,趕快翻出以前的文檔,啊,幸好我當初寫了工作心得,要不然又抓瞎了。其實道理很簡單,就是給JAVA虛擬機加上一些屬性:
-Dfile.encoding=GBK -Ddefault.client.encoding=GBK -Duser.language=zh -Duser.region=CN
把它跟在javaw的命令行後面當參數,哈哈,搞定!
在JBuilder中選擇Project->Project Properties->run->edit->VM Parameters,填上就行了!

配置心得:
在JDK低版本和UNIX下,需要改動font.properties,讓JAVA VM能夠找到合適的字體來顯示漢字。
目前爲止,javaw有Bug,只使用英文的Local,需要給VM加上屬性才行正常顯示中文。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章