字符編碼(常見的字符編碼、亂髮產生的原因)

字符編碼

1.常見的編碼:

I.GBK、GBK2312:
GBK包含簡體與繁體中文,GBK2312只包含簡體中文。
II.UNICODE:
java提供的16進制編碼,可以描述世界上任意語言,但是編碼進制數太高,編碼體積較大。
III.ISO-8859-1:
國際通用編碼,不支持中文,瀏覽器默認編碼。
IV.UTF編碼:
結合UNICODE與ISO-8859-1,最常採用的是UTF-8編碼。

**

2.亂碼產生原因

**
I.編碼與解碼不統一產生的問題(95%)
II.由於數據丟失造成的亂碼(5%)
範例:

public class TestDemo {
    public static void main(String[] args) throws Exception{
        File file=new File("D:"+File.separator+"JavaSE code"+File.separator
                +"test"+File.separator+"javaIO.txt");
        OutputStream out=new FileOutputStream(file);
        //iso-8859-1 不支持中文
        //out.write("你好".getBytes("iso-8859-1"));


        //由於數據丟失造成亂碼
        out.write("你好".getBytes(),0,1);
        out.close();
    }
}
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章