字符編碼
1.常見的編碼:
I.GBK、GBK2312:
GBK包含簡體與繁體中文,GBK2312只包含簡體中文。
II.UNICODE:
java提供的16進制編碼,可以描述世界上任意語言,但是編碼進制數太高,編碼體積較大。
III.ISO-8859-1:
國際通用編碼,不支持中文,瀏覽器默認編碼。
IV.UTF編碼:
結合UNICODE與ISO-8859-1,最常採用的是UTF-8編碼。
**
2.亂碼產生原因
**
I.編碼與解碼不統一產生的問題(95%)
II.由於數據丟失造成的亂碼(5%)
範例:
public class TestDemo {
public static void main(String[] args) throws Exception{
File file=new File("D:"+File.separator+"JavaSE code"+File.separator
+"test"+File.separator+"javaIO.txt");
OutputStream out=new FileOutputStream(file);
//iso-8859-1 不支持中文
//out.write("你好".getBytes("iso-8859-1"));
//由於數據丟失造成亂碼
out.write("你好".getBytes(),0,1);
out.close();
}
}