16.3字符編碼

在計算機的世界之中,所有的顯示文字都是按照其指定的數字編碼進行保存的,在以後進行程序的開發之中,會經常見到一些的一些常見的編碼:

  • SO 8859-1:是一種國際通用單字節編碼,最多隻能表示0~255的字符範圍,主要在英文傳輸中使用;
  • GBK / GBK2312:中文的國標編碼,專門用來表示漢字,是雙字節編碼,如果在此編碼中出現了中文則使用iso8859-1編碼,GBK可以表示簡體中文和繁體中文,而GB2312只能表示簡體中文,GBK是兼容GB2312的;
  • UNICODE:十六進制編碼,可以準確的表示出任何的語言文字,此編碼不兼容ISO8859-1編碼;
  • UTF編碼:由於UNICODE不支持ISO8859-1編碼,而且容易佔用更多的空間,而且對於英文字母也需要使用兩個字節編碼,這樣使用UNICODE不便於傳輸和存儲,因此產生了UTF編碼,UTF編碼兼容了ISO8859-1編碼,同時也可以用來表示所有的語言字符,不過UTF編碼是不定長編碼,每一個字符的長度從1~6個字節不等,一般在中文網頁中使用此編碼,因爲這樣可以節省空間;
    範例:獲取本地系統默認編碼

public class JavaIODemo415 {
       public static void main(String[] args) {
		System.out.println("系統默認編碼:"+System.getProperty("file.encoding"));
	}
}

執行結果

系統默認編碼:UTF-8
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章