3、HTML亂碼出現的原因

1、出現的原因:

計算機 存儲 的任何內容都是以二進制 0 1 保存的,比如說:假設 “中國” 兩個字,在保存的時候是保存爲1010101110001,但在讀取的時候(也就是從 “1010101110001” 到 “中國”的過程),計算機會把這個二進制的編碼轉化爲原來的內容,即“中國”兩個字,這是編碼和轉碼的問題。

其中的轉換規則叫字符集(編碼和解碼採用的規則),如果使用A字符集去編碼,使用B字符集去解碼,這樣就出現亂碼了。也就是說,二進制數:1010101110001在A字符集中對應表示的是“中國”,但是在B字符集中可能對應的就是“燙燙燙燙”了。

2、常見的字符集

常見的字符集:

  • ASCII(美國)
  • ISO-8859-1(歐洲)
  • GBK(中國,GB是國標的意思)
  • GB2312(同樣是中國。GB也是國標、並且是中文系統的默認編碼)
  • UTF-8(又叫萬國碼)
  • ANSI,是自動編碼的意思,意思是在中文系統中,就是默認的GB2312,在英文系統中就是ASCII編碼。

在中文系統的瀏覽器中,默認都是採用GB2312進行解碼。

ASCII碼是最早的字符集:採用7位的存儲,共128個字符,這是美國的,因爲加上英文字母的大小寫,再加上各種標點符號,美國已經夠用了。但是中國,和其他的國家不能用啊,所以,陸續出現了許多的編碼規範,由因爲種類太多了,使用起來沒有一個統一的標準,後面又出現了統一的編碼規範 : utf-8。

3、解決亂碼的兩種方法

第一種:在中文系統中更改編碼的爲GB2312,可以在notepad++中,格式菜單下,找到字符集,找到中文,選擇GB2312,即可(注意原本就有的內容依然會是亂碼,因爲這個文件是已經解碼出來得到的,所以修改格式都是先把需要更改的內容剪切,然後再更改html文件編碼格式,再粘貼內容即可。那是因爲前面的內容已經打出來了,已經編碼了,更改後只能更改修改編碼格式之後的內容。)這樣的侷限性太大。

第二種:改解碼格式,在head標籤裏面使用<meta>標籤修改,meta的意思
是元,這個標籤用來設置網頁的一些元數據。
注意:meta標籤是一個自結束標籤(或者叫自閉合標籤),編寫一個自結束標
籤,可以在開始標籤裏面的後面加上 / 如:<meta  /> 
比如設置編碼使用:<meta charset=”UTF-8/>  
 char 的意思是字符,set 是集合的意思,
這裏的utf-8 並不是亂寫的,這裏設置的意思是
告訴瀏覽器你的編碼方式是utf-8,所以他就會使用utf-8進行解碼。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章