3、HTML亂碼出現的原因

原創

2020-02-24 07:23

1、出現的原因：

計算機存儲的任何內容都是以二進制 0 1 保存的，比如說：假設 “中國” 兩個字，在保存的時候是保存爲1010101110001，但在讀取的時候（也就是從 “1010101110001” 到 “中國”的過程），計算機會把這個二進制的編碼轉化爲原來的內容，即“中國”兩個字，這是編碼和轉碼的問題。

其中的轉換規則叫字符集（編碼和解碼採用的規則），如果使用A字符集去編碼，使用B字符集去解碼，這樣就出現亂碼了。也就是說，二進制數：1010101110001在A字符集中對應表示的是“中國”，但是在B字符集中可能對應的就是“燙燙燙燙”了。

2、常見的字符集

常見的字符集：

ASCII（美國）
ISO-8859-1（歐洲）
GBK（中國，GB是國標的意思）
GB2312（同樣是中國。GB也是國標、並且是中文系統的默認編碼）
UTF-8（又叫萬國碼）
ANSI，是自動編碼的意思，意思是在中文系統中，就是默認的GB2312，在英文系統中就是ASCII編碼。

在中文系統的瀏覽器中，默認都是採用GB2312進行解碼。

ASCII碼是最早的字符集:採用7位的存儲，共128個字符，這是美國的，因爲加上英文字母的大小寫，再加上各種標點符號，美國已經夠用了。但是中國，和其他的國家不能用啊，所以，陸續出現了許多的編碼規範，由因爲種類太多了，使用起來沒有一個統一的標準，後面又出現了統一的編碼規範： utf-8。

3、解決亂碼的兩種方法

第一種：在中文系統中更改編碼的爲GB2312，可以在notepad++中，格式菜單下，找到字符集，找到中文，選擇GB2312，即可（注意原本就有的內容依然會是亂碼，因爲這個文件是已經解碼出來得到的，所以修改格式都是先把需要更改的內容剪切，然後再更改html文件編碼格式，再粘貼內容即可。那是因爲前面的內容已經打出來了，已經編碼了，更改後只能更改修改編碼格式之後的內容。）這樣的侷限性太大。

第二種：改解碼格式，在head標籤裏面使用<meta>標籤修改，meta的意思
是元，這個標籤用來設置網頁的一些元數據。
注意：meta標籤是一個自結束標籤(或者叫自閉合標籤)，編寫一個自結束標
籤，可以在開始標籤裏面的後面加上 / 如：<meta  /> 
比如設置編碼使用：<meta charset=”UTF-8”  />  
 char 的意思是字符，set 是集合的意思，
這裏的utf-8 並不是亂寫的，這裏設置的意思是
告訴瀏覽器你的編碼方式是utf-8，所以他就會使用utf-8進行解碼。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

3、HTML亂碼出現的原因

1、出現的原因：

2、常見的字符集

3、解決亂碼的兩種方法

[轉帖]使用NMT和pmap解決JVM資源泄漏問題原創

Python實現大麥網搶票的四大關鍵技術點解析

Python 安裝庫指令大全

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

2020年上半年數據庫系統工程師考試

基於 Milvus + LlamaIndex 實現高級 RAG

【2024-05-21】以茶會友

10、HTML表格（table 、th、tr、td、合併單元格）的簡單認識

4、HTML文件結構相關解釋

PS界面初識

9、HTML：有序列表（ol），無序列表（ul），描述列表（dl、dt、dd）詳解

11、HTML表格的簡單小應用-製作課程表

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結