HTML文件中文亂碼

HTML出現亂碼的原因很多,與編輯器和瀏覽器等都有關係,出現亂碼首先要找到問題所在。

1. 常見編碼:

(1)utf-8:(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字符編碼,又稱萬國碼。由Ken Thompson於1992年創建。現在已經標準化爲RFC 3629。UTF-8用1到4個字節編碼UNICODE字符。用在網頁上可以同一頁面顯示中文簡體繁體及其它語言(如日文,韓文)。“萬國碼”顧名思義可以支持很富哦語言,包括阿拉伯文等。

(2)gb2312: 信息交換用漢字編碼字符集。 《信息交換用漢字編碼字符集》是由中國國家標準總局1980年發佈,1981年5月1日開始實施的一套國家標準,標準號是GB 2312—1980。 GB2312編碼適用於漢字處理、漢字通信等系統之間的信息交換,通行於中國大陸;新加坡等地也採用此編碼。中國大陸幾乎所有的中文系統和國際化的軟件都支持GB 2312。 一般簡體中文的網站使用GB2312比較多。

總的來說utf-8支持的語言種類要比gb2312多,簡體中文網站可以使用gb2312。

2. 編輯器:

(1)最基礎的編輯器是記事本,在編寫好文件存儲爲html文件時除了文件內部所用的編碼方式,還要注意保存時的編碼方式(小細節容易被遺漏)。


2. 數據庫的處理:

如果網頁設置的編碼是gbk,但是數據庫的卻是utf-8的,寫數據庫連接文件的時候要注意。

如寫數據庫連接文件時寫成:

mysqp_query("SET NAMES'GBK'");
那頁面也要相應的變成:
<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章