HTML出現亂碼的原因很多,與編輯器和瀏覽器等都有關係,出現亂碼首先要找到問題所在。
1. 常見編碼:
(1)utf-8:(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字符編碼,又稱萬國碼。由Ken Thompson於1992年創建。現在已經標準化爲RFC 3629。UTF-8用1到4個字節編碼UNICODE字符。用在網頁上可以同一頁面顯示中文簡體繁體及其它語言(如日文,韓文)。“萬國碼”顧名思義可以支持很富哦語言,包括阿拉伯文等。
(2)gb2312: 信息交換用漢字編碼字符集。 《信息交換用漢字編碼字符集》是由中國國家標準總局1980年發佈,1981年5月1日開始實施的一套國家標準,標準號是GB 2312—1980。 GB2312編碼適用於漢字處理、漢字通信等系統之間的信息交換,通行於中國大陸;新加坡等地也採用此編碼。中國大陸幾乎所有的中文系統和國際化的軟件都支持GB 2312。 一般簡體中文的網站使用GB2312比較多。
總的來說utf-8支持的語言種類要比gb2312多,簡體中文網站可以使用gb2312。
2. 編輯器:
(1)最基礎的編輯器是記事本,在編寫好文件存儲爲html文件時除了文件內部所用的編碼方式,還要注意保存時的編碼方式(小細節容易被遺漏)。
2. 數據庫的處理:
如果網頁設置的編碼是gbk,但是數據庫的卻是utf-8的,寫數據庫連接文件的時候要注意。
如寫數據庫連接文件時寫成:
mysqp_query("SET NAMES'GBK'");
那頁面也要相應的變成:<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />