要回答這個問題,首先需要獲取當前網頁正確的字符集。 代碼: //===============================================================================//Function Name: CharSetDetector//Description: 根據HTML網頁內容判斷該網頁使用的字符集//Parameter(s): oText HTML網頁內容//Return: 使用的字符集//===============================================================================
function CharSetDetector(oText)...{
var charset; //自動判斷編碼開始
var charSets = oText.match(/charset=(S+)"/i);
if (charSets != null){
charset = charSets[1];
}else{
charset = "UTF-8" //缺省採用UTF-8編碼
} //自動判斷編碼結束
return charset;
}
通過代碼大家可以瞭解到,使用一個很簡單的正則表達式,我們很容易就把當前網頁的字符集解析出來了。