PHP亂碼問題,UTF-8(亂碼)

PHP亂碼問題,UTF-8(亂碼)


一.HTML頁面轉UTF-8編碼問題 
1.在head後,title前加入一行:


<meta http-equiv='Content-Type' content='text/html; charset=utf-8' />
順序不能錯,一定要在


顯示的標題有可能是亂碼!


2.html文件編碼問題:


點擊編輯器的菜單:“文件”->“另存爲”,可以看到當前文件的編碼,確保文件編碼爲:UTF-8, 
如果是ANSI,需要將編碼改成:UTF-8。 
3.HTML文件頭BOM問題: 
將文件從其他的編碼轉換成UTF-8編碼時,有時候會在文件的最開始加上一個BOM標籤, 
在個BOM標籤可能會導致瀏覽器在顯示中文的時候出現亂碼。 
刪除這個BOM標籤的方法: 
1.可以用Dreamweaver打開文件,並重新保存,即可以去除BOM標籤! 
2.可以用EditPlus打開文件,並在菜單“首選項”->“文件”->"UTF-8標識",設置爲:“總是刪除簽名”, 
然後保存文件,即可以去除BOM標籤! 
4.WEB服務器UTF-8編碼問題: 
如果你按以上所列的步驟做了,還是有中文亂碼問題, 
請檢查你的所使用的WEB服務器的編碼問題 
如果你使用的是Apache,請將配置文件裏的:charset 設成:utf-8(這裏僅列出方法,具體格式請參考apache的配置文件) 
如果你使用的是Nginx,請將nginx.conf裏的:charset 設成 utf-8, 
具體找到 "charset gb2312;"或者類似的語句,改成:“charset utf-8;”。
二.PHP頁面轉UTF-8編碼問題 
1.在代碼開始出加入一行: 
header("Content-Type: text/html;charset=utf-8");


2.PHP文件編碼問題


點擊編輯器的菜單:“文件”->“另存爲”,可以看到當前文件的編碼,確保文件編碼爲:UTF-8, 
如果是ANSI,需要將編碼改成:UTF-8。 
3.PHP文件頭BOM問題: 
PHP文件一定不可以有BOM標籤 
否則,會出現session不能使用的情況,並有類似的提示: 
Warning: session_start() [function.session-start]: Cannot send session cache limiter - headers already sent 
這是因爲,在執行session_start() 的時候,整個頁面不能有輸出,但是當由於前PHP頁面存在BOM標籤, 
PHP把這個BOM標籤當成是輸出了,所以就出錯了! 
所以PHP頁面一定要刪除BOM標籤 
刪除這個BOM標籤的方法: 
1.可以用Dreamweaver打開文件,並重新保存,即可以去除BOM標籤! 
2.可以用EditPlus打開文件,並在菜單“首選項”->“文件”->"UTF-8標識",設置爲:“總是刪除簽名”, 
然後保存文件,即可以去除BOM標籤! 
4.PHP以附件形式保存文件的時候,UTF-8編碼問題: 
PHP以附件形式保存文件,文件名必須是GB2312編碼, 
否則,如果文件名中有中文的話,將是顯示亂碼: 
如果你的PHP本身是UTF-8編碼格式的文件, 
需要將文件名變量由UTF-8轉成GB2312: 
iconv("UTF-8", "GB2312", "$filename"); 


5.截斷顯示文章標題時,出現亂碼或者“?”問號的問題: 
一般文章標題很長的時候,會顯示一部分標題,會對文章標題進行截斷, 
由於一個UTF-8編碼格式的中文字符會佔用3個字符寬度, 
截取標題的時候,有時會只截取到一箇中文字符的1個字符或2字符寬度, 
沒截取完整,將出現亂碼或“?”問號的情況, 
用下面的函數截取標題,就不會有問題:


function get_brief_str($str, $max_length) 

echo strlen($str) ."<br>"; 
if(strlen($str) > $max_length) 

$check_num = 0; 
for($i=0; $i < $max_length; $i++) 

if (ord($str[$i]) > 128) 
$check_num++; 



if($check_num % 3 == 0) 
$str = substr($str, 0, $max_length)."..."; 
else if($check_num % 3 == 1) 
$str = substr($str, 0, $max_length + 2)."..."; 
else if($check_num % 3 == 2) 
$str = substr($str, 0, $max_length + 1)."..."; 

return $str; 
}
三.MYSQL數據庫使用UTF-8編碼的問題


 


1.用phpmyadmin創建數據庫和數據表 
創建數據庫的時候,請將“整理”設置爲:“utf8_general_ci” 
或執行語句:


CREATE DATABASE `dbname` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;
創建數據表的時候:如果是該字段是存放中文的話,則需要將“整理”設置爲:“utf8_general_ci”,


如果該字段是存放英文或數字的話,默認就可以了。


相應的SQL語句,例如:


CREATE TABLE `test` ( 
`id` INT NOT NULL , 
`name` VARCHAR( 10 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL , 
PRIMARY KEY ( `id` ) 
) ENGINE = MYISAM ;
2.用PHP讀寫數據庫


在連接數據庫之後:


[hide]$connection = mysql_connect($host_name, $host_user, $host_pass);


加入兩行:


mysql_query("set character set 'utf8'");//讀庫


mysql_query("set names 'utf8'");//寫庫


就可以正常的讀寫MYSQL數據庫了。


 


 


四.JS相關的UTF-8編碼問題 
1.JS讀Cookie的中文亂碼問題 


 


PHP寫cookie的時候需要將中文字符進行escape編碼, 
否則JS讀到cookie中的中文字符將是亂碼。 
但php本身沒有escape函數,我們新寫一個escape函數: 
function escape($str) 

preg_match_all("/[\x80-\xff].|[\x01-\x7f]+/",$str,$r); 
$ar = $r[0]; 
foreach($ar as $k=>$v) 

if(ord($v[0]) < 128) 
$ar[$k] = rawurlencode($v); 
else 
$ar[$k] = "%u".bin2hex(iconv("UTF-8","UCS-2",$v)); 

return join("",$ar); 
}
JS讀cookie的時候,用unescape解碼,


然後就解決cookie中有中文亂碼的問題了。


2.外部JS文件UTF-8編碼問題


當一個HTML頁面或則PHP頁面包含一個外部的JS文件時,


如果HTML頁面或則PHP頁面是UTF-8編碼格式的文件,


外部的JS文件同樣要轉成UTF-8的文件,


否則將出現,沒有包含不成功,調用函數時沒有反應的情況。


點擊編輯器的菜單:“文件”->“另存爲”,可以看到當前文件的編碼,確保文件編碼爲:UTF-8,


如果是ANSI,需要將編碼改成:UTF-8。


五.FLASH相關的UTF-8編碼問題


FLASH內部對所有字符串,默認都是以UTF-8處理 
1.FLASH讀文普通本文件(txt,html) 
要將文本文件的編碼存爲UTF-8 
點擊編輯器的菜單:“文件”->“另存爲”,可以看到當前文件的編碼,確保文件編碼爲:UTF-8, 
如果是ANSI,需要將編碼改成:UTF-8。 
2.FLASH讀XML文件 
要將XML文件的編碼存爲UTF-8 
點擊編輯器的菜單:“文件”->“另存爲”,可以看到當前文件的編碼,確保文件編碼爲:UTF-8, 
如果是ANSI,需要將編碼改成:UTF-8。 
在XML第1行寫: 


3.FLASH讀PHP返回數據 
如果PHP編碼本身是UTF-8的,直接echo就可以了 
如果PHP編碼本身是GB2312的,可以將PHP轉存成UTF-8編碼格式的文件,直接echo就可以了
如果PHP編碼本身是GB2312的,而且不允許改文件的編碼格式, 
用下面的語句將字符串轉換成UTF-8的編碼格式 
$new_str = iconv("GB2312", "UTF-8", "$str"); 
再echo就可以了 
4.FLASH讀數據庫(MYSQL)的數據 
FLASH要通過PHP讀取數據庫中的數據 
PHP本身的編碼不重要,關鍵是如果數據庫的編碼是GB2312的話, 
需要用下面的語句將字符串轉換成UTF-8的編碼格式 
$new_str = iconv("GB2312", "UTF-8", "$str"); 


5.FLASH通過PHP寫數據 
一句話,FLASH傳過來的字符串是UTF-8格式的, 
要轉換成相應的編碼格式,再操作(寫文件、寫數據庫、直接顯示等等) 
還是用iconv函數轉換 
6.FLASH使用本地編碼(理論上不推薦使用) 
如果想讓FLASH不使用UTF-8編碼,而是使用本地編碼 
對於中國大陸地區而言,本地編碼是GB2312或GBK 
AS程序內,可以添加以下代碼: 
System.useCodepage = true; 
那麼FLASH內所有字符都是使用GB2312的編碼了 
所有導入到FLASH或者從FLASH導出的數據,都應該做相應的編碼轉換 
因爲使用本地編碼,會造成使用繁體中文地區的用戶產生亂碼,所以不推薦使用
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章