Repinted:http://blog.csdn.net/class1/archive/2006/12/30/1469298.aspx
爲了讓你的網頁能在更多的服務器上正常地顯示,還是加上“SET NAMES UTF8”吧(可以根據你的喜歡選擇相應的編碼,如gb2312),即使你現在沒有加上這句也能正常訪問。
先說MySQL的字符集問題。Windows下可通過修改my.ini內的
- # CLIENT SECTION
- [mysql]
- default-character-set=utf8
- # SERVER SECTION
- [mysqld]
- default-character-set=utf8
這兩個字段來更改數據庫的默認字符集。第一個是客戶端默認的字符集,第二個是服務器端默認的字符集。假設我們把兩個都設爲utf8,然後在MySQL Command Line Client裏面輸入“show variables like “character_set_%”;”,可看到如下字符:
character_set_client latin1
character_set_connection latin1
character_set_database utf8
character_set_results latin1
character_set_server utf8
character_set_system utf8
其中的utf8隨着我們上面的設置而改動。此時,要是我們通過採用UTF-8的PHP程序從數據庫裏讀取數據,很有可能是一串“?????” 或者是其他亂碼。網上查了半天,解決辦法倒是簡單,在連接數據庫之後,讀取數據之前,先執行一項查詢“SET NAMES UTF8”,即在PHP裏爲
- mysql_query("SET NAMES UTF8"); (注意大寫)
即可顯示正常(只要數據庫裏信息的字符正常)。爲什麼會這樣?這句查詢“SET NAMES UTF8”到底是什麼作用?
到MySQL命令行輸入“SET NAMES UTF8;”,然後執行“show variables like “character_set_%”;”,發現原來爲latin1的那些變量“character_set_client”、“character_set_connection”、“character_set_results”的值全部變爲utf8了,原來是這3個變量在搗蛋。查閱手冊,上面那句等於:
- SET character_set_client = utf8;
- SET character_set_results = utf8;
- SET character_set_connection = utf8;
看看這3個變量的作用:
信息輸入路徑:client→connection→server;
信息輸出路徑:server→connection→results。
換句話說,每個路徑要經過3次改變字符集編碼。以出現亂碼的輸出爲例,server裏utf8的數據,傳入connection轉爲latin1,傳入results轉爲latin1,utf-8頁面又把results轉過來。如果兩種字符集不兼容,比如latin1和utf8,轉化過程就爲不可逆的,破壞性的。所以就轉不回來了。
但這裏要聲明一點,“SET NAMES UTF8”作用只是臨時的,MySQL重啓後就恢復默認了。
接下來就說到MySQL在服務器上的配置問題了。豈不是我們每次對數據庫讀寫都得加上“SET NAMES UTF8”,以保證數據傳輸的編碼一致?能不能通過配置MySQL來達到那三個變量默認就爲我們要想的字符集?手冊上沒說,我在網上也沒找到答案。所以,從服務器配置的角度而言,是沒辦法省略掉那行代碼的。
總結以下幾點:
要保證select的返回與程序編碼一致,即character_set_results與程序編碼一致.
要保證程序編碼與瀏覽器一致,即程序編碼與<meta http-equiv="Content-Type" content="text/html; charset=?" />一致.