再整MySQL的中文UTF8問題

再整MySQL的中文UTF8問題

<!--[endif]-->


 

MySQL4.x版本開始支持Unicode3.x只有latin1編碼。剛工作的時候就開始用MySQL了,用的php存取,網頁xxx.phpgb2312的編碼,存進去的數據用php取出來是中文,用phpMyAdmin執行selectupdatedump都是中文,沒有亂碼問題。

 

MySQL支持Unicode後,爲了與時俱進,我們的web程序也開始考慮用UTF8了。其實UTF8也用了好幾年了,程序基本能跑,沒什麼大問題,但是數據倒換的時候,總是遇到不爽的事情。

 

【問題現象】

網頁xxx.phpEditPlus另存爲UTF8格式,MySQLmy.ini裏設置default-character-set=utf8,建表時加了CREATE TABLE `xxx ` (myname varchar(255)) ENGINE=MyISAM DEFAULT CHARSET=utf8,用xxx.php執行insert/update/select出來的都是中文,貌似沒問題,但是用phpMyAdminselect是亂碼,用第三方工具軟件(如SQLyog)看select也是亂碼,mysqldump也是亂碼,很不爽。當然,如果你建表的時候,選擇了binary/varbinary/blob類型,不會發現亂碼,因爲指定的是二進制保存,MySQL保存數據時就沒有編碼的概念了。

 

【查找問題】

雖然在my.ini裏設置default-character-set=utf8,但是執行以下命令時有新發現:

mysql> SHOW VARIABLES LIKE 'character%';

+----------------------------------------+-------------------------

| Variable_name            | Value

+----------------------------------------+-------------------------

| character_set_client       | latin1

| character_set_connection   | latin1

| character_set_database    | utf8

| character_set_filesystem    | binary

| character_set_results       | latin1

| character_set_server       | utf8

| character_set_system      | utf8

| character_sets_dir         | D:/mysql/share/charsets/

+----------------------------------------+-------------------------

8 rows in set (0.00 sec)

 

mysql> SHOW VARIABLES LIKE 'collation_%';

+---------------------------------------+------------------

| Variable_name           | Value           

+---------------------------------------+------------------

| collation_connection     | latin1_swedish_ci

| collation_database       | utf8_general_ci 

| collation_server         | utf8_general_ci 

+--------------------------------------+------------------

3 rows in set (0.00 sec)

 

 

發現Value列裏面不全是utf8,仍然有部分是latin1,比如其中的clientconnection。那網頁xxx.php的工作過程就是這樣的啦:從xxx.php頁面上輸入漢字,因爲xxx.phpUTF8編碼的,所以xxx.phpUTF8格式轉換輸入的漢字,然後以UTF8提交給mysql,但是mysqlclientconnection都是latin1的,而表是UTF8的,所以mysql存儲時,先將xxx.php提交的漢字,轉成latin1的格式,再轉成UTF8字符格式存在表中。如果此時我們用第三方軟件或者phpMyAdminselect查看此表,而表中存儲的數據是被latin1過的UTF8字符,出來的時候是以UTF8格式取的,當然看起來時亂碼了。解決方法就是讓所有過程都是UTF8的就可以了。

 

【解決問題】

1、從my.ini下手

[client]

default-character-set=utf8

[mysql]

default-character-set=utf8

[mysqld]

default-character-set=utf8

以上3section都要加default-character-set=utf8,平時我們可能只加了mysqld一項。

然後重啓mysql,執行

mysql> SHOW VARIABLES LIKE 'character%';

mysql> SHOW VARIABLES LIKE 'collation_%';

確保所有的Value項都是utf8即可。

 

2、建表時加utf8,表字段的Collation可加可不加,不加時默認是utf8_general_ci了。

CREATE TABLE `tablename4` (

`id` int(11) NOT NULL AUTO_INCREMENT,

`varchar1` varchar(255) DEFAULT NULL,

`varbinary1` varbinary(255) DEFAULT NULL,

PRIMARY KEY (`id`)

)  ENGINE=MyISAM  DEFAULT CHARSET=utf8

 

3、網頁xxx.php保存時選擇utf8編碼,頁頭最好加上

header('conten-type:text/html;charset=utf-8');

在執行CRUD操作前先執行一下

mysql_query("set names utf8");

測試代碼xxx.php如下:

<?php

header('conten-type:text/html;charset=utf-8');

 

mysql_connect("localhost", "root", "password") or die("Could not connect: " . mysql_error());

mysql_select_db("test");

mysql_query("set names utf8");

$str = "CHN 軟件開發有限公司,JPN ソフトウェア開発株式會社,KOR 소프트웨어 개발 유한 공사,RUS Суд программного обеспечения".time();

$sql = "insert into tablename4 (varchar1, varbinary1 ) values ('".$str."','".$str."')";

echo $sql."<hr>";

mysql_query($sql);

 

$result = mysql_query("SELECT id, varchar1 ,varbinary1 FROM tablename4");

while ($row = mysql_fetch_array($result, MYSQL_BOTH)) {

printf ("ID: %s , varchar1: %s, varbinary1: %s<br>", $row[0], $row["varchar1"], $row["varbinary1"]);

}

 

mysql_free_result($result);

?>

如此設置之後,無論是在php頁面插入任何utf8字符,在php頁面裏取出來的,在phpMyAdmin裏取出來的,在mysql的第三方客戶端軟件裏取出來的,都是一樣的漢字了,不會再發現亂碼,mysqldump出來的也是漢字。OK,問題解決。

 

【另】在中文windows系統下,在cmd.exe裏運行mysql.exe字符終端,不能使用上面的規則,因爲默認情況下,中文windows系統cmd.exe裏的代碼頁是cp936GBK,不能顯示全部UTF8字符,所以在字符終端裏看到亂碼是正常現象,不要奇怪,這個問題在類Unix系統的shell終端裏可以解決的。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章