最近關於中文顯示亂碼的貼子比較多,所以也做了個總結:
可以參考一下楊濤濤版主的《各種亂碼問題彙總》
http://topic.csdn.net/u/20071124/08/3b7eae69-ed1d-4a77-8895-9930bf3601af.html
MySQL字符集的原理介紹。摘錄於官方文檔。http://dev.mysql.com/doc/refman/5.1/zh/charset.html
不同的編碼格式會導致同一字符,在不同字符集下的編碼會不同。同樣同一編碼在不同的字符集中代碼的字符也不相同。當你的MySQL返回的字符串的編碼格式(字符集)與你的客戶工具程序(mysql, php, query browser, …)當前使用的字符集不同時,就會造成亂碼。 比如一個英國朋友告訴你Long, 當一位中國小學生看到後就會告訴你“龍”而不是“長”
關於字符集的詳細介紹和例子,建議花一點時間看一下
http://dev.mysql.com/doc/refman/5.1/zh/charset.html
(第10章:字符集支持)。
這裏僅摘要一下。
MySQL中默認字符集的設置有四級:服務器級,數據庫級,表級 。最終是字段級 的字符集設置。注意前三種均爲默認設置,並不代碼你的字段最終會使用這個字符集設置。所以我們建議要用show create table table ; 或show full fields from tableName; 來檢查當前表中字段的字符集設置。
MySQL中關於連接環境的字符集設置有 Client端,connection, results 通過這些參數,MySQL就知道你的客戶端工具用的是什麼字符集,結果集應該是什麼字符集。這樣MySQL就會做必要的翻譯,一旦這些參數有誤,自然會導致字符串在轉輸過程中的轉換錯誤。基本上99%的亂碼由些造成。
亂碼後需要檢查的信息。(如果需要論壇上的朋友幫助,建議你提供以下信息 )
1. 數據庫表中字段的字符集設置
。show create table TableName
或 show full columns from tableName
mysql> show create table t1;
+——-+————————————
| Table | Create Table
+——-+————————————
| t1 | CREATE TABLE `t1` (
`id` int(11) NOT NULL,
`c1` varchar(30) DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=gbk |
+——-+————————————
1 row in set (0.00 sec)
mysql> show full columns from t1;
+——-+————-+—————-+——+—–+-
| Field | Type | Collation | Null | Key |
+——-+————-+—————-+——+—–+-
| id | int(11) | NULL | NO | PRI |
| c1 | varchar(30) | gbk_chinese_ci | YES | |
+——-+————-+—————-+——+—–+-
2 rows in set (0.00 sec)
mysql>
2. 當前聯接系統參數 show variables like ‘char%’
mysql> show variables like ‘char%’;
+————————–+—————-
| Variable_name | Value
+————————–+—————-
| character_set_client | gbk
| character_set_connection | gbk
| character_set_database | latin1
| character_set_filesystem | binary
| character_set_results | gbk
| character_set_server | latin1
| character_set_system | utf8
| character_sets_dir | C:/Program File
+————————–+—————-
8 rows in set (0.00 sec)
mysql>
1. 中文,請確保 表中該字段的字符集爲中文兼容:
big5 | Big5 Traditional Chinese
gb2312 | GB2312 Simplified Chinese
gbk | GBK Simplified Chinese
utf8 | UTF-8 Unicode
2. 確保,聯接參數與這個字段字符集一致,你可以用 set name ‘charsetname’;
比如, set name ‘gbk’;
這條命令會同時修改 character_set_client,character_set_connection,character_set_results
(如果你的這架MySQL中都爲中文,則你可以在my.ini或my.cnf中加上或修改這個參數, 參數文件修改後需重啓MySQL服務)
[mysql]
default-character-set=gbk
3. PHP 亂碼, 同樣 mysql_query(“set name ‘gbk’”); 其它API也類似。
4. phpmyadmin裏亂碼
phpMyAdmin的config.inc.php中有沒有設置$cfg[‘DefaultCharset’]=’utf-8’;
5. Windows操作系統中命令行(”DOS”窗口)下。
在你的DOS窗中的左上角標題欄片左鍵,屬性,
在字體中,選擇“宋體”,確認
mysql中 set names ‘gbk’;
6. ADO.NET, ADO中
,可以連接字符串中加入CharSet=UTF8;類似指令以說明connection的字符集。
Server=myServerAddress;Database=myDataBase;Uid=myUsername;Pwd=myPassword; CharSet=UTF8;
7. SQL Manager for MySQL
用EMS建數據庫,
Character Set設爲utf-8
client charset設UTF-8
Font charset 設爲GB2312_CHARSET
8. jdbcodbc橋接 http://java.sun.com/j2se/1.4.2/docs/guide/jdbc/bridge.html
//
Load the JDBC-ODBC bridge driver
Class.forName(sun.jdbc.odbc.JdbcOdbcDriver) ;
//
setup the properties
java.util.Properties prop
=
new
java.util.Properties();
prop.put(
“
charSet
“
,
“
Big5
“
);
prop.put(
“
user
“
, username);
prop.put(
“
password
“
, password);
//
Connect to the database
con
=
DriverManager.getConnection(url, prop);
9. PHP 5.2 版本以上解決亂碼問題的一個方法 (由 ljf_ljf [Mark Liang] 提供)
$conn
=
mysql_connect
(
“
192.168.1.133
“
,
“
root
“
,
“
123456
“
) or
die
(
“
Could not connect:
“
.
mysql_error
());
$program_char
=
“
utf8
“
;
$conn
.
mysql_select_db
(
“
test
“
);
//
program_char.’”’);
mysql_set_charset(
$program_char
,
$conn
);
$charset
=
mysql_client_encoding
(
$conn
);
printf
(
“
current character set is %s <br>
“
,
$charset
);
$result
=
mysql_query
(
“
SELECT id, task_no,pack_path FROM tb_workplan where id = 1
“
,
$conn
);
while
(
$row
=
mysql_fetch_array
(
$result
,
MYSQL_BOTH)) {
printf
(
“
ID: %s <br> task_no: %s <br> pack_path :%s <BR>
“
,
$row
[
“
id
“
]
,
$row
[
1
]
,
$row
[
“
pack_path
“
]);
}
$conn
.
mysql_free_result
(
$result
);
$conn
.
mysql_close
();
9. 存儲過程參數亂碼
create procedure t ( aa char(10) charset ‘gbk’)
未完。。。