目的:測試單mysql實例在多字符集的數據庫環境中備份恢復的亂碼問題
準備工作:
CREATE DATABASE `utf8_db` /*!40100 DEFAULT CHARACTER SET utf8 */;
CREATE DATABASE `latin_db` /*!40100 DEFAULT CHARACTER SET latin1*/;
CREATE TABLE utf8_db.`utab` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` varchar(50) DEFAULT NULL, PRIMARY KEY (`id`)) ENGINE=InnoDB DEFAULT CHARSET=utf8
CREATE TABLE latin_db.`ltab` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` varchar(50) DEFAULT NULL, PRIMARY KEY (`id`)) ENGINE=InnoDB DEFAULT CHARSET=latin1
#模擬utf8客戶端插入數據
SELECT @@character_set_client,@@character_set_connection
SET character_set_client = 'utf8';
SET character_set_connection= 'utf8';
insert into utf8_db.utab(name) values('tom'),('老張');
#模擬latin1客戶端插入數據
SELECT @@character_set_client,@@character_set_connection
SET character_set_client = latin1;
SET character_set_connection= latin1;
select @@character_set_client,@@character_set_connection;
insert into latin_db.ltab(name) values('jery'),('小李');
#mysqldump 導出
#對於mysql實例存在不同字符集的數據庫,設置選項--default-character-set不同的值,導出的結果不同
#使用latin1 導出
mysqldump --default-character-set=latin1 -N -B latin_db uft8_db > /tmp/latin1.sql
導出結果ltab表中中文的數據正常,utab表中文是亂碼
#使用utf8 導出
mysqldump --default-character-set=utf8 -N -B latin_db uft8_db > /tmp/utf8.sql
導出結果utab表中中文的數據正常,ltab表中文是亂碼
#使用biarny導出
mysqldump --default-character-set=binary -N -B latin_db uft8_db > /tmp/utf8.sql
導出結果utab表中中文的數據正常,ltab表中中文的數據正常
#mysqldump文件導入
由於mysql數據庫實例的client編碼爲utf8(已經配置在my.cnf中),所以mysqldump導出文件會生成如下的hint(加粗部分):
DROP TABLE IF EXISTS `utab`;
/*!40101 SET @saved_cs_client = @@character_set_client */;
/*!40101 SET character_set_client = utf8 */;
CREATE TABLE `utab` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`name` varchar(50) DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=5 DEFAULT CHARSET=utf8;
/*!40101 SET character_set_client = @saved_cs_client */;
這些hint並不會影響字符爲utf8表的數據導入,但是會影響字符爲latin1的表的數據導入(在這種情況下,latin1表中的中文字符會變成亂碼)。
結論:
對於mysql實例存在不同字符集的數據庫,使用mysqldump的導出的時候,一定要根據數據庫字符集的不同單獨導出數據庫並設置對應的--default-character-set值。在數據導入時,對於數據庫與mysql實例默認字符不一致的數據庫,
一定要修改mysqldump文件中hint的character_set_client值
#使用binary導出,基於實例的恢復
#mysql實例備份
innobackupex --user=root --no-lock --defaults-file=/etc/my.cnf /backup/
#mysql實例還原
innobackupex --apply-log --defaults-file=/etc/mysql/my6006.cnf /backup/2014-08-12_13-12-30/
innobackupex --copy-back --defaults-file=/etc/mysql/my6006.cnf /backup/2014-08-12_13-12-30/
實例還原後,不同字符集的數據庫和在各自不同編碼的客戶端下,都沒有亂碼