MySQL多字符集備份恢復測試

目的:測試單mysql實例在多字符集的數據庫環境中備份恢復的亂碼問題

準備工作:

CREATE DATABASE `utf8_db` /*!40100 DEFAULT CHARACTER SET utf8 */;

CREATE DATABASE `latin_db` /*!40100 DEFAULT CHARACTER SET latin1*/;

CREATE TABLE utf8_db.`utab` (  `id` int(11) NOT NULL AUTO_INCREMENT,  `name` varchar(50) DEFAULT NULL,  PRIMARY KEY (`id`)) ENGINE=InnoDB DEFAULT CHARSET=utf8
CREATE TABLE latin_db.`ltab` (  `id` int(11) NOT NULL AUTO_INCREMENT,  `name` varchar(50) DEFAULT NULL,  PRIMARY KEY (`id`)) ENGINE=InnoDB DEFAULT CHARSET=latin1


#模擬utf8客戶端插入數據

SELECT @@character_set_client,@@character_set_connection

SET  character_set_client = 'utf8';

SET character_set_connection= 'utf8';

insert into utf8_db.utab(name) values('tom'),('老張');


#模擬latin1客戶端插入數據

SELECT @@character_set_client,@@character_set_connection

SET  character_set_client = latin1;

SET character_set_connection= latin1;

select @@character_set_client,@@character_set_connection;


insert into latin_db.ltab(name) values('jery'),('小李');

#mysqldump 導出

#對於mysql實例存在不同字符集的數據庫,設置選項--default-character-set不同的值,導出的結果不同

#使用latin1 導出

mysqldump --default-character-set=latin1 -N -B latin_db uft8_db > /tmp/latin1.sql

導出結果ltab表中中文的數據正常,utab表中文是亂碼

#使用utf8 導出

mysqldump --default-character-set=utf8 -N -B latin_db uft8_db > /tmp/utf8.sql

導出結果utab表中中文的數據正常,ltab表中文是亂碼

#使用biarny導出

mysqldump --default-character-set=binary -N -B latin_db uft8_db > /tmp/utf8.sql

導出結果utab表中中文的數據正常,ltab表中中文的數據正常

#mysqldump文件導入

由於mysql數據庫實例的client編碼爲utf8(已經配置在my.cnf中),所以mysqldump導出文件會生成如下的hint(加粗部分):

DROP TABLE IF EXISTS `utab`;

/*!40101 SET @saved_cs_client     = @@character_set_client */;

/*!40101 SET character_set_client = utf8 */;

CREATE TABLE `utab` (

  `id` int(11) NOT NULL AUTO_INCREMENT,

  `name` varchar(50) DEFAULT NULL,

  PRIMARY KEY (`id`)

) ENGINE=InnoDB AUTO_INCREMENT=5 DEFAULT CHARSET=utf8;

/*!40101 SET character_set_client = @saved_cs_client */;

這些hint並不會影響字符爲utf8表的數據導入,但是會影響字符爲latin1的表的數據導入(在這種情況下,latin1表中的中文字符會變成亂碼)。

結論:

對於mysql實例存在不同字符集的數據庫,使用mysqldump的導出的時候,一定要根據數據庫字符集的不同單獨導出數據庫並設置對應的--default-character-set值。在數據導入時,對於數據庫與mysql實例默認字符不一致的數據庫,

一定要修改mysqldump文件中hint的character_set_client值

#使用binary導出,基於實例的恢復

#mysql實例備份

innobackupex --user=root --no-lock --defaults-file=/etc/my.cnf /backup/

#mysql實例還原

innobackupex --apply-log  --defaults-file=/etc/mysql/my6006.cnf /backup/2014-08-12_13-12-30/

innobackupex --copy-back  --defaults-file=/etc/mysql/my6006.cnf /backup/2014-08-12_13-12-30/

實例還原後,不同字符集的數據庫和在各自不同編碼的客戶端下,都沒有亂碼


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章