MySQL多字符集備份恢復測試

目的：測試單mysql實例在多字符集的數據庫環境中備份恢復的亂碼問題

準備工作：

CREATE DATABASE `utf8_db` /*!40100 DEFAULT CHARACTER SET utf8 */;

CREATE DATABASE `latin_db` /*!40100 DEFAULT CHARACTER SET latin1*/;

CREATE TABLE utf8_db.`utab` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` varchar(50) DEFAULT NULL, PRIMARY KEY (`id`)) ENGINE=InnoDB DEFAULT CHARSET=utf8
CREATE TABLE latin_db.`ltab` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` varchar(50) DEFAULT NULL, PRIMARY KEY (`id`)) ENGINE=InnoDB DEFAULT CHARSET=latin1

#模擬utf8客戶端插入數據

SELECT @@character_set_client,@@character_set_connection

SET character_set_client = 'utf8';

SET character_set_connection= 'utf8';

insert into utf8_db.utab(name) values('tom'）,（'老張');

#模擬latin1客戶端插入數據

SELECT @@character_set_client,@@character_set_connection

SET character_set_client = latin1;

SET character_set_connection= latin1;

select @@character_set_client,@@character_set_connection;

insert into latin_db.ltab(name) values('jery'),('小李');

#mysqldump 導出

#對於mysql實例存在不同字符集的數據庫，設置選項--default-character-set不同的值，導出的結果不同

#使用latin1 導出

mysqldump --default-character-set=latin1 -N -B latin_db uft8_db > /tmp/latin1.sql

導出結果ltab表中中文的數據正常，utab表中文是亂碼

#使用utf8 導出

mysqldump --default-character-set=utf8 -N -B latin_db uft8_db > /tmp/utf8.sql

導出結果utab表中中文的數據正常，ltab表中文是亂碼

#使用biarny導出

mysqldump --default-character-set=binary -N -B latin_db uft8_db > /tmp/utf8.sql

導出結果utab表中中文的數據正常，ltab表中中文的數據正常

#mysqldump文件導入

由於mysql數據庫實例的client編碼爲utf8（已經配置在my.cnf中），所以mysqldump導出文件會生成如下的hint（加粗部分）：

DROP TABLE IF EXISTS `utab`;

/*!40101 SET @saved_cs_client = @@character_set_client */;

/*!40101 SET character_set_client = utf8 */;

CREATE TABLE `utab` (

`id` int(11) NOT NULL AUTO_INCREMENT,

`name` varchar(50) DEFAULT NULL,

PRIMARY KEY (`id`)

) ENGINE=InnoDB AUTO_INCREMENT=5 DEFAULT CHARSET=utf8;

/*!40101 SET character_set_client = @saved_cs_client */;

這些hint並不會影響字符爲utf8表的數據導入，但是會影響字符爲latin1的表的數據導入（在這種情況下，latin1表中的中文字符會變成亂碼）。

結論：

對於mysql實例存在不同字符集的數據庫，使用mysqldump的導出的時候，一定要根據數據庫字符集的不同單獨導出數據庫並設置對應的--default-character-set值。在數據導入時，對於數據庫與mysql實例默認字符不一致的數據庫，

一定要修改mysqldump文件中hint的character_set_client值

#使用binary導出,基於實例的恢復

#mysql實例備份

innobackupex --user=root --no-lock --defaults-file=/etc/my.cnf /backup/

#mysql實例還原

innobackupex --apply-log --defaults-file=/etc/mysql/my6006.cnf /backup/2014-08-12_13-12-30/

innobackupex --copy-back --defaults-file=/etc/mysql/my6006.cnf /backup/2014-08-12_13-12-30/

實例還原後，不同字符集的數據庫和在各自不同編碼的客戶端下，都沒有亂碼

MySQL多字符集備份恢復測試

SQL優化-20231016

MySQL開發規範

我的友情鏈接

備份一個約250G的mysql實例【xtrabackup備份方案對比】

pt-kill 常用殺進程參數

幾個複製表結構和表數據的方法

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結