環境準備:
1、redis (默認端口6379)
2、zookeeper (默認端口2181)
3、Kafka (默認端口9092)
4、Canal (默認端口 11111)
5、MySQL (默認端口 3306
Canal介紹:引用官方介紹
canal 是阿里巴巴 MySQL 數據庫 Binlog 的增量訂閱&消費組件。
名稱:canal [kə'næl]
譯意: 水道/管道/溝渠
語言: 純java開發
定位: 基於數據庫增量日誌解析,提供增量數據訂閱&消費,目前主要支持了MySQL早期,阿里巴巴 B2B 公司因爲存在杭州和美國雙機房部署,存在跨機房同步的業務需求。不過早期的數據庫同步業務,主要是基於 trigger 的方式獲取增量 變更,不過從 2010 年開始,阿里系公司開始逐步的嘗試基於數據庫的日誌解析,獲取增量變更進行同步,由此衍生出了增量訂閱&消費的業務,從此開 啓了一段新紀元。ps. 目前內部使用的同步,已經支持 MySQL 8.x 和 Oracle 部分版本的日誌解析
基於日誌增量訂閱&消費支持的業務:
-
數據庫鏡像
-
數據庫實時備份
-
多級索引 (賣家和買家各自分庫索引)
-
search build (elastic search)
-
業務cache刷新(redis)
-
價格變化等重要業務消息
Canal 工作原理:
原理相對比較簡單:
-
canal模擬mysql slave的交互協議,僞裝自己爲mysql slave,向mysql master發送dump協議
-
mysql master收到dump請求,開始推送binary log給slave(也就是canal)
-
canal解析binary log對象(原始爲byte流)
以上爲官方介紹
canal 鏈接: https://pan.baidu.com/s/1HIT4b30BtXrkHym-w4peww 提取碼: ar6c
實現項目開發中如何使用呢?
實際項目我們是配置MQ模式,配合RocketMQ或者Kafka,canal會把數據發送到MQ的topic中,然後通過消息隊列的消費者進行消費處理。
這篇文章演示部署Canal,配合使用Kafka,同步數據到Redis
通過架構圖,我們很清晰就知道要用到的組件:MySQL、Canal、Kafka、ZooKeeper、Redis
MySQL搭建大家應該都會,ZooKeeper、Redis這些網上也有很多資料參考
主要說下Kafka搭建
首先在官網下載安裝包:
解壓,打開/config/server.properties配置文件,修改日誌目錄
首先啓動ZooKeeper,我用的是3.4.13版本:
接着再啓動Kafka,在Kafka的bin目錄下打開cmd,輸入命令:
kafka-server-start.bat ../../config/server.properties
我們可以通過ZooInspector看到ZooKeeper上註冊了Kafka相關的配置信息:
然後需要創建一個隊列,用於接收canal傳送過來的數據,使用命令:
kafka-topics.bat --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic canaltopic
創建的隊列名是canaltopic
。
配置Cannal Server
canal官網下載相關安裝包:
找到canal.deployer-1.1.4/conf目錄下的canal.properties配置文件:
# tcp, kafka, RocketMQ 這裏選擇kafka模式
canal.serverMode = kafka
# 解析器的線程數,打開此配置,不打開則會出現阻塞或者不進行解析的情況
canal.instance.parser.parallelThreadSize = 16
# 配置MQ的服務地址,這裏配置的是kafka對應的地址和端口
canal.mq.servers = 127.0.0.1:9092
# 配置instance,在conf目錄下要有example同名的目錄,可以配置多個
canal.destinations = example
然後配置instance,找到/conf/example/instance.properties配置文件:
## mysql serverId , v1.0.26+ will autoGen(自動生成,不需配置)
# canal.instance.mysql.slaveId=0
# position info
canal.instance.master.address=127.0.0.1:3306
# 在Mysql執行 SHOW MASTER STATUS;查看當前數據庫的binlog
canal.instance.master.journal.name=mysql-bin.000006
canal.instance.master.position=4596
# 賬號密碼
canal.instance.dbUsername=canal
canal.instance.dbPassword=Canal@****
canal.instance.connectionCharset = UTF-8
#MQ隊列名稱
canal.mq.topic=canaltopic
#單隊列模式的分區下標
canal.mq.partition=0
數據庫配置,創建授權賬戶
canal的原理是模擬自己爲mysql slave,所以這裏一定需要做爲mysql slave的相關權限
CREATE USER canal IDENTIFIED BY 'canal'; GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'canal'@'%'; -- GRANT ALL PRIVILEGES ON *.* TO 'canal'@'%' ; FLUSH PRIVILEGES;
針對已有的賬戶可通過grants查詢權限:
show grants for 'canal'
配置完成後,就可以啓動canal了。
測試驗證
這時可以打開kafka的消費者窗口,測試一下kafka是否收到消息。
kafka-console-consumer.bat --bootstrap-server 127.0.0.1:9092 --from-beginning --topic canaltopic
控制檯會出現亂碼的話,需要臨時設置一下編碼
在cmd命令行執行前切換到UTF-8編碼即可,使用命令行:chcp 65001
在MySQL數據庫操作數據,然後觀察Kafka這邊變化情況;
啓動Redis,把數據同步到Redis。
環境都搭建好了以後,下面編寫Redis客戶端代碼
首先引入Kafka和Redis的maven依賴:
<dependencies>
<dependency>
<groupId>org.springframework.kafka</groupId>
<artifactId>spring-kafka</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-data-redis</artifactId>
</dependency>
<dependency>
<groupId>com.alibaba</groupId>
<artifactId>fastjson</artifactId>
<version>1.2.28</version>
<scope>compile</scope>
</dependency>
</dependencies>
在application.yml文件配置:
spring:
redis:
host: 127.0.0.1
port: 6379
database: 0
password: 123456
編寫操作Redis的工具類:
@Component
public class RedisClient {
/**
* 獲取redis模版
*/
@Resource
private StringRedisTemplate stringRedisTemplate;
/**
* 設置redis的key-value
*/
public void setString(String key, String value) {
setString(key, value, null);
}
/**
* 設置redis的key-value,帶過期時間
*/
public void setString(String key, String value, Long timeOut) {
stringRedisTemplate.opsForValue().set(key, value);
if (timeOut != null) {
stringRedisTemplate.expire(key, timeOut, TimeUnit.SECONDS);
}
}
/**
* 獲取redis中key對應的值
*/
public String getString(String key) {
return stringRedisTemplate.opsForValue().get(key);
}
/**
* 刪除redis中key對應的值
*/
public Boolean deleteKey(String key) {
return stringRedisTemplate.delete(key);
}
}
創建MQ消費者進行數據同步
在application.yml配置文件加上kafka的配置信息:
spring:
kafka:
# Kafka服務地址
bootstrap-servers: 127.0.0.1:9092
consumer:
# 指定一個默認的組名
group-id: consumer-group1
#序列化反序列化
key-deserializer: org.apache.kafka.common.serialization.StringDeserializer
value-deserializer: org.apache.kafka.common.serialization.StringDeserializer
producer:
key-serializer: org.apache.kafka.common.serialization.StringDeserializer
value-serializer: org.apache.kafka.common.serialization.StringDeserializer
# 批量抓取
batch-size: 65536
# 緩存容量
buffer-memory: 524288
可以創建一個CanalBean對象進行接收
public class CanalBean {
//數據
private List<Student> data;
//數據庫名稱
private String database;
private long es;
//遞增,從1開始
private int id;
//是否是DDL語句
private boolean isDdl;
//表結構的字段類型
private MysqlType mysqlType;
//UPDATE語句,舊數據
private String old;
//主鍵名稱
private List<String> pkNames;
//sql語句
private String sql;
private SqlType sqlType;
//表名
private String table;
private long ts;
//(新增)INSERT、(更新)UPDATE、(刪除)DELETE、(刪除表)ERASE等等
private String type;
//getter、setter方法
}
public class MysqlType {
private String id;
private String commodity_name;
private String commodity_price;
private String number;
private String description;
//getter、setter方法
}
public class SqlType {
private int id;
private int commodity_name;
private int commodity_price;
private int number;
private int description;
}
創建業務測試表對應的Bean用於測試使用
@Data // lombok插件依賴
public class Student implements Serializable {
private Long id;
private String name;
private Integer age;
private static final long serialVersionUID = 1L;
}
最後就可以創建一個消費者CanalConsumer進行消費
package com.gary.sync.consumer;
import com.alibaba.fastjson.JSONObject;
import com.gary.sync.model.CanalBean;
import com.gary.sync.model.Student;
import com.gary.sync.model.TbCommodityInfo;
import com.gary.sync.redis.RedisClient;
import org.apache.kafka.clients.consumer.ConsumerRecord;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import org.springframework.kafka.annotation.KafkaListener;
import org.springframework.stereotype.Component;
import javax.annotation.Resource;
import java.util.List;
@Component
public class CanalConsumer {
//日誌記錄
private static Logger log = LoggerFactory.getLogger(CanalConsumer.class);
//redis操作工具類
@Resource
private RedisClient redisClient;
//監聽的隊列名稱爲:canaltopic
@KafkaListener(topics = "canaltopic")
public void receive(ConsumerRecord<?, ?> consumer) {
String value = (String) consumer.value();
log.info("topic名稱:{},key:{},分區位置:{},下標:{},value:{}", consumer.topic(), consumer.key(),consumer.partition(), consumer.offset(), value);
//轉換爲javaBean
CanalBean canalBean = JSONObject.parseObject(value, CanalBean.class);
//獲取是否是DDL語句
boolean isDdl = canalBean.getIsDdl();
//獲取類型
String type = canalBean.getType();
//不是DDL語句
if (!isDdl) {
List<Student> students = canalBean.getData();
//過期時間
long TIME_OUT = 600L;
if ("INSERT".equals(type)) {
//新增語句
for (Student student : students) {
Long id = student.getId();
//新增到redis中,過期時間是10分鐘
redisClient.setString(String.valueOf(id), JSONObject.toJSONString(student), TIME_OUT);
}
} else if ("UPDATE".equals(type)) {
//更新語句
for (Student student : students) {
Long id = student.getId();
//更新到redis中,過期時間是10分鐘
redisClient.setString(String.valueOf(id), JSONObject.toJSONString(student), TIME_OUT);
}
} else {
//刪除語句
for (Student student : students) {
Long id = student.getId();
//從redis中刪除
redisClient.deleteKey(String.valueOf(id));
}
}
}
}
}
測試MySQL與Redis數據同步
依次啓動-zookeeper-》kafka-》canal-》redis
zookeeper
kafka
canal
redis
測試數據準備:
先在MySQL創建表
DROP TABLE IF EXISTS `student`;
CREATE TABLE `student` (
`id` int NOT NULL,
`name` varchar(25) DEFAULT NULL,
`age` int DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci;
然後啓動項目
接着新增一條數據:
INSERT INTO `test`.`student` (`id`, `name`, `age`)
VALUES
('777', '測試', '123') ;
student表查到新增的數據:
Redis也查到了對應的數據,證明同步成功!
使用場景:
canal只能同步增量數據。
不是實時同步,是準實時同步。
增量同步,實現性不太強的場景