binlog

mysql为了保证事务的ACID(atomicity,consistency,isolation,durability)，用了几种日志做配合处理，分别为binglog（二进制日志）、redolog（重做日志）、undolog（回滚日志）。

重做日志（redo log）

确保事务的持久性。防止在发生故障的时间点，尚有脏页未写入磁盘，在重启mysql服务的时候，根据redo log进行重做，从而达到事务的持久性这一特性。

回滚日志（undo log）

保存了事务发生之前的数据的一个版本，可以用于回滚，同时可以提供多版本并发控制下的读（MVCC），也即非锁定读

二进制日志（binlog）：

用于复制，在主从复制中，从库利用主库上的binlog进行重播，实现主从同步。 用于数据库的基于时间点的还原。

我们这里的重点，就是binlog了。

同步机制

通过图我们可以看出，binlog同步分为6个步骤：

master开启binlog日志（数据改变会产生日志）
slave连接mater，开启同步（前提，同名db必须存在，假如数据不为空，已有数据必须一致）
master数据变化产生binglog，通过binglog dump线程通知给slave.
slave同步写入relay log。
slave执行收到的sql日志（此时已经执行完毕）。
slave执行写本地binlog。

binlog同步分为3种同步模式：

STATEMENT模式（SBR）

 每一条会修改数据的sql语句会记录到binlog中。优点是并不需要记录每一条sql语句和每一行的数据变化，减少了binlog日志量，节约IO，提高性能。缺点是在某些情况下会导致master-slave中的数据不一致(如sleep()函数， last_insert_id()，以及user-defined functions(udf)等会出现问题)

ROW模式（RBR）

 不记录每条sql语句的上下文信息，仅需记录哪条数据被修改了，修改成什么样了。而且不会出现某些特定情况下的存储过程、或function、或trigger的调用和触发无法被正确复制的问题。缺点是会产生大量的日志，尤其是alter table的时候会让日志暴涨。

MIXED模式（MBR）

 以上两种模式的混合使用，一般的复制使用STATEMENT模式保存binlog，对于STATEMENT模式无法复制的操作使用ROW模式保存binlog，MySQL会根据执行的SQL语句选择日志保存方式。

步骤

master开启binlog

binlog_format           = MIXED                         //binlog日志格式，mysql默认采用statement，建议使用mixed
log-bin                 = /data/mysql/mysql-bin.log     //binlog日志文件
expire_logs_days        = 7                             //binlog过期清理时间
max_binlog_size         = 100m                          //binlog每个日志文件大小
binlog_cache_size       = 4m                            //binlog缓存大小
max_binlog_cache_size   = 512m                          //最大binlog缓存大小

slave连接

server-id=2
master-host=xxx
master-user=username
master-password=xxxx
master-port=xxxx
replicate-do-db=dbname
......

# 开启中继日志
relay-log=relay-log
relay-log-index=/data/mysql/relay-log.index
server-id=2
innodb_file_per_table=ON #innodb_file_per_table=ON的情况下，默认创建出来的ibd文件的格式是Barracuda，在这个文件格式下innodb数据行的格式就可以设置为compressed 或 dynamic 格式了。compressed 提供压缩功能节约空间，dynamic能优化对blob,text这样的数据类型的存储以提升性能。5.7+才支持
skip_name_resolve=ON  #跳过主机检测

binlog dump theard

主库在接收到从库发送的COM_BINLOG_DUMP_GTID命令后，会调用com_binlog_dump_gtid函数处理从库拉取binlog的请求。主要的执行逻辑如下：

获取从库发送的binlog相关信息，包括server_id，binlog名称，binlog位置，binlog大小，gtid信息等等。
检查是否已经存在与该从库关联的binlog dump线程，如果存在，结束该binlog dump线程。为什么会已经存在binlog dump线程？在某些场景下，比如从库io线程停止，这时主库的binlog dump线程正好在等待binlog更新，即等待主库写入数据，如果主库一直没有写入数据，dump线程就会等待很长时间，如果这时从库io线程重连到主库，就会发现主库已经存在与该从库对应的dump线程。所以主库在处理从库binlog dump请求时，先检查是否已经存在dump线程。
调用mysql_binlog_send函数，向从库发送binlog。这个函数内部实际是通过一个C++类Binlog_sender来实现的，该类在源码文件sql/rpl_binlog_sender.h中定义，调用该类的run成员函数来发送binlog。
Binlog_sender类的run成员函数，主要逻辑是通过多个while嵌套循环，依次读取binlog文件，binlog文件中的event，将event发送给从库。如果event已经在从库中应用，则忽略该event。当读到最新的binlog时，如果所有event都已经发送完成，那么线程会等待binlog更新事件update_cond，有新的binlog event写入后，会广播通知所有等待update_cond事件的线程开始工作，也包括dump线程。dump线程在等待update_cond事件时有一个超时时间，这个时间就是master_heartbeat_period，即主库dump线程与从库io线程的心跳时间间隔，这个值在从库执行change master 时设置，启动io线程时把该值传递给主库，主库dump线程等待update_cond超时后，将会给从库发送一个heartbeat event，之后会继续等待update_cond事件。上述过程会一直循环，直到dump线程被kill或者遇到其他错误。
当执行逻辑从Binlog_sender类内部的while循环退出，紧接着会调用unregister_slave函数注销从库的注册。这个时候在主库上执行show slave hosts，就会发现从库的信息已经没有了。

slave relaylog

relay-log的结构和binlog非常相似，只不过他多了一个master.info和relay-log.info的文件。

master.info记录了上一次读取到master同步过来的binlog的位置，以及连接master和启动复制必须的所有信息。

relay-log.info记录了文件复制的进度，下一个事件从什么位置开始，由sql线程负责更新。

relay-log无法自动删除

背景：

在运维一个mysql实例时，发现其数据目录下的relay-log 长期没有删除，已经堆积了几十个relay-log。然而其他作为Slave服务器实例却没有这种情况。

现象分析：

通过收集到的信息，综合分析后发现relay-log无法自动删除和以下原因有关。

该实例原先是一个Slave:导致relay-log 和 relay-log.index的存在
该实例目前已经不是Slave:由于没有了IO-Thread，导致relay-log-purge 没有起作用（这也是其他Slave实例没有这种情况的原因，因为IO-thread会做自动rotate操作）。
该实例每天会进行日常备份:Flush logs的存在，导致每天会生成一个relay-log
该实例没有配置expire-logs-days:导致flush logs时，也不会做relay-log清除
简而言之就是：一个实例如果之前是Slave，而之后停用了（stop slave），且没有配置expire-logs-days的情况下，会出现relay-log堆积的情况。

Binary Log rotate机制：

Rotate：每一条binary log写入完成后，都会判断当前文件是否超过max_binlog_size ，如果超过则自动生成一个binlog file
Delete：expire-logs-days 只在实例启动时和 flush logs 时判断，如果文件访问时间早于设定值，则purge file

Relay Log rotate 机制：

Rotate：每从Master fetch一个events后，判断当前文件是否超过max_relay_log_size 如果超过则自动生成一个新的relay-log-file
Delete： purge-relay-log 在SQL Thread每执行完一个events时判断，如果该relay-log 已经不再需要则自动删除
Delete： expire-logs-days 只在实例启动时和 flush logs 时判断，如果文件访问时间早于设定值，则purge file （同Binlog file） (updated: expire-logs-days和relaylog的purge没有关系)

因此还是建议配置 expire-logs-days ， 否则当我们的外部脚本因意外而停止时，还能有一层保障。
因此建议当slave不再使用时，通过reset slave来取消relaylog，以免出现relay-log堆积的情况。

salve sql exe

这个执行步骤和一般执行sql没有太大区别

slave wirte binlog

这个执行步骤和master一致

各种同步模式的优缺点

SBR 的优点：

历史悠久，技术成熟：

binlog文件较小
binlog中包含了所有数据库更改信息，可以据此来审核数据库的安全等情况
binlog可以用于实时的还原，而不仅仅用于复制

主从版本可以不一样，从服务器版本可以比主服务器版本高

SBR 的缺点：

不是所有的UPDATE语句都能被复制，尤其是包含不确定操作的时候。调用具有不确定因素的 UDF 时复制也可能出问题，使用以下函数的语句也无法被复制：

LOAD_FILE()
UUID()
USER()
FOUND_ROWS()
SYSDATE() (除非启动时启用了 --sysdate-is-now 选项)

INSERT ... SELECT 会产生比 RBR 更多的行级锁

复制需要进行全表扫描(WHERE 语句中没有使用到索引)的 UPDATE 时，需要比 RBR 请求更多的行级锁。对于有 AUTO_INCREMENT 字段的 InnoDB表而言，INSERT 语句会阻塞其他 INSERT 语句。对于一些复杂的语句，在从服务器上的耗资源情况会更严重，而 RBR 模式下，只会对那个发生变化的记录产生影响。存储函数(不是存储过程)在被调用的同时也会执行一次 NOW() 函数，这个可以说是坏事也可能是好事，确定了的 UDF 也需要在从服务器上执行，数据表必须几乎和主服务器保持一致才行，否则可能会导致复制出错，执行复杂语句如果出错的话，会消耗更多资源

RBR 的优点：

任何情况都可以被复制，这对复制来说是最安全可靠的，和其他大多数数据库系统的复制技术一样，多数情况下，从服务器上的表如果有主键的话，复制就会快了很多，复制以下几种语句时的行锁更少：

INSERT ... SELECT
包含 AUTO_INCREMENT 字段的 INSERT
没有附带条件或者并没有修改很多记录的 UPDATE 或 DELETE 语句

执行 INSERT，UPDATE，DELETE 语句时锁更少，从服务器上采用多线程来执行复制成为可能

RBR 的缺点：

binlog 大了很多，复杂的回滚时 binlog 中会包含大量的数据，主服务器上执行 UPDATE 语句时，所有发生变化的记录都会写到 binlog 中，而 SBR 只会写一次，这会导致频繁发生 binlog 的并发写问题，UDF 产生的大 BLOB 值会导致复制变慢，无法从 binlog 中看到都复制了写什么语句，当在非事务表上执行一段堆积的SQL语句时，最好采用 SBR 模式，否则很容易导致主从服务器的数据不一致情况发生

另外，针对系统库 mysql 里面的表发生变化时的处理规则如下：
如果是采用 INSERT，UPDATE，DELETE 直接操作表的情况，则日志格式根据 binlog_format 的设定而记录
如果是采用 GRANT，REVOKE，SET PASSWORD 等管理语句来做的话，那么无论如何都采用 SBR 模式记录
注：采用 RBR 模式后，能解决很多原先出现的主键重复问题。

基于binlog的mysql主从同步

binlog

同步机制

步骤

master开启binlog

slave连接

binlog dump theard

slave relaylog

relay-log无法自动删除

salve sql exe

slave wirte binlog

各种同步模式的优缺点

SBR 的优点：

SBR 的缺点：

RBR 的优点：

RBR 的缺点：

Java集合中的Set

安裝chromadb注意事項

前端面試題 - null是原始類型，但爲什麼typeof null的結果是object？

前端面試題 - 如何實現promise？

Java中的List

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結