文章目录[隐藏]
日志
我们在讲解数据库事务时,讲过两种日志:重做日志、回滚日志
对于线上数据库应用系统,突然遭遇数据库宕机
怎么办?在这种情况下,定位宕机的原因
就非常关键。我们可以查看数据库的错误日志
。因为日志中记录了数据库运行中的诊断信息,包括了错误、警告和注释等信息。比如:从日志中发现某个连接中的 SQL 操作发生了死循环,导致内存不足,被系统强行终止了。明确了原因,处理起来也就轻松了,系统很快就恢复了运行
除了发现错误,日志在数据复制、数据恢复、操作审计,以及确保数据的永久性和一致性等方面,都有着不可替代的作用
千万不要小看日志。很多看似奇怪的问题,答案往往就藏在日志里。很多情况下,只有通过查看日志才能发现问题的原因,真正解决问题。所以,一定要学会查看日志,养成检查日志的习惯,对提升你的数据库应用开发能力至关重要
MySQL8.0 官网日志地址:“ https://dev.mysql.com/doc/refman/8.0/en/server-logs.html ”
1. MySQL 支持的日志
1.1 日志类型
MySQL 有不同类型的日志文件,用来存储不同类型的日志,分为二进制日志
、错误日志
、通用查询日志
和慢查询日志
,这也是常用的 4 种。MySQL 8 又新增两种支持的日志:中继日志
和数据定义语句日志
。使用这些日志文件,可以查看 MySQL 内部发生的事情
这 6 类日志分别为:
- 慢查询日志:记录所有执行时间超过
long_query_time
的所有查询,方便我们对查询进行优化 - 通用查询日志:记录所有连接的起始时间和终止时间,以及连接发送给数据库服务器的所有指令,对我们复原操作的实际场景、发现问题,甚至是对数据库操作的审计都有很大的帮助
- 错误日志:记录 MySQL 服务的启动、运行或停止 MySQL 服务时出现的问题,方便我们了解服务器的状态,从而对服务器进行维护
- 二进制日志:记录所有更改数据的语句,可以用于主从服务器之间的数据同步,以及服务器遇到故障时数据的无损失恢复
- 中继日志:用于主从服务器架构中,从服务器用来存放主服务器二进制日志内容的一个中间文件。从服务器通过读取中继日志的内容,来同步主服务器上的操作
- 数据定义语句日志:记录数据定义语句执行的元数据操作
除二进制日志外,其他日志都是文本文件
。默认情况下,所有日志创建于MySQL 数据目录
中
1.2 日志的弊端
- 日志功能会
降低 MySQL 数据库的性能
。例如,在查询非常频繁的 MySQL 数据库系统中,如果开启了通用查询日志和慢查询日志,MySQL 数据库会花费很多时间记录日志 - 日志会
占用大量的磁盘空间
。对于用户量非常大,操作非常频繁的数据库,日志文件需要的存储空间设置比数据库文件需要的存储空间还要大
2. 慢查询日志(slow query log)
详情见《性能分析工具的使用》
3. 通用查询日志(general query log)
通用查询日志用来记录用户的所有操作
,包括启动和关闭 MySQL 服务、所有用户的连接开始时间和截止时间、发给 MySQL 数据库服务器的所有 SQL 指令等。当我们的数据发生异常时,查看通用查询日志,还原操作时的具体场景,可以帮助我们准确定位问题
3.1 查看当前状态
mysql> SHOW VARIABLES LIKE '%general%';
+------------------+---------------------------+
| Variable_name | Value |
+------------------+---------------------------+
| general_log | OFF | # 通用查询日志处于关闭状态
| general_log_file | /var/lib/mysql/centos.log | # 通用查询日志文件的名称是 centos.log
+------------------+---------------------------+
2 rows in set (0.03 sec)
说明1:系统变量
general_log
的值是 OFF,即通用查询日志处于关闭状态。在 MySQL 中,这个参数的默认值是关闭的
。因为一旦开启记录通用查询日志,MySQL 会记录所有的连接起止和相关的 SQL 操作,这样会消耗系统资源并且占用磁盘空间。我们可以通过手动修改变量的值,在需要的时候开启日志
说明2:通用查询日志文件的名称是 centos.log。存储路径是 /var/lib/mysql/,默认也是数据路径。这样我们就知道在哪里可以查看通用查询日志的内容了
3.2 启动日志
方式1:永久性方式
修改 my.cnf 或者 my.ini 配置文件来设置。在 [mysqld] 组下加入 log 选项,并重启 MySQL 服务。格式如下:
[mysqld]
general_log = ON
general_log_file = [path[filename]] # 日志文件所在目录路径,filename为日志文件
如果不指定目录和文件名,通用查询日志将默认存储在 MySQL 数据目录中的 hostname.log 文件中,hostname表示主机名
方式2:临时性方式
SET GLOBAL general_log = on; # 开启通用查询日志
SET GLOBAL general_log_file = 'path/filename'; # 设置日志文件保存位置
对应的,关闭操作 SQL 命令如下:
SET GLOBAL general_log = off; # 关闭通用查询日志
查看设置后情况:
SHOW VARIABLES LIKE 'general_log%';
3.3 查看日志
通用查询日志是以文本文件
的形式存储在文件系统中的,可以使用文本编辑器
直接打开日志文件。每台 MySQL 服务器的通用查询日志内容是不同的
- 在 Windows 操作系统中,使用文本文件查看器
- 在 Linux 系统中,可以使用 vi 工具或者 gedit 工具查看
- 在 Mac OS 系统中,可以使用文本文件查看器或者 vi 等工具查看
从SHOW VARIABLES LIKE 'general_log%'
; 结果中可以看到通用查询日志的位置
/usr/sbin/mysqld, Version: 8.0.34 (MySQL Community Server - GPL). started with:
Tcp port: 3306 Unix socket: /var/lib/mysql/mysql.sock
Time Id Command Argument
2023-10-24T03:46:48.283517Z 9 Query SHOW VARIABLES LIKE 'general_log%'
2023-10-24T03:47:09.290507Z 9 Query SELECT DATABASE()
2023-10-24T03:47:09.293012Z 9 Init DB atguigudb2
2023-10-24T03:47:09.296930Z 9 Query show databases
2023-10-24T03:47:09.311121Z 9 Query show tables
2023-10-24T03:47:09.313798Z 9 Field List account
2023-10-24T03:47:09.317767Z 9 Field List book
2023-10-24T03:47:09.318708Z 9 Field List class
2023-10-24T03:47:09.319399Z 9 Field List student
2023-10-24T03:47:09.320111Z 9 Field List type
2023-10-24T03:47:18.468771Z 9 Query select * from student
2023-10-24T03:47:24.077187Z 10 Connect root@localhost on using Socket
2023-10-24T03:47:24.079701Z 10 Query KILL QUERY 9
2023-10-24T03:47:24.080836Z 10 Quit
2023-10-24T03:47:50.854736Z 9 Query select count(*) from student
在通用查询日志里面,我们可以清楚地看到,什么时候开启了新的客户端登陆数据库,登录之后做了什么 SQL 操作,针对的是哪个数据表等信息
3.4 停止日志
方式1:永久性方式
修改 my.cnf 或者 my.ini 文件,把 [mysqld] 组下的general_log
值设置为OFF
或者把 general_log
一项注释掉。修改保存后,再重启MySQL服务
,即可生效
举例:
[mysqld]
general_log = OFF
# 或
[mysqld]
#general_log = ON
方式2:临时性方式
使用 SET 语句停止 MySQL 通用查询日志功能:
SET GLOBAL general_log = off;
查询通用日志功能:
SHOW VARIABLES LIKE 'general_log%';
3.5 删除 / 刷新日志
如果数据的使用非常频繁,那么通用查询日志会占用服务器非常大的磁盘空间。数据管理员可以删除很长时间之前的查询日志,以保证 MySQL 服务器上的硬盘空间
手动删除文件
SHOW VARIABLES LIKE 'general_log%';
mysql> SHOW VARIABLES LIKE 'general_log%';
+------------------+---------------------------+
| Variable_name | Value |
+------------------+---------------------------+
| general_log | ON |
| general_log_file | /var/lib/mysql/centos.log |
+------------------+---------------------------+
2 rows in set (0.06 sec)
可以看出,通用查询日志的目录默认为 MySQL 数据目录。在该目录下手动删除通用查询日志 centos.log
使用如下命令重新生成查询日志文件,具体命令如下。刷新 MySQL 数据目录,发现创建了新的日志文件。前提一定要开启通用日志
mysqladmin -uroot -p flush-logs
如果希望备份旧的通用查询日志,就必须先将旧的日志文件复制出来或者改名,然后执行上面的 mysqladmin 命令。正确流程如下:
cd mysql-data-directory # 输入自己的通用日志文件所在目录
mv mysql.general.log mysql.general.log.old # 指定旧的文件名以及新的文件名
mysqladmin -uroot -p flush-logs
4. 错误日志(error log)
错误日志记录了 MySQL 服务器启动、停止运行的时间,以及系统启动、运行和停止过程中的诊断信息,包括错误
、警告
和提示
等
通过错误日志可以查看系统的运行状态,便于即时发现故障、修复故障。如果 MySQL 服务出现异常
,错误日志是发现问题、解决故障的首选
4.1 启动日志
在 MySQL 数据库中,错误日志功能是默认开启
的。而且,错误日志无法被禁止
默认情况下,错误日志存储在 MySQL 数据库的数据文件夹下,名称默认为mysqld.log
(Linux系统)或hostname.err
(mac系统)。如果需要制定文件名,则需要在 my.cnf 或者 my.ini 中做如下配置:
[mysqld]
log-error = [path/[filename]] #path为日志文件所在的目录路径,filename为日志文件名
修改配置项后,需要重启 MySQL 服务以生效
4.2 查看日志
MySQL 错误日志是以文本文件形式存储的,可以使用文本编辑器直接查看
查询错误日志的存储路径:
mysql> SHOW VARIABLES LIKE 'log_err%';
+----------------------------+----------------------------------------+
| Variable_name | Value |
+----------------------------+----------------------------------------+
| log_error | /var/log/mysqld.log |
| log_error_services | log_filter_internal; log_sink_internal |
| log_error_suppression_list | |
| log_error_verbosity | 2 |
+----------------------------+----------------------------------------+
4 rows in set (0.00 sec)
执行结果中可以看到错误日志文件是 mysqld.log,位于 MySQL 默认的数据目录下
下面我们查看一下错误日志的内容:
2023-04-14T08:15:40.034508Z 0 [System] [MY-013169] [Server] /usr/sbin/mysqld (mysqld 8.0.32) initializing of server in progress as process 9194
2023-04-14T08:15:40.066172Z 1 [System] [MY-013576] [InnoDB] InnoDB initialization has started.
2023-04-14T08:15:40.530200Z 1 [System] [MY-013577] [InnoDB] InnoDB initialization has ended.
2023-04-14T08:15:41.679367Z 6 [Note] [MY-010454] [Server] A temporary password is generated for root@localhost: et+QcZP?r5SS
2023-04-14T08:15:45.058179Z 0 [System] [MY-010116] [Server] /usr/sbin/mysqld (mysqld 8.0.32) starting as process 9248
可以看到,错误日志文件中记录了服务器启动的时间,以及存储引擎 InnoDB 启动和停止的时间等。我们在做初始化时候生成的数据库初始密码也是记录在 error log 中
4.3 删除 / 刷新日志
对于很久以前的错误日志,数据库管理员查看这些错误日志的可能性不大,可以将这些错误日志删除,以保证 MySQL 服务器上的硬盘空间
。MySQL的错误日志是以文本文件的形式存储在文件系统中的,可以直接删除
-
第一步(方式1):删除操作
rm -f /var/lib/mysql/mysqld.log
在运行状态下删除错误日志文件后,MySQL 并不会自动创建日志文件
-
第一步(方式2):重命名文件
mv /var/log/mysqld.log /var/log/mysqld.log.old
-
第二步:重建日志
mysqladmin -uroot -p flush-logs
可能会报错
[root@centos log]# mysqladmin -uroot -p flush-logs Enter password: mysqladmin: refresh failed; error: 'Could not open file' /var/log/mysqld.log 'for error logging.'
官网提示:
补充操作:
install -omysql -gmysql -m0644 /dev/null /var/log/mysqld.log
f1ush-1ogs
指令操作:
- MySQL 5.5.7 以前的版本,flush-logs 将错误日志文件重命名为 filename.err_old,并创建新的日志文件
- 从 MySQL 5.5.7 开始,flush-logs 只是重新打开日志文件,并不做日志备份和创建的操作
- 如果日志文件不存在,MySQL 启动或者执行 flush-logs 时会自动创建新的日志文件。重新创建错误日志,大小为 0 字节
小结:
通常情况下,管理员不需要查看错误日志。但是,MySQL 服务器发生异常时,管理员可以从错误日志中找到发生异常的时间、原因,然后根据这些信息来解决异常
5. 二进制日志(bin log)
bin log
可以说是 MySQL 中比较重要
的日志了,在日常开发及运维过程中,经常会遇到
bin log
即 binary log,二进制日志文件,也叫作变更日志(update log)。它记录了数据库所有执行的DDL
和DML
等数据库更新事件的语句,但是不包含没有修改任何数据的语句(如数据查询语句 select、 show 等)
它以事件形式
记录并保存在二进制文件
中。通过这些信息,我们可以再现数据更新操作的全过程
如果想要记录所有语句(例如,为了识别有问题的查询),需要使用通用查询日志
bin log
主要应用场景:
- 一是用于
数据恢复
,如果 MySQL 数据库意外停止,可以通过二进制日志文件来查看用户执行了哪些操作,对数据库服务器文件做了哪些修改,然后根据二进制日志文件中的记录来恢复数据库服务器 - 二是用于
数据复制
,由于日志的延续性和时效性,master 把它的二进制日志传递给 slaves 来达到 master-slave 数据一致的目的
可以说 MySQL 数据库的数据备份、主备、主主、主从都离不开bin log
,需要依靠bin log
来同步数据,保证数据一致性
5.1 查看默认情况
查看记录二进制日志是否开启:在 MySQL 8 中默认情况下,二进制文件是开启的
mysql> show variables like '%log_bin%';
+---------------------------------+-----------------------------+
| Variable_name | Value |
+---------------------------------+-----------------------------+
| log_bin | ON |
| log_bin_basename | /var/lib/mysql/binlog |
| log_bin_index | /var/lib/mysql/binlog.index |
| log_bin_trust_function_creators | OFF |
| log_bin_use_v1_row_events | OFF |
| sql_log_bin | ON |
+---------------------------------+-----------------------------+
6 rows in set (0.05 sec)
log_bin_basename
:是bin log
日志的基本文件名,后面会追加标识来表示每一个文件log_bin_index
:是bin log
文件的索引文件,这个文件管理了所有的bin log
文件的目录log_bin_trust_function_creators
:限制存储过程,前面我们已经讲过了,这是因为二进制日志的一个重要功能是用于主从复制,而存储函数有可能号致主从的数据不一致。所以当开启二进制日志后,需要限制存储函数的创建、修改、调用log_bin_use_v1_row_events
:此只读系统变量已弃用。ON 表示使用版本1二进制日志行,OFF 表示使用版本2二进制日志行(MySQL 5.6 的默认值为 2)
5.2 日志参数设置
方式1:永久性方式
修改 MySQL 的my.cnf
或my.ini
文件可以设置二进制日志的相关参数:
[mysqld]
# 启用二进制日志
log-bin = centos-bin
binlog_expire_logs_seconds = 600
max_binlog_size = 100M
提示:
log-bin = mysql--bin
:打开日志(主机需要打开),这个 mysql--bin 也可以自定义,这里也可以加上路径,如:/home/www/mysql_bin_log/mysql-bin
binlog_expire_logs_seconds
:此参数控制二进制日志文件保留的时长,单位是秒
,默认2592000 30天;14400 4小时;86400 1天;259200 3天
max_binlog_size
:控制单个二进制日志大小,当前日志文件大小超过此变量时,执行切换动作。此参数的最大和默认值是 1GB
,该设置并不能严格控制 bin log 的大小
,尤其是bin log
比较靠近最大值而又遇到个比较大事务时,为了保证事务的完整性,可能不做切换日志的动作,只能将该事务的所有 SQL 都记录进当前日志,直到事务结束。一般情况下可采取默认值
重新启动 MySQL 服务,查询二进制日志的信息,执行结果:
mysql> show variables like '%log_bin%';
+---------------------------------+----------------------------------+
| Variable_name | Value |
+---------------------------------+----------------------------------+
| log_bin | ON |
| log_bin_basename | /var/lib/mysql/centos-bin |
| log_bin_index | /var/lib/mysql/centos-bin.index |
| log_bin_trust_function_creators | OFF |
| log_bin_use_v1_row_events | OFF |
| sql_log_bin | ON |
+---------------------------------+----------------------------------+
6 rows in set (0.00 sec)
设置带文件夹的 bin-log 日志存放目录
如果想改变日志文件的目录和名称,可以对 my.cnf
或 my.ini
中的 log_bin 参数修改如下:
[mysqld]
log-bin = "/var/lib/mysql/binlog/centos-bin"
注意:新建的文件夹需要使用 MySQL 用户,使用下面的命令即可
chown -R -v mysql:mysql binlog
重启 MySQL 服务之后,新的二进制日志文件将出现在 var/lib/mysql/binlog/ 文件夹下面
提示
数据库文件最好不要与日志文件放在同一个磁盘上
!这样,当数据库文件所在的磁盘发生故障时,可以使用日志文件恢复数据
方式2:临时性方式
如果不希望通过修改配置文件并重启的方式设置二进制日志的话,还可以使用如下指令,需要注意的是在 MySQL 8 中只有会话级别
的设置,没有了global 级别的设置
# global 级别
mysql> set global sql_log_bin = 0;
ERROR 1228 (HY000): Variable 'sql_log_bin' is a SESSION variable and can`t be used
with SET GLOBAL
# session 级别
mysql> SET sql_log_bin = 0;
Query OK, 0 rows affected (0.01 秒)
5.3 查看日志
当 MySQL 创建二进制日志文件时,先创建一个以“filename”为名称、以“.index”为后缀的文件,再创建一个以“filename”为名称、以“.000001”为后缀的文件
MySQL 服务重新启动一次
,以“.000001”为后缀的文件就会增加一个,并且后缀名按1递增。即日志文件的个数与 MySQL 服务启动的次数相同;如果日志长度超过了max_binlog_size
的上限(默认是1GB),就会创建一个新的日志文件
查看当前的二进制日志文件列表及大小。指令如下:
mysql> SHOW BINARY LOGS;
+--------------------+-----------+-----------+
| Log_name | File_size | Encrypted |
+--------------------+-----------+-----------+
| centos-bin.000001 | 156 | No |
+--------------------+-----------+-----------+
1 rows in set (0.02 sec)
所有对数据库的修改都会记录在 bin log
中。但 bin log
是二进制文件,无法直接查看,想要更直观的观测它就要借助 mysqlbinlog
命令工具了。关于 mysqlbinlog
工具的使用技巧还有很多,例如只解析对某个库的操作或者某个时间段内的操作等。简单分享几个常用的语句,更多操作可以参考官方文档
# 可查看参数帮助
mysqlbinlog --no-defaults --help
# 查看最后100行
mysqlbinlog --no-defaults --base64-output=decode-rows -vv centos-bin.000001 |tail -100
# 根据position查找
mysqlbinlog --no-defaults --base64-output=decode-rows -vv centos-bin.000001 |grep -A 20 '4939002'
上面这种办法读取出 bin log
日志的全文内容比较多,不容易分辨查看到 pos 点信息,下面介绍一种更为方便的查询命令:
mysql> show binlog events [IN 'log_name'] [FROM pos] [LIMIT [offset,] row_count];
IN 'log_name'
:指定要查询的bin log
文件名(不指定就是第一个bin log
文件)FROM pos
:指定从哪个 pos 起始点开始查起(不指定就是从整个文件首个 pos 点开始算)LIMIT [offset]
:偏移量(不指定就是 0)row_count
:查询总条数(不指定就是所有行)
上面我们讲了这么多都是基于 bin log
的默认格式,bin log
格式查看:
mysql> show variables like 'binlog_format';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| binlog_format | ROW |
+---------------+-------+
1 row in set (0.01 sec)
除此之外,bin log
还有 2 种格式,分别是Statement
和Mixed
-
Statement
每一条会修改数据的 SQL 都会记录在
bin log
中优点:不需要记录每一行的变化,减少了
bin log
日志量,节约了 IO,提高性能 -
Row
5.1.5 版本的 MySQL 才开始支持
row level
的复制,它不记录 SQL 语句上下文相关信息,仅保存哪条记录被修改优点:
row level
的日志内容会非常清楚的记录下每一行数据修改的细节。而且不会出现某些特定情况下的存储过程,或 function,以及trigger 的调用和触发无法被正确复制的问题 -
Mixed
从 5.1.8 版本开始,MySQL 提供了
Mixed
格式,实际上就是 Statement 与 Row 的结合
5.4 使用日志恢复数据
如果 MySQL 服务器启用了二进制日志,在数据库出现意外丢失数据时,可以使用 mysqlbinlog
工具从指定的时间点开始(例如,最后一次备份)直到现在或另一个指定的时间点的日志中恢复数据
mysqlbinlog
恢复数据的语法如下:
mysqlbinlog [option] filename|mysql –uuser -ppass;
这个命令可以这样理解:使用 mysqlbinlog
命令来读取 filename 中的内容,然后使用 MySQL 命令将这些内容恢复到数据库中
-
filename
:是日志文件名 -
option
:可选项,比较重要的两对 option 参数是 --start-date、--stop-date 和 --start-position、-- stop-position--start-date
和--stop-date
:可以指定恢复数据库的起始时间点和结束时间点--start-position
和--stop-position
:可以指定恢复数据的开始位置和结束位置
注意:使用
mysqlbinlog
命令进行恢复操作时,必须是编号小的先恢复,例如centos-bin.000001必须在centos-bin.000002之前恢复
5.5 删除二进制日志
MySQL 的二进制文件可以配置自动删除,同时 MySQL 也提供了安全的手动删除二进制文件的方法。PURGE MASTER LOGS
只删除指定部分的二进制日志文件,RESET MASTER
删除所有的二进制日志文件。具体如下:
1. PURGE MASTER LOGS:删除指定日志文件
PURGE MASTER LOGS
语法如下:
PURGE {MASTER | BINARY} LOGS TO ‘指定日志文件名’
PURGE {MASTER | BINARY} LOGS BEFORE ‘指定日期’
2. RESET MASTER: 删除所有二进制日志文件
使用 RESET MASTER
语句,清空所有的bin log
日志。MySQL 会重新创建二进制文件,新的日志文件扩展名将重新从000001开始编号。慎用
!
5.6 其它场景
二进制日志可以通过数据库的全量备份
和二进制日志中保存的增量信息
,完成数据库的无损失恢复
。 但是,如果遇到数据量大、数据库和数据表很多(比如分库分表的应用)的场景,用二进制日志进行数据恢复,是很有挑战性的,因为起止位置不容易管理
在这种情况下,一个有效的解决办法是配置主从数据库服务器
,甚至是一主多从
的架构,把二进制日志文件的内容通过中继日志,同步到从数据库服务器中,这样就可以有效避免数据库故障导致的数据异常等问题
6. 再谈二进制日志(bin log)
6.1 写入机制
bin log
的写入时机也非常简单,事务执行过程中,先把日志写到 binlog cache
,事务提交的时候,再把 binlog cache
写到 binlog
文件中。因为一个事务的 binlog
不能被拆开,无论这个事务多大,也要确保一次性写入,所以系统会给每个线程分配一个块内存作为 binlog cache
我们可以通过 binlog_cache_size
参数控制单个线程 binlog cache
大小,如果存储内容超过了这个参数,就要暂存到磁盘(Swap)。binlog
日志刷盘流程如下:
- 上图的 write,是指把日志写入到文件系统的 page cache,并没有把数据持久化到磁盘,所以速度比较快
- 上图的 fsync,才是将数据持久化到磁盘的操作
write 和 fsync 的时机,可以由参数 sync_binlog
控制,默认是 0
。为 0 的时候,表示每次提交事务都只 write,由系统自行判断什么时候执行 fsync。虽然性能得到提升,但是机器宕机,page cache 里面的 binglog 会丢失。如下图:
为了安全起见,可以设置为 1
,表示每次提交事务都会执行 fsync,就如同redo log
刷盘流程一样。最后还有一种折中方式,可以设置为N(N>1),表示每次提交事务都 write,但累积 N 个事务后才 fsync
在出现 IO 瓶颈的场景里,将 sync_binlog
设置成一个比较大的值,可以提升性能。同样的,如果机器宕机,会丢失最近N个事务的binlog
日志
6.2 bin log 与 redo log 对比
bin log
(二进制日志)和 redo log
(重做日志)都是数据库中用于记录数据变更的日志系统,但它们的用途、结构和工作方式有所不同。以下是它们之间的主要对比:
- 用途:
bin log
:主要用于 MySQL 的主从复制和数据恢复。当主服务器上的数据发生变化时,这些变化会被记录到bin log
中,然后从服务器可以读取并应用这些变化,以保持与主服务器的数据同步redo log
:主要用于 InnoDB 存储引擎的事务恢复。当事务发生时,数据的变化首先被记录到redo log
中,然后在适当的时机(如事务提交时)再被应用到实际的数据文件中
- 结构:
bin log
:是一个逻辑日志
,记录了数据库中发生的所有数据变更事件,如 INSERT、UPDATE、DELETE 等redo log
:是一个物理日志
,记录了对数据块的物理变更,如某个数据块从旧值变为新值
- 日志格式:
bin log
:可以有多种格式,如 ROW、STATEMENT 和 MIXEDredo log
:通常是固定大小的循环日志文件
- 持久性:
bin log
:只要事件发生,就会被追加到日志中,即使事务最终被回滚redo log
:只记录已提交的事务的变更
- 日志大小:
bin log
:可以无限增长,直到磁盘空间用完或被手动清理redo log
:大小是固定的,当日志满了之后,旧的日志会被覆盖
- 使用场景:
bin log
:除了主从复制和数据恢复外,还可以用于审计和增量备份redo log
:主要用于确保事务的 ACID 属性,特别是持久性
总的来说,bin log
和 redo log
都是为了确保数据的安全和一致性而设计的,但它们的工作方式和用途有所不同。bin log
更多地关注于数据的复制和恢复,而 redo log
更多地关注于事务的持久性
6.3 两阶段提交
在执行更新语句过程,会记录 redo log
与 bin log
两块日志,以基本的事务为单位,redo log
在事务执行过程中可以不断写入,而bin log
只有在提交事务时才写入,所以 redo log
与 bin log
的 写入时机
不一样
redo log
与 bin log
两份日志之间的逻辑不一致,会出现什么问题?
以 UPDATE 语句为例,假设id = 2
的记录,字段c
值是0
,把字段c
值更新为1
,SQL 语句为 update T set c = 1 where id = 2
假设执行过程中写完 redo log
日志后,bin log
日志写期间发生了异常,会出现什么情况呢?
由于 bin log
没写完就异常,这时候 bin log
里面没有对应的修改记录。因此,之后用 bin log
日志恢复数据时,就会少这一次更新,恢复出来的这一行c
值为0
,而原库因为 redo log
日志恢复,这一行c
的值是1
,最终数据不一致
为了解决两份日志之间的逻辑一致问题,InnoDB 存储引擎使用两阶段提交方案。原理很简单,将 redo log
的写入拆成了两个步骤 prepare 和commit,这就是两阶段提交
使用两阶段提交后,写入 bin log
时发生异常也不会有影响,因为 MySQL 根据 redo log
日志恢复数据时,发现 redo log
还处于prepare 阶段,并且没有对应 bin log
日志,就会回滚该事务
另一个场景,redo log
设置 commit 阶段发生异常,那会不会回滚事务呢?
并不会回滚事务,它会执行上图框住的逻辑,虽然 redo log
是处于 prepare 阶段,但是能通过事务id找到对应的 bin log
日志,所以 MySQL 认为是完整的,就会提交事务恢复数据
7. 中继日志(relay log)
7.1 介绍
中继日志只在主从服务器架构的从服务器上存在。从服务器为了与主服务器保持一致,要从主服务器读取二进制日志的内容,并且把读取到的信息写入 本地的日志文件
中,这个从服务器本地的日志文件就叫中继日志
。然后,从服务器读取中继日志,并根据中继日志的内容对从服务器的数据进行更新,完成主从服务器的数据同步
搭建好主从服务器之后,中继日志默认会保存在从服务器的数据目录下
文件名的格式是:从服务器名-relay-bin.序号
。中继日志还有一个索引文件:从服务器名-relaybin.index
,用来定位当前正在使用的中继日志
7.2 查看中继日志
中继日志与二进制日志的格式相同,可以用 mysqlbinlog
工具进行查看。下面是中继日志的一个片段:
SET TIMESTAMP=1618558728/*!*/;
BEGIN
/*!*/;
# at 950
#210416 15:38:48 server id 1 end_log_pos 832 CRC32 0xcc16d651 Table_map:
`centos`.`test` mapped to number 91
# at 1000
#210416 15:38:48 server id 1 end_log_pos 872 CRC32 0x07e4047c Delete_rows: table id
91 flags: STMT_END_F -- server id 1 是主服务器,意思是主服务器删了一行数据
BINLOG '
CD95YBMBAAAAMgAAAEADAAAAAFsAAAAAAAEABGRlbW8ABHRlc3QAAQMAAQEBAFHWFsw=
CD95YCABAAAAKAAAAGgDAAAAAFsAAAAAAAEAAgAB/wABAAAAfATkBw==
'/*!*/;
# at 1040
这一段的意思是,主服务器(“server id 1”)对表 centos.test 进行了 2 步操作:
定位到表 centos.test 编号是 91 的记录,日志位置是 832;
删除编号是 91 的记录,日志位置是 872
7.3 恢复的典型错误
如果从服务器宕机,有的时候为了系统恢复,要重装操作系统,这样就可能会导致你的服务器名称
与之前不同
。而中继日志里是包含从服务器名
的。在这种情况下,就可能导致你恢复从服务器的时候,无法从宕机前的中继日志里读取数据,以为是日志文件损坏了,其实是名称不对了
解决的方法也很简单,把从服务器的名称改回之前的名称