你好,我是朱晓峰。

我们曾经开发过一个数据库应用系统,但是却突然遭遇了数据库宕机。在这种情况下,定位宕机的原因就非常关键,毕竟,知道了问题,才能确定解决方案。

这时,我们就想到了查看数据库的错误日志,因为日志中记录了数据库运行中的诊断信息,包括了错误、警告和注释等信息。从日志中,我们发现,原来某个连接中的SQL操作发生了死循环,导致内存不足,被系统强行终止了。知道了原因,处理起来也就比较轻松了,系统很快就恢复了运行。

除了发现错误,日志在数据复制、数据恢复、操作审计,以及确保数据的永久性和一致性等方面,都有着不可替代的作用,对提升你的数据库应用的开发能力至关重要。

今天,我就结合超市项目的实际案例,给你讲解一下怎么通过查看系统日志,来了解数据库中实际发生了什么,从而快速定位原因。

MySQL的日志种类非常多,包括通用查询日志、慢查询日志、错误日志、二进制日志、中继日志、重做日志和回滚日志,内容比较多,而且都很重要,所以我们来花两节课的时间学习一下。

这节课,我会先具体讲一讲通用查询日志、慢查询日志和错误日志。

通用查询日志

通用查询日志记录了所有用户的连接开始时间和截止时间,以及发给MySQL数据库服务器的所有SQL指令。当我们的数据发生异常时,开启通用查询日志,还原操作时的具体场景,可以帮助我们准确定位问题。

举个小例子,在超市项目实施的过程中,我们曾遇到过这样一件事:超市经营者月底查账的时候发现,超市的1号门店在12月1日销售了5件化妆品,但是当天对应的历史库存并没有减少。化妆品的金额都比较大,库存不对的话,会在报表查询中产生巨额差异,触发到报警机制,对超市经营者的决策产生影响。超市经营者找到我们,对系统的可靠性提出质疑。

我们对系统进行了仔细检查,没有发现数据问题。可是商品确实卖出去了,当天的历史库存也确实没有消减。这个时候,我们想到了检查通用查询日志,看看当天到底发生了什么。

查看之后,我们就复原了当天的情况:12月1日下午,门店的收银台销售了5件化妆品,但是由于网络故障,流水没有及时上传到总部。12月1日晚上11:59,总部的历史库存被保存下来,但是因为没有收到门店的流水,所以没有消减库存。12月2日上午,门店的网络恢复了,流水得以上传总部,这个时候,对应化妆品的库存才被消减掉。

这样,我们就确定了故障的原因,也就是超市的网络问题,而系统本身是没有问题的。

你看,通用查询日志可以帮助我们了解操作发生的具体时间和操作的细节,对找出异常发生的原因极其关键。

下面我来具体介绍一下控制通用查询日志的系统变量。通过这些变量,你会清楚怎么控制通用查询日志的开启和关闭,以及保存日志的文件是哪个。

mysql> SHOW VARIABLES LIKE '%general%';
+------------------+---------------+
| Variable_name | Value |
+------------------+---------------+
| general_log | OFF | -- 通用查询日志处于关闭状态
| general_log_file | GJTECH-PC.log | -- 通用查询日志文件的名称是GJTECH-PC.log
+------------------+---------------+
2 rows in set, 1 warning (0.00 sec)

在这个查询的结果中,有2点需要我们注意一下。

  1. 系统变量general_log的值是OFF,表示通用查询日志处于关闭状态。在MySQL中,这个参数的默认值是关闭的。因为一旦开启记录通用查询日志,MySQL会记录所有的连接起止和相关的SQL操作,这样会消耗系统资源并且占用磁盘空间。我们可以通过手动修改变量的值,在需要的时候开启日志。
  2. 通用查询日志文件的名称是GJTECH-PC.log。这样我们就知道在哪里可以查看通用查询日志的内容了。

下面我们来看看如何开启通用查询日志,把所有连接的起止和连接的SQL操作都记录下来。这个操作可以帮助我们追踪SQL操作故障的原因。

开启通用查询日志

我们可以通过设置系统变量的值,来开启通用查询日志,并且指定通用查询日志的文件夹和文件名为“H:\mytest.log”。这个操作如下:

mysql> SET GLOBAL general_log = 'ON';
Query OK, 0 rows affected (0.00 sec)
 
mysql> SET @@global.general_log_file = 'H:\mytest.log';
Query OK, 0 rows affected (0.02 sec)

为了确认我们的设定是否已经生效,我们再来查询一下通用查询日志的状态:

mysql> SHOW VARIABLES LIKE '%general%';
+------------------+--------------+
| Variable_name | Value |
+------------------+--------------+
| general_log | ON | -- 通用查询日志开启
| general_log_file | H:mytest.log |  -- 日志名称也改过了
+------------------+--------------+
2 rows in set, 1 warning (0.00 sec)

结果显示,通用查询日志已经开启,文件是“H:\mytest.log”,这就意味着我们的操作成功了。

查看通用查询日志

通用查询日志都是文本型数据,可以用记事本打开。下面我们就用记事本打开我电脑上的通用查询日志,实际看一看通用查询日志的内容,包括都有哪些连接,什么时候登录了数据库,都做了哪些操作等信息。

2021-04-05T06:39:53.621980Z 28 Connect zhangsan@localhost on using SSL/TLS   -- 账号zhangsan从本地登录
2021-04-05T06:39:53.622085Z 28 Connect Access denied for user 'zhangsan'@'localhost' (using password: NO)  -- 没有使用密码,连接被拒绝了
2021-04-05T06:40:02.522303Z 29 Connect zhangsan@localhost on using SSL/TLS
2021-04-05T06:40:02.522913Z 29 Query select @@version_comment limit 1
2021-04-05T06:40:14.211511Z 29 Query SELECT *
FROM demo.invcount                         -- 查询数据表demo.invcount内容
2021-04-05T06:40:37.647625Z 29 Query UPDATE demo.invcount
SET plquant = - 5                          -- 更新数据表demo.invcount
WHERE itemnumber = 1
2021-04-05T06:41:15.047067Z 29 Query SELECT *
FROM demo.goodsmaster                      -- 查询数据表demo.goodsmaster

在通用查询日志里面,我们可以清楚地看到,账号“zhangsan”是什么时间登录的服务器,登录之后做了什么SQL操作,针对的是哪个数据表等信息。

删除通用查询日志

当用户对数据库的操作比较频繁时,通用查询日志文件会不断变大。为了节省磁盘空间,我们可以移除旧的日志文件,创建新的日志文件,来对通用查询日志文件进行维护。

第一步,关闭通用查询日志:

mysql> SET GLOBAL general_log = 'OFF'; -- 关闭通用查询日志
Query OK, 0 rows affected (0.01 sec)
 
mysql> SHOW VARIABLES LIKE '%general_log%'; -- 查看通用查询日志状态
+------------------+--------------+
| Variable_name | Value |
+------------------+--------------+
| general_log | OFF |
| general_log_file | H:mytest.log |
+------------------+--------------+
2 rows in set, 1 warning (0.00 sec)

第二步,把通用查询日志文件“H:\mytest.log”移至备份文件夹,空出磁盘H的空间。

第三步,开启通用查询日志:

mysql> SET GLOBAL general_log = 'ON';
Query OK, 0 rows affected (0.01 sec)
 
mysql> SHOW VARIABLES LIKE '%general_log%';
+------------------+--------------+
| Variable_name | Value |
+------------------+--------------+
| general_log | ON |
| general_log_file | H:mytest.log |
+------------------+--------------+
2 rows in set, 1 warning (0.00 sec)

这个时候,你会发现,MySQL已经给我们准备好了一个新的通用查询日志文件“H:\mytest.log”,并且记录了我们第一个查询的语句:“SHOW VARIABLES LIKE '%general_log%';”。

文件内容如下:

C:\Program Files\MySQL\MySQL Server 8.0\bin\mysqld.exe, Version: 8.0.23 (MySQL Community Server - GPL). started with:
TCP Port: 3306, Named Pipe: MySQL
Time Id Command Argument
2021-04-05T07:02:03.007394Z 30 Query SHOW VARIABLES LIKE '%general_log%'

总之,开启了通用查询日志之后,如果遇到用户对数据产生质疑的情况,我们就可以通过查看通用查询日志,还原当时的场景,快速定位并解决问题。

慢查询日志

慢查询日志用来记录执行时间超过指定时长的查询。它的主要作用是,帮助我们发现那些执行时间特别长的SQL查询,并且有针对性地进行优化,从而提高系统的整体效率。当我们的数据库服务器发生阻塞、运行变慢的时候,检查一下慢查询日志,找到那些慢查询,对解决问题很有帮助。

慢查询日志是由MySQL的配置文件进行控制的。下面我先简单介绍一下MySQL的配置文件。

在MySQL的安装目录中(C:\ProgramData\MySQL\MySQL Server 8.0),我们可以找到MySQL的配置文件“my.ini”。这个文件是一个文本格式的文件,可以直接用记事本打开来阅读。

我们来看看配置文件中关于慢查询日志变量的相关设定:

slow-query-log=1 -- 表示开启慢查询日志,系统将会对慢查询进行记录。
 
slow_query_log_file="GJTECH-PC-slow.log"  -- 表示慢查询日志的名称是"GJTECH-PC-slow.log"。这里没有指定文件夹,默认就是数据目录:"C:\ProgramData\MySQL\MySQL Server 8.0\Data"。
 
long_query_time=10  -- 表示慢查询的标准是查询执行时间超过10秒

除了刚刚的这些变量,控制慢查询日志的还有一个系统变量:min_examined_row_limit。这个变量的意思是,查询扫描过的最少记录数。这个变量和查询执行时间,共同组成了判别一个查询是否是慢查询的条件。如果查询扫描过的记录数大于等于这个变量的值,并且查询执行时间超过long_query_time的值,那么,这个查询就被记录到慢查询日志中;反之,则不被记录到慢查询日志中。

如果要查看当前这个系统变量的值,我们就可以用下面的代码:

mysql> show variables like 'min%';
+------------------------+-------+
| Variable_name | Value |
+------------------------+-------+
| min_examined_row_limit | 0 |
+------------------------+-------+
1 row in set, 1 warning (0.00 sec)

这个值默认是0。与long_query_time=10合在一起,表示只要查询的执行时间超过10秒钟,哪怕一个记录也没有扫描过,都要被记录到慢查询日志中。你也可以根据需要,通过修改“my.ini”文件,来修改查询时长,或者通过SET指令,用SQL语句修改“min_examined_row_limit”的值。

只是你要注意,如果修改了MySQL的配置文件“my.ini”,就需要重启服务器,这样才能使修改生效。

来看一个例子:之前我运行的一个慢查询,被记录到了慢查询日志中。这个例子记录了一个运行时间超过10秒的慢查询的发生时间、连接所属的用户、执行的时长、锁表的时长和扫描过的记录数等相关信息。

C:\Program Files\MySQL\MySQL Server 8.0\bin\mysqld.exe, Version: 8.0.23 (MySQL Community Server - GPL). started with:
TCP Port: 3306, Named Pipe: MySQL
Time Id Command Argument
# Time: 2021-03-25T07:20:33.412260Z     -- 执行开始时间
# User@Host: root[root] @ localhost [::1] Id: 13   -- 用户
# Query_time: 10.166435 Lock_time: 0.000000 Rows_sent: 0  Rows_examined: 0                        -- 执行时长、锁表时长、检查的记录数
use demo;
SET timestamp=1616656823;

通过这个慢查询日志的记录,我们就可以发现是哪个查询消耗了大量的系统资源,是哪个连接里面的查询,具体什么时间开始的。有了这些信息,我们就可以对慢查询进行分析,决定优化的方式,避免出现同样的问题。

好了,到这里,通用查询日志和慢查询日志我就讲完了,咱们最后再来学习一种重要的日志:错误日志。

错误日志

错误日志记录了MySQL服务器启动、停止运行的时间,以及系统启动、运行和停止过程中的诊断信息,包括错误、警告和提示等。当我们的数据库服务器发生系统故障时,错误日志是发现问题、解决故障的首选。

错误日志默认是开启的。我们可以在MySQL的配置文件“my.ini”中配置它:

# Error Logging.
log-error="GJTECH-PC.err"

这段代码指定了错误日志的文件名。如果没有指定文件夹,默认就是数据目录:“C:\ProgramData\MySQL\MySQL Server 8.0\Data”。

下面我们查看一下错误日志的内容:

2021-02-28T08:07:07.228880Z 0 [System] [MY-010116] [Server] C:\Program Files\MySQL\MySQL Server 8.0\bin\mysqld.exe (mysqld 8.0.23) starting as process 7652
2021-02-28T08:07:07.270982Z 1 [System] [MY-013576] [InnoDB] InnoDB initialization has started.
2021-02-28T08:07:08.116433Z 1 [System] [MY-013577] [InnoDB] InnoDB initialization has ended.

可以看到,错误日志文件中记录了服务器启动的时间,以及存储引擎InnoDB启动和停止的时间等。

总结

今天这节课,我们学习了通用查询日志、慢查询日志和错误日志。

最后,我还是想提醒你一句,千万不要小看日志。很多看似奇怪的问题,答案往往就藏在日志里。很多情况下,只有通过查看日志才能发现问题的原因,真正解决问题。所以,一定要学会查看日志,养成检查日志的习惯。

思考题

请你思考一下:怎么设置开启慢查询日志,并且把慢查询日志的指定时长设置为5秒,最少扫描记录数为1?

欢迎在留言区写下你的思考和答案,我们一起交流讨论。如果你觉得今天的内容对你有所帮助,也欢迎你分享给你的朋友或同事,我们下节课见。

评论