MySQL8事务篇1-事务的基本知识

站长

2023年09月24日 13:18 · 阅读数 149

1. 数据库事务概述

1.1 存储引擎支持情况

SHOW ENGINES 命令来查看当前 MySQL 支持的存储引擎都有哪些，以及这些存储引擎是否支持事务。

MySQL8事务篇1-事务的基本知识

能看出在 MySQL 中，只有InnoDB 是支持事务的。

1.2 基本概念

事务： 一组逻辑操作单元，使数据从一种状态变换到另一种状态。

事务处理的原则： 保证所有事务都作为 一个工作单元 来执行，即使出现了故障，都不能改变这种执行方式。当在一个事务中执行多个操作时，要么所有的事务都被提交(commit)，那么这些修改就 永久 地保存下来；要么数据库管理系统将 放弃 所作的所有修改，整个事务回滚( rollback )到最初状态。

1.3、事务的ACID特性

原子性（atomicity）

原子性是指事务是一个不可分割的工作单位，要么全部提交，要么全部失败回滚。即要么转账成功，要么转账失败，是不存在中间的状态。如果无法保证原子性会怎么样？就会出现数据不一致的情形，A账户减去100元，而B账户增加100元操作失败，系统将无故丢失100元。
一致性（consistency）

(国内很多网站上对一致性的阐述有误，具体你可以参考Wikipedia对Consistency的阐述)

根据定义，一致性是指事务执行前后，数据从一个 合法性状态 变换到另外一个 合法性状态 。这种状态是 语义上 的而不是语法上的，跟具体的业务有关。

那什么是合法的数据状态呢？满足 预定的约束 的状态就叫做合法的状态。通俗一点，这状态是由你自己来定义的（比如满足现实世界中的约束）。满足这个状态，数据就是一致的，不满足这个状态，数据就是不一致的！

如果事务中的某个操作失败了，系统就会自动撤销当前正在执行的事务，返回到事务操作之前的状态。

举例1：A账户有200元，转账300元出去，此时A账户余额为-100元。你自然就发现了此时数据是不一致的，为什么呢？因为你定义了一个状态，余额这列必须>=0。

举例2：A账户200元，转账50元给B账户，A账户的钱扣了，但是B账户因为各种意外，余额并没有增加。你也知道此时数据是不一致的，为什么呢？因为你定义了一个状态，要求A+B的总余额必须不变。

举例3：在数据表中我们将姓名字段设置为唯一性约束，这时当事务进行提交或者事务发生回滚的时候，如果数据表中的姓名不唯一，就破坏了事务的一致性要求。
隔离性（isolation）

事务的隔离性是指一个事务的执行 不能被其他事务干扰，即一个事务内部的操作及使用的数据对 并发 的其他事务是隔离的，并发执行的各个事务之间不能互相干扰。

如果无法保证隔离性会怎么样？假设A账户有200元，B账户0元。A账户往B账户转账两次，每次金额为50元，分别在两个事务中执行。如果无法保证隔离性，会出现下面的情形：
```
UPDATE accounts SET money = money - 50 WHERE NAME = 'AA';
UPDATE accounts SET money = money + 50 WHERE NAME = 'BB';
```
持久性（durability）

持久性是指一个事务一旦被提交，它对数据库中数据的改变就是 永久性的 ，接下来的其他操作和数据库故障不应该对其有任何影响。

持久性是通过 事务日志 来保证的。日志包括了 重做日志 和 回滚日志 。当我们通过事务对数据进行修改的时候，首先会将数据库的变化信息记录到重做日志中，然后再对数据库中对应的行进行修改。

这样做的好处是，即使数据库系统崩溃，数据库重启后也能找到没有更新到数据库系统中的重做日志，重新执行，从而使事务具有持久性。

总结 ACD是事务的四大特性，在这四个特性中，原子性是基础，隔离性是手段，一致性是约束条件，而持特久性是我们的目的。

数据库事务，其实就是数据库设计者为了方便起见，把需要保证原子性、隔离性、一致性和持久性的一个或多个数据库操作称为一个事务。

1.4 事务的状态

我们现在知道 事务 是一个抽象的概念，它其实对应着一个或多个数据库操作，MySQL根据这些操作所执行的不同阶段把 事务 大致划分成几个状态：

活动的（active）事务对应的数据库操作正在执行过程中时，我们就说该事务处在 活动的 状态。
部分提交的（partially committed） 当事务中的最后一个操作执行完成，但由于操作都在内存中执行，所造成的影响并 没有刷新到磁盘时，我们就说该事务处在 部分提交的 状态。
失败的（failed） 当事务处在 活动的 或者 部分提交的 状态时，可能遇到了某些错误（数据库自身的错误、操作系统错误或者直接断电等）而无法继续执行，或者人为的停止当前事务的执行，我们就说该事务处在 失败的 状态。
中止的（aborted） 如果事务执行了一部分而变为 失败的状态，那么就需要把已经修改的事务中的操作还原到事务执行前的状态。换句话说，就是要撤销失败事务对当前数据库造成的影响。我们把这个撤销的过程称之为回滚 。当 回滚 操作执行完毕时，也就是数据库恢复到了执行事务之前的状态，我们就说该事务处在了 中止的 状态。
提交的（committed） 当一个处在 部分提交的 状态的事务将修改过的数据都 同步到磁盘 上之后，我们就可以说该事务处在了提交的状态。

一个基本的状态转换图如下所示：

MySQL8事务篇1-事务的基本知识图中可见，只有当事务处于提交的或者中止的状态时，一个事务的生命周期才算是结束了。对于已经提交的事务来说，该事务对数据库所做的修改将永久生效，对于处于中止状态的事务，该事务对数据库所做的所有修改都会被回滚到没执行该事务之前的状态。

2. 如何使用事务

使用事务有两种方式，分别为显式事务 和 隐式事务 。

2.1 显式事务

步骤1： START TRANSACTION 或者 BEGIN ，作用是显式开启一个事务。

mysql> BEGIN;
#或者
mysql> START TRANSACTION;

START TRANSACTION语句相较于 BEGIN 特别之处在于，后边能跟随几个 修饰符 ：

READ ONLY ：标识当前事务是一个 只读事务 ，也就是属于该事务的数据库操作只能读取数据，而不能修改数据。

补充：只读事务中只是不允许修改那些其他事务也能访问到的表中的数据，对于临时表来说（我们使用CREATE TMEPORARY TABLE创建的表)，由于它们只能在当前会话中可见，所以只读事务其实也是可以对临时表进行增、删、改操作的。
READ WRITE ：标识当前事务是一个 读写事务 ，也就是属于该事务的数据库操作既可以读取数据，也可以修改数据。
WITH CONSISTENT SNAPSHOT ：启动一致性读。

步骤2：一系列事务中的操作（主要是DML，不含DDL）

步骤3：提交事务或中止事务（即回滚事务）

# 提交事务。当提交事务后，对数据库的修改是永久性的。
mysql> COMMIT;

# 回滚事务。即撤销正在进行的所有没有提交的修改
mysql> ROLLBACK;

# 将事务回滚到某个保存点。
mysql> ROLLBACK TO [SAVEPOINT]

其中关于SAVEPOINT相关操作有：

#在事务中创建保存点，方便后续针对保存点进行回滚。一个事务中可以存在多个保存点.
SAVEPOINT 保存点名称；

#刷除某个保存点。
RELEASE SAVEPOINT 保存点名称

2.2 隐式事务

MySQL中有一个系统变量 autocommit：

mysql> SHOW VARIABLES LIKE 'autocommit';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| autocommit    | ON    |
+---------------+-------+
1 row in set (0.01 sec)

当然，如果我们想关闭这种自动提交 的功能，可以使用下边两种方法之一：

显式的的使用START TRANSACTION或者 BEGIN语句开启一个事务。这样在本次事务提交或者回滚前会暂时关闭掉自动提交的功能。
把系统变量autocommit 的值设置为 OFF ，就像这样：

SET autocommit = OFF;
#或
SET autocommit = 0;

我们写入的多条语句就算是属于同一个事务了，知道我们显示的写出COMMIT 语句来把这个事务提交掉，或者显示的写出 ROOLLBACK 语句来把这个事务回滚掉。

补充，Oracle 默认是不自动提交，需要写COMMIT 命令，而MySQL是默认自动提交

2.3 隐式提交数据的情况

数据定义语言（Data definition language，缩写为：DDL）
- 数据库对象，指的就是数据库、表、视图、存储过程等结构。当我们使用CREATE、ALTER、DROP等语句,去修改数据库对象时，就会隐式的提交前边语句所属于的事务。即：
```
BEGIN;
SELECT...  #事务中的一条语句
UPDATE...  #事务中的一条语句
...        #事务中的其它语句

CREATE TABLE,...: #此语句会跑式的提交前边语句所属于的事务
```
隐式使用或修改mysql数据库中的表
- 当我们使用ALTER USER、CREATE USER、DROP USER、GRANT、RENAME USER、REVOKE、SET PASSWORD等语句时也会隐式的提交前边语句所属于的事务。
事务控制或关于锁定的语句
- 当我们在一个事务还没提交或者回滚时就又使用 START TRANSACTION 或者BEGIN 语句开启了另一个事务时，会隐式的提交` 上一个事务。即：
```
BEGIN;
 SELECT.·,#事务中的一条语句
 UPDATE,.,#事务中的一条语句
 ... #事务中的其它语句
 BEGIN:#此语句会隐式的提交前边语句所属于的事务
```
- 当前的 autocommit系统变量的值为 OFF ，我们手动把它调为 ON 时，也会隐式的提交前边语句所属的事务。
- 使用 LOCK TABLES 、 UNLOCK TABLES 等关于锁定的语句也会隐式的提交前边语句所属的事务。
加载数据的语句
- 使用LOAD DATA语句来批量往数据库中导入数据时，也会隐式的提交前边语句所属的事务。
关于MySQL复制的一些语句
- 使用START SLAVE、STOP SLAVE、RESET SLAVE、CHANGE MASTER TO等语句时会隐式的提交前边语句所属的事务。
其它的一些语句
- 使用ANALYZE TABLE、CACHE INDEX、CHECK TABLE、FLUSH、LOAD INDEX INTO CACHE、OPTIMIZE TABLE、REPAIR TABLE、RESET等语句也会隐式的提交前边语句所属的事务。

2.4 举例1：提交和回滚

我们看下在MySQL 的默认状态下，下面的这个事务最后的处理结果是什么？

情况1：

CREATE TABLE user（name varchar（20）, PRIMARY KEY （name）） ENGINE=InnoDB;
BEGIN；
INSERT INTO user SELECT '张一
COMMIT；
BEGIN;
INSERT INTO user SELECT '李四’；
INSERT INTO user SELECT '李四'； ROLLBACK;
SELECT * FROM user；

运行结果（1行数据）：

mysql> commit;
Query OK, 0 rows affected （0.00 秒）
mysql> BEGIN;
Query OK, 0 rows affected （0.00 秒）
mysql> INSERT INTO user SELECT '李四'；
Query OK, 1 rows affected （0.00 秒）
mysql> INSERT INTO user SELECT '李四'； Duplicate entry '李四'for key 'user.PRIMARY mysql> ROLLBACK；
Query OK, 0 rows affected （0.01 秒）
mysql> select * from user;
+------+
| name |
+------+
| 张三  |
+------+
1行于数据集（0.01秒）

情况2：

CREATE TABLE user (name varchar(20), PRIMARY KEY (name)) ENGINE=InnoDB;
BEGIN;
INSERT INTO user SELECT '张二'；
COMMIT；
INSERT INTO user SELECT '李四'；
INSERT INTO user SELECT '李四'； ROLLBACK;
            运行结果(2行数据)：
mysql> SELECT * FROM user;
+------+
I name |
+------+
I张三    I
I李四    I
+------+
2行于数据集(0.01秒)

情况3：

CREATE TABLE user(name varchar(255), PRIMARY KEY (name)) ENGINE=InnoDB;
SET @@completion_type = 1;
BEGIN;
INSERT INTO user SELECT '张一 COMMIT;
INSERT INTO user SELECT '李四’；
INSERT INTO user SELECT '李四'；
ROLLBACK；
SELECT * FROM user;
运行结果（1行数据）：
mysql> SELECT * FROM user;
+------+
I name |
+------+
I张三    I
+------+
1行于数据集（0.01秒）

你能看到相同的SQL代码，只是在事务开始之前设置了SET@comp1et1 on_type=1;,结果就和我们第一次处理的一样，只有一个“张三”。这是为什么呢？

这里我讲解下MySQL中completion_type参数的作用，实际上这个参数有3种可能：

completion=0，这是默认情况。当我们执行COMMIT的时候会提交事务，在执行下一个事务时，还需要使用START TRANSACTION或者BEGIN来开启，
completion=1，这种情况下，当我们提交事务后，相当于执行了COMMIT AND CHAIN,也就是开启一个链式事务，即当我们提交事务之后会开启一个相同隔离级别的事务。
completion=2，这种情况下COMMIT=COMMIT AND RELEASE,也就是当我们提交后，会自动与服务器断开连接。

当我们设置autocommit=0时，不论是否采用START TRANSACTION或者BEGIN的方式来开启事务，都需要用COMMIT进行提交，让事务生效，使用ROLLBACK对事务进行回滚。

当我们设置autocommit=1时，每条SQL语句都会自动进行提交。不过这时，如果你采用START TRANSACTION或者BEGIN的方式来显式地开启事务，那么这个事务只有在COMMIT时才会生效，在ROLLBACK时才会回滚。

3. 事务隔离级别

MySQL是一个 客户端／服务器 架构的软件，对于同一个服务器来说，可以有若干个客户端与之连接，每个客户端与服务器连接上之后，就可以称为一个会话（ Session ）。

每个客户端都可以在自己的会话中向服务器发出请求语句，一个请求语句可能是某个事务的一部分，也就是对于服务器来说可能同时处理多个事务。

事务有 隔离性 的特性，理论上在某个事务对某个数据进行访问时，其他事务应该进行排队，当该事务提交之后，其他事务才可以继续访问这个数据。但是这样对 性能影响太大 ，我们既想保持事务的隔离性，又想让服务器在处理访问同一数据的多个事务时性能尽量高些，那就看二者如何权衡取舍了。

3.1 数据准备

我们需要创建一个表：

CREATE TABLE student ( studentno INT, name VARCHAR(20), class varchar(20), PRIMARY KEY (studentno) )Engine=InnoDB CHARSET=utf8;

然后向这个表里插入一条数据：

 INSERT INTO student VALUES(1,‘小谷‘，’1班')；

现在表里的数据就是这样的：

MySQL8事务篇1-事务的基本知识

3.2 数据并发问题

针对事务的隔离性和并发性，我们怎么做取舍呢？先看一下访问相同数据的事务在不保证串行执行(也就是执行完一个再执行另T)的情况下可能会出现哪些问题：

脏写(Dirty Write )
- 对于两个事务Session A、Session B,如果事务Session A修改了另一个未提交事务Session B修改过的数据，那就意味着发生了脏写
- Session A和Session B各开启了一个事务，Session B中的事务先将studentno?列为1的记录的name列更新为'李四'，然后Session A中的事务接着又把这条studentno?列为1的记录的name列更新为'张三'。如果之后Session B中的事务进行了回滚，那么Session A中的更新也将不复存在，这种现象就称之为脏写。这时Session A中的事务就没有效果了，明明把数据更新了，最后也提交事务了，最后看到的数据什么变化也没有。这里大家对事务的隔离级比较了解的话，会发现默认隔离级别下，上面SessionA中的更新语句会处于等待状态，这里只是跟大家说明一下会出现这样现象。
脏读(Dirty Read )
- 对于两个事务Session A、Session B, Session A读取了已经被Session B更新但还没有被提交的字段。之后若Session B回滚，Session A读取的内容就是临时无效的。
- Session A和Session B各开启了一个事务，Session B中的事务先将studentno列为1的记录的name列更新为‘张三'，然后Session A中的事务再去查询这条studentno为1的记录，如果读到列name的值为张三，而 Session B中的事务稍后进行了回滚，那么Session A中的事务相当于读到了一个不存在的数据，这种现象 就称之为脏读。
不可重复读(Non-Repeatable Read )
- 对于两个事务Session A、Session B, Session A读取了一个字段，然后Session B更新了该字段。之后 Session A再次读取同一个字段，值就不同了。那就意味着发生了不可重复读。
- 我们在Session B中提交了几个隐式事务(注意是隐式事务，意味着语句结束事务就提交了)，这些事务都修改了studentno列为1的记录的列name的值，每次事务提交之后，如果Session A中的事务都可以查看到最新的值，这种现象也被称之为不可重复读。
幻读(Phantom )
- 对于两个事务Session A、Session B, Session A从一个表中读取了一个字段,然后Session B在该表中插入了一些新的行。之后，如果Session A再次读取同一个表，就会多出几行。那就意味着发生了幻读。
- Session A中的事务先根据条件studentno ＞ 0。这个条件查询表student,得到了 name列值为'张三'的记录；之后Session B中提交了一个隐式事务，该事务向表student中插入了一条新记录；之后Session A中的事务再根据相同的条件studentno ＞ 0查询表student,得到的结果集中包含Session B中的事务新插入的那条记录，这种现象也被称之为幻读。我们把新插入的那些记录称之为幻影记录。
注意1：

有的同学会有疑问，那如果Session B中删除了一些符合studentno>0的记录而不是插入新记录，那Session A 之后再根据studentno>0的条件读取的记录变少了，这种现象算不算幻读呢？这种现象不属于幻读，幻读强调的是一个事务按照某个相同条件多次读取记录时，后读取时读到了之前没有读到的记录。

注意2： 那对于先前已经读到的记录，之后又读取不到这种情况，算啥呢？这相当于对每一条记录都发生了不可重复读的现象。幻读只是重点强调了读取到了之前读取没有获取到的记录。

3.3 SQL中的四种隔离级别

按照严重性来排一下序：

脏写 > 脏读 > 不可重复读 > 幻读

我们愿意舍弃一部分隔离性来换取一部分性能在这里就体现在：设立一些隔离级别，隔离级别越低，并发问题发生的就越多。SQL标准中设立了4个隔离级别：

READ UNCOMMITTED :读未提交，在该隔离级别，所有事务都可以看到其他未提交事务的执行结果。不能避免脏读、不可重复读、幻读。
READ COMMITTED ：读已提交，它满足了隔离的简单定义：一个事务只能看见已经提交事务所做的改变。这是大多数数据库系统的默认隔离级别（但不是MySQL默认的）。可以避免脏读，但不可重复读、幻读问题仍然存在。
REPEATABLE READ :可重复读，事务A在读到一条数据之后，此时事务B对该数据进行了修改并提交，那么事务A再读该数据，读到的还是原来的内容。可以避免脏读、不可重复读，但幻读问题仍然存在。这是MySQL的默认隔离级别。
SERIALIZABLE :可串行化，确保事务可以从一个表中读取相同的行。在这个事务持续期间，禁止其他事务对该表执行插入、更新和删除操作。所有的并发问题都可以避免，但性能十分低下。能避免脏读、不可重复读和幻读。

SQL标准中规定，针对不同的隔离级别，并发事务可以发生不同严重程度的问题，具体情况如下:

隔离级别	脏读可能性	不可重复读可能性	幻读可能性	加锁读
`READ UNCOMMITTED`	Yes	Yes	Yes	No
`READ COMMITTED`	No	Yes	Yes	No
`REPEATABLE READ`	No	No	Yes	No
`SERIALIZABLE`	No	No	No	Yes

脏写 怎么没涉及到？因为脏写这个问题太严重了，不论是哪种隔离级别，都不允许脏写的情况发生。

不同的隔离级别有不同的现象，并有不同的锁和并发机制，隔离级别越高，数据库的并发性能就越差，4种事务隔离级别与并发性能的关系如下：

MySQL8事务篇1-事务的基本知识

3.4 MySQL支持的四种隔离级别

不同的数据库厂商对SQL标准中规定的四种隔离级别支持不一样。比如，Oracle就只支持READ COMMITTED(默认隔离级别)和SERIALIZABLE隔离级别。MySQL虽然支持4种隔离级别，但与SQL标准中所规定的各级隔离级别允许发生的问题却有些出入，MySQL在REPEATABLE READ隔离级别下，是可以禁止幻读问题的发生的，禁止幻读的原因我们在后续讲解。

MySQL的默认隔离级别为REPEATABLE READ，我们可以手动修改一下事务的隔离级别。

# 查看隔离级别，MySQL 5.7.20的版本之前：
mysql> SHOW VARIABLES LIKE 'tx_isolation';
+---------------+-----------------+
| Variable_name |      Value      |
+---------------+-----------------+
| tx_isolation  | REPEATABLE-READ |
+---------------+-----------------+
1 row in set (0.00 sec)


# MySQL 5.7.20版本之后，引入transaction_isolation来替换tx_isolation

# 查看隔离级别，MySQL 5.7.20的版本及之后：
mysql> SHOW VARIABLES LIKE 'transaction_isolation';
+-----------------------+-----------------+
| Variable_name         | Value           |
+-----------------------+-----------------+
| transaction_isolation | REPEATABLE-READ |
+-----------------------+-----------------+
1 row in set (0.02 sec)
#或者不同MySQL版本中都可以使用的：
SELECT @@transaction_isolation;

3.5 如何设置事务的隔离级别

通过下面的语句修改事务的隔离级别：

SET [GLOBAL|SESSION] TRANSACTION ISOLATION LEVEL 隔离级别;
#其中，隔离级别格式：
> READ UNCOMMITTED
> READ COMMITTED
> REPEATABLE READ
> SERIALIZABLE

或者：

SET [GLOBAL|SESSION] TRANSACTION_ISOLATION = '隔离级别'
#其中，隔离级别格式：
> READ-UNCOMMITTED
> READ-COMMITTED
> REPEATABLE-READ
> SERIALIZABLE

关于设置时使用GLOBAL或SESSION的影响：

使用GLOBAL关键字（在全局范围影响）：
```
SET GLOBAL TRANSACTION ISOLATION LEVEL SERIALIZABLE；
#或
SET GLOBAL TRANSACTION.ISOLATION = 'SERIALIZABLE,;
```
则
- 当前已经存在的会话无效
- 只对执行完该语句之后产生的会话起作用
使用SESSION关键字（在会话范围影响）：
```
SET SESSION TRANSACTION ISOLATION LEVEL SERIALIZABLE；
#或
SET SESSION TRANSACTION.ISOLATION = 'SERIALIZABLE';
```
则：
- 对当前会话的所有后续的事务有效
- 如果在事务之间执行，则对后续的事务有效
- 该语句可以在已经开启的事务中间执行，但不会影响当前正在执行的事务

如果在服务器启动时想改变事务的默认隔离级别，可以修改启动参数transaction_isolation的值。比如在启动服务器时指定了transaction_isolation=SERIALIZABLE,那么事务的默认隔离级别就从原来的 REPEATABLE-READ变成了SERIALIZABLE。