事务解密：轻松理解并发世界的四大难题！

站长

2023年09月27日 02:58 · 阅读数 74

事务解密：轻松理解并发世界的四大难题！

随便聊聊

数据库，就像是现代业务系统的数据“心脏”，不停地将数据泵送到各个业务处理器中。为了尽可能的提高”泵血“速度，并发在这个过程中起到了无可替代的作用，但是一系列问题也随之而来。为了解决并发过程中的问题，一个新概念开始萌芽：事务（Transaction。

什么是事务

事务，说白了，就是一组不可分割的操作集合，要么全成功，要么全失败，不允许中途插队。具体俩说， 事务得遵循以下四个原则

原子性(Atomicity)：一个 事务 中的所有操作，要么全部完成，要么全部不完成，不会结束在中间某个环节，而且 事务在执行过程中发生错误，会被回滚到 事务 开始前的状态，就像这个 事务从来没有执行过一样。
一致性（Consistency）：是指 事务操作前和操作后，数据满足完整性约束，数据库保持一致性状态。比如说一个 事务的作用是增加50个商品库存，那么当 事务结束后，要么成功，商品库存增加50，要么失败，商品库存保持不变。不能出现 事务执行成功商品增加20，或是失败商品库存减少10这类不满足数据一致性的情况。
隔离性（Isolation）：数据库允许多个并发 事务同时对其数据进行读写和修改的能力，隔离性可以防止多个 事务并发执行时由于交叉执行而导致数据的不一致，因为多个 事务同时使用相同的数据时，不会相互干扰，每个 事务都有一个完整的数据空间，对其他并发 事务是隔离的。
持久性（Durability）： 事务处理结束后，对数据的修改就是永久的，即便系统故障也不会丢失。

那么这四个特性分别需要通过什么技术实现呢？这里以InnoDB为例：

持久性是通过redo log来保证的
原子性是通过undo log来保证的
隔离性是通过MVCC或者锁机制来保证的
一致性是通过持久性+原子性+隔离性来保证

在这篇文章中，将主要着力于阐述清楚 事务的隔离性，避免一次性输入过多的概念让大家筋疲力尽。

并发是如何影响数据库的？

上面我们已经聊过数据库的 事务必须要遵守隔离性，那么如果不遵守隔离性将会发生什么有趣（bushi）的事情呢？接下来让我们来看看。

脏写（Dirty Write）

影响最恶劣的问题叫做脏写，定义如下：如果一个 事务修改了另一个未提交 事务修改过的数据，就叫做发生了脏写。下面给出一个简单的示意图：

事务解密：轻松理解并发世界的四大难题！

事务小王和 事务小张各自准备对记录小红的男朋友字段进行修改，小红接受了小张，但是拒绝了可怜的小王，因此 事务小王进行回滚。但是这样子就出现大问题了，小王的回滚将会导致小张丢失表白成功的数据丢失。那小张肯定不干了，你失败了，凭啥拉我垫背呢？这种现象就叫脏写，因为造成的影响太过于恶劣，在数据库中通常完全禁止这种情况发生。

脏读（Dirty Read）

第二个问题叫做 脏读：如果一个 事务读到了另一个未提交 事务修改过的数据，就叫做发生了 脏读。示意图如下

事务解密：轻松理解并发世界的四大难题！如果 事务A正准备向余额中存入了100元，此时虽然修改了记录信息，但是还没有提交，接着 事务B读取了余额，在这时， 事务A忽然发现今天自己身上没带够100块，于是撤销了存款操作。这时 事务B就懵圈了，这时候 事务B读到的数据实际上是不存在的，如果接下来在 事务B中进行了如付款这类的操作， 事务B仍然会认为账户余额剩余200元，将会有可能出现超额支付的情况。

不可重复读（Non-Repeatable Read）

如果一个 事务只能读到另一个已经提交的 事务修改过的数据，并且其他 事务每对该数据进行一次修改并提交后，该 事务都能查询得到最新值，那就意味着发生了不可重复读，示意图如下：

事务解密：轻松理解并发世界的四大难题！

不可重复读这个名字刚开始听起来总觉得又怪又难记。不可重复读实际上就是再说，在这种 事务中，不应该进行重复读取的操作，所以叫做不可重复读。上面的例子给出的是 事务A读取到了 事务B修改并提交的记录，如果 事务A原先读到的记录被 事务B删除导致读不到了，这种情况同样也属于不可重复读。

所以 脏读和不可重复读的区别就在于 脏读可以读取到未提交 事务修改过的数据，而不可重复读则是读取到被已经提交 事务修改的数据

幻读（Phantom Read）

如果一个 事务先根据某些条件查询出一些记录，之后另一个 事务又向表中插入了符合这些条件的记录，原先的 事务再次按照该条件查询时，能把另一个 事务插入的记录也读出来，那就意味着发生了幻读，示意图如下：

事务解密：轻松理解并发世界的四大难题！

通常上面四种问题的严重程度是这样子排序的：脏写 > 脏读 > 不可重复读 > 幻读

SQL标准中的隔离级别

现在我们已经了解到，如果不保证隔离性，并发 事务可能会导致一系列危险的问题，因此我们希望不同客户端在并发访问数据库的时候，可以做到相互之间互相隔离，最好做到对于彼此没有任何影响。但是我们也需要认识到，随着隔离程度的不断提高，数据库的性能也会随之下降。举个最极端的情况，当数据库不允许并发访问，也就是只能顺序访问的时候，自然就会有最好的隔离性，因为不同客户之间根本不会相互影响。

事实上，由于数据库有非常多的应用场景，在某些场景下，允许数据库适当的降低隔离级别来获得更好的并发性能。比如在某一个场景下，访问者只对数据库进行读操作，那么就根本不需要关系数据库的隔离性这种事，因为在这种情况下，上面所担心的问题统统不会发生。

为了满足使用中不同场景的需求，大伙们一起设计了4个规范隔离级别来平衡性能和数据的安全性。

READ UNCOMMITTED：未提交读。
READ COMMITTED：已提交读。
REPEATABLE READ：可重复读。
SERIALIZABLE：可串行化。

这四种隔离级别分别可以解决的不同程度严重的问题，具体情况如下表所示：

隔离级别	脏读	不可重复读	幻读
`READ UNCOMMITTED`	可能发生	可能发生	可能发生
`READ COMMITTED`	不会发生	可能发生	可能发生
`REPEATABLE READ`	不会发生	不会发生	可能发生
`SERIALIZABLE`	不会发生	不会发生	不会发生

到这里位置，关于 事务的基本概念问题就已经全部介绍完毕，接下来真正硬核的部分才要刚刚开始。如果上面的内容看起来还是感觉晕晕乎乎的，不要着急，尝试着认真理解相关概念。因为英文直译确实让这些名词看起来让人摸不着头脑，但是它们的核心其实并不困难。在接下来的两篇文章中，将分别从锁和MVCC两种方案探索MySQL 事务的具体实现。

往期文章

Github仓库: github.com/danmuking/b…

欢迎star~

转载自:https://juejin.cn/post/7282666872208850983