查看原文
其他

如何给新来的师妹解释什么是数据库的脏读、不可重复读和幻读

The following article is from 漫话编程 Author 漫话编程

来源:漫话编程 | 作者:漫话编程

十一国庆长假,朋友圈的朋友已经走向了大江南北,而我却在公司加班。这时候,组内新来的萌妹实习生过来找我。

师兄,AbstractPayExecutor这个类你修改了代码吗?




是呀,我刚刚修改了代码并提交到GitLab上了。


哦,我说的呢,我刚刚看到的一个常量没有了。




奥。我忘记和你说了。哈哈啊,这不是出现了不可重复读现象么。


嗯?师兄你说的可是数据库的读现象?能给我讲讲吗,我一直都不是很懂这个知识点。




好的。


“读现象”是多个事务并发执行时,在读取数据方面可能碰到的状况。了解它们有助于理解各隔离级别的含义。其中包括脏读、不可重复读和幻读。

事务隔离级别

我们知道,在数据库中,事务是要满足ACID的,即满足原子性、一致性、持久性以及隔离性。

在数据库事务的ACID四个属性中,隔离性是一个最常放松的一个。可以在数据操作过程中利用数据库的锁机制或者多版本并发控制机制获取更高的隔离等级。

但是,随着数据库隔离级别的提高,数据的并发能力也会有所下降。所以,如何在并发性和隔离性之间做一个很好的权衡就成了一个至关重要的问题。

奥。你说的这个我明白,但是具体的隔离级别和读现象有什么关系呢?




不同的隔离级别会导致和解决不同的读现象,我先给你介绍下都有哪些读现象吧。


脏读

第一种读现象叫做脏读,顾名思义,就是读到了脏数据,即无效数据。

脏读。是指当一个事务正在访问数据,并且对数据进行了修改,而这种修改还没有提交(commit)到数据库中,这时,另外一个事务也访问这个数据,然后使用了这个数据。因为这个数据是还没有提交的数据,那么另外一个事务读到的这个数据是脏数据,依据脏数据所做的操作可能是不正确的。

打个比方,什么情况下会出现脏读呢,就是我在我的本地修改了AbstractPayExecutor这个类的代码,我还没提交。

为了更快的知道这个类被我改成了什么样,你跑到我的电脑前面阅读了我修改后的代码。这就是脏读了。因为我没有提交代码,说明我随时可能撤销刚刚的修改,这时你之前读取到的数据就是脏数据了。

这种情况下,多个开发者之间的并发性很高,几乎没有任何阻塞。师妹想知道代码最新的是什么样,她就读到了最新代码。但是,这个代码我还没有提交,这就是个脏数据。我们之间的隔离性很差。

这显然不是我们想要看到的现象啊。




是的。我们不希望代码在未提交的状态下被别人读到。


嗯,那脏读这种情况实在是太不应该了。




是的,接着我们看下提高一点隔离性。


不可重复读

为了解决脏读问题,我们决定提高一点隔离性,我在修改代码的时候,不允许她跑到我的电脑前面读代码。她只能读取到我提交后的代码。

当我需要修改AbstractPayExecutor这个类的时候,我需要告诉师妹让她等一下,等我提交完代码她再读。这就有效的解决了脏读,因为师妹读到的代码全部都是我已经提交的代码。

但是,提高了我们之间的隔离性,并发性就降低了一些。因为她要等我提交代码后才能阅读。

嗯,这样是好了一些,我不会出现脏读了。




嗯,脏读没有了,但是还会存在不可重复读问题。


不可重复读,就是开始我说的那种AbstractPayExecutor种常量被删除的现象吗。




差不多吧。


我们已经提高了一点隔离级别,使得脏读现象没有了。但是并没有办法避免以下现象:

师妹在阅读AbstractPayExecutor的代码,代码中定义了一个LOGGER常量。然后我修改了代码,把这个常量删除了,并提交。师妹更新了代码继续阅读,但是她却发现LOGGER这个常量没有了。

两次读取,得到的文件内容不一样。严重了影响了她的学习进度。这就是不可重复读现象。

不可重复读。是指在数据库访问中,一个事务范围内两个相同的查询却返回了不同数据。这是由于查询时系统中其他事务修改的提交而引起的。比如事务T1读取某一数据,事务T2读取并修改了该数据,T1为了对读取值进行检验而再次读取该数据,便得到了不同的结果。

哦,原来这就是不可重复读。




嗯嗯,是的。


师兄,有没有可能我再读某个类的代码的时候,你先不要修改这个类呢?




可以呀。这就是进一步提升了隔离性了。


幻读

为了让师妹可以更好的学习代码。我们约定好,当她阅读某个类的代码的时候,她通知我以下,然后我就不修改这个类的代码。避免出现不可重复读的情况。

这样,我们之间的并发性就又降低了一些。不仅仅她阅读哪个类有了一些限制,我修改哪个类也有了要求了。

就这样相安无事了一段时间,师妹又来找我了。

师兄呀,你又新增了几个类了么,刚刚我看的时候只有20几个类呀。




嗯嗯,是的呀,我又增加了2个枚举类和1个Java类。


好吧,那我只能继续阅读这几个新增的类了。



在提升了隔离性之后,虽然我不会修改师妹正在阅读的类,师妹也不会阅读我正在修改的类。但是我可能会增加或者删除几个类。这时候和师妹之前读取到的类的总个数就有了变化。也就是说,她之前读到的数据就不准确了。这就是幻读。

幻读。指同一个事务内多次查询返回的结果集不一样(比如增加了或者减少了行记录)。比如同一个事务A内第一次查询时候有n条记录,但是第二次同等条件下查询却又n+1条记录,这就好像产生了幻觉。

幻读是不可重复读的一种特殊场景。

哦,我明白了。原来这就是幻读。




是的,幻读的情况其实也是可以解决的。


我知道如何解决,就是我读代码的时候你不要做任何修改。




额,是的。


如果想要解决幻读问题,那么就只能在师妹阅读代码的时候,我什么也不做了。这样我们之间的隔离性最高,但是并发性就最低了。

要想解决脏读、不可重复读、幻读等读现象,那么就需要提高事务的隔离级别。但与此同时,事务的隔离级别越高,并发能力也就越低。所以,还需要读者根据业务需要进行权衡。

总结

事务的隔离性上,从低到高可能产生的读现象分别是:脏读、不可重复读、幻读。

脏读指读到了未提交的数据。

不可重复读指一次事务内的多次相同查询,读取到了不同的结果。

幻读师不可重复读的特殊场景。一次事务内的多次范围查询得到了不同的结果。

通过在写的时候加锁,可以解决脏读。

通过在读的时候加锁,可以解决不可重复读。

通过串行化,可以解决幻读。

以上这几种解决方案其实是数据库的几种隔离级别。

你可能会喜欢

腾讯面试:一条SQL语句执行得很慢的原因有哪些?---不看后悔系列

记一道字节跳动的算法面试题

为什么你学不会递归?告别递归,谈谈我的一些经验

一文读懂一台计算机是如何把数据发送给另一台计算机的

如何只用2GB内存从20/40/80亿个整数中找到出现次数最多的数

字符串匹配Boyer-Moore算法:文本编辑器中的查找功能是如何实现的?


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存