数据库隔离特性:保证数据一致性和完整性 (数据库隔离的特性)

在现代的信息化社会中,数据库系统是无处不在的。无论是互联网还是各种企业信息系统都离不开数据库。数据库的作用是保存和管理数据,因此数据库系统的安全性和稳定性非常重要。其中,数据库的隔离特性是数据库系统中非常重要的一环,它直接关系到数据的一致性和完整性。

隔离特性是指在数据库系统中,要求不同的事务互不干扰,可以并行执行,且保证数据一致性和完整性的性质。在实际的数据库系统中,我们常常需要同时运行多个事务,因此要保证事务之间互相独立,不会产生干扰和冲突。对于数据库系统的隔离特性,可以从以下几个方面来详细讨论。

一、事务的概念

在数据库系统中,事务是数据库操作的最小单位,它是一系列操作的,这些操作构成了一个不可分割的工作单元。如果所有操作都成功执行,则事务被提交,将对数据进行更新,否则它将被回滚并撤消对数据库的操作。事务有四个基本特性,即原子性、一致性、隔离性和持久性。

二、隔离的必要性

我们都知道,不同的事务之间可能会同时操作同一份数据,如果没有隔离性,就会出现脏读、不可重复读和幻读等问题。所谓脏读是指一个事务读取了另一个事务未提交的数据,这样读取的数据是不可靠的。不可重复读是指一个事务重复读取同一数据行,但在这个过程中,其他已提交的事务可能对同一数据行进行了修改,这就导致了不一致的结果。幻读则是指一个事务在前后两次查询中查到了不同的数据,原因是在查询中间有其它事务插入了新的记录。

因此,为了保证数据的一致性和完整性,就需要数据库系统提供隔离特性,避免各种冲突和问题的出现。

三、事务隔离的级别

为了解决因并发执行多个事务而产生的问题,数据库系统提供了多个事务隔离级别。在标准的SQL92标准中,定义了四个隔离级别,分别是读未提交(Read Uncommitted)、读提交(Read Committed)、可重复读(Repeatable Read)和序列化(Serializable)。不同的隔离级别会给数据的一致性和完整性带来不同的影响。

1. 读未提交

读未提交隔离级别是更低的级别,它允许一个事务读取另一个事务未提交的数据。这种隔离级别可能导致脏读、不可重复读和幻读等问题,因此很少使用。

2. 读提交

这个隔离级别要求一个事务只能读取另一个事务已经提交的数据,这样能确保不会产生脏读问题。但它仍然有可能出现不可重复读和幻读问题。

3. 可重复读

可重复读隔离级别要求一个事务可以多次读取同一份数据,而其他事务不能修改这些数据。这种隔离级别可以避免脏读和不可重复读问题,但仍有可能出现幻读问题。

4. 序列化

序列化隔离级别是更高的隔离级别,它要求所有的事务按照一个序列执行,这样可以避免所有并发问题,但是会对性能造成很大的影响。

四、数据库隔离的实现

为了实现不同的隔离级别,数据库系统使用了一系列的技术手段。其中,最常用的技术有锁和版本控制。

1. 锁机制

锁机制可以实现事务的隔离,使各个事务在竞争资源时遵循严格的顺序。锁的种类有共享锁和排它锁。共享锁是用于保护读取操作的,多个并发事务可以同时取得共享锁。排它锁则是用于保护写入操作的,一个事务在进行写操作时需要获取独占锁,其他事务则不能同时进行读或写操作。

2. 版本控制

版本控制是另一种实现事务隔离的技术,它可以避免读写冲突,每个事务都可以访问自己的数据版本。版本控制技术通过为每个数据库行创建多个版本来实现。每次事务修改数据时,都会为该数据创建一个新版本,并在旧版本上添加新的版本号。其他事务则可以继续读取旧版本的数据,直到该版本被当前事务修改为止。

五、

数据库的隔离特性是数据库系统中非常重要的一环,它直接关系到数据的一致性和完整性。事务隔离的级别不同,对数据的影响也不同。为了实现不同的隔离级别,数据库系统使用了一系列的技术手段,如锁和版本控制等。通过完善的隔离特性,可以尽可能地避免因并发操作而导致的各种问题和矛盾,确保数据的正确性和稳定性,提高数据库系统的可靠性和稳定性。

相关问题拓展阅读:

mysql 的事务隔离级别 及各个隔离级别应用场景,详细

默认的行为(不带session和global)是为下一个(未开始)事务设置隔离级别裤兄。如果你使用GLOBAL关键字,语句在全局对从那点开始创建的所有新连接(除了不存在的连接)设置默认事务级别。

使用SESSION 关键字为将来在当前连接上执行的事务设置默认事务级别。滚烂 任何客户端都能自由改变会话隔离级别(甚至在事务的中间胡备袭),或者为下一个事务设置隔离级别。

术式之后皆为逻辑,一切皆为需求和实现。希望此文能从需求、现状和解决方式的角度帮大家理解隔离级别。

隔离级别的产生

在串型执行的条件下,数据修改的顺序是固定的、可预期的结果,但是并发执行的情况下,数据的修改是不可预期的,也不固定,为了实现数据修改在并发执行的情况下得到一个固定、可预期的结果,由此产生了隔离级别。

所以隔离级别的作用是用来平衡数据库并发访问与数据一致性的方法。

事务的4种隔离级别

READ UNCOMMITTED    行竖   未提交读,可以读取未提交的数据。READ COMMITTED已提交读,对于锁定读(select with for update 或者 for share)、update 和 delete 语句,InnoDB 仅锁定索引记录,而不锁定它们之间的间隙,因此允许在锁定的记录旁边自由插入新记录。Gap locking 仅用于外键约束检查和重复键检查。REPEATABLE READ可重复读,事务中的一致性读取读取的是事务之一次读取所建立的快照。SERIALIZABLE序列化

在了解了 4 种隔离级别的需求后,在采用锁控制隔离级别的基础上,我们需要了解加锁的对象(数据本身&间隙),以及了解整个数据范围的全集组成。

数据范围全集组成

SQL 语句根据条件判断不需要扫描的数据范围(不加锁);

SQL 语句根据条件扫描到的可能需要加锁的数据范围;

以单个数据范围为例,数据范围全集包含:(数据范围不一定是连续的值,也可能是间隔的值组成)

1. 数据已经填充了整个数据范围:(被完全填充的数据范围,不存在数据间隙)

整形,对值具有唯一约束条件的数据范围 1~5 ,

已有数据1、2、3、4、5,此时数据范围已被完全填充;

整形,对值具有唯一约束条件的数据范围 1 和 5 ,

已有数据1、5,此时数据范围已被完全填充; 

2. 数据填充了部分数据范围:(未被完全填充的数据范围,是存在数据间隙)

整形的数据范围 1~5 ,

已有数据 1、2、3、4、5,但是因为没有唯一约束,

所以数据范围可以继续被 1~5 的数据重复填充;

整形,具有唯一约束条件的数据范围 1~5 ,

已有数据 2,5,此时数据范围未被完全填充,还可以填充 1、3、4 ;

3. 数据范围内没有任何数据(存在间隙)

如下:

整形的数据范围 1~5 ,数据范围内当前没有任何数据。

在了解了数据全集的组成后,我们再来看看事务并发时,会带来的问题。

无控制的并发所带来的问题

并发事务如果不加以控制的话会带来一些问题,主要包括以下几种情况。

1. 范围内已有数据更改导致的:

更新丢失:当多个事务选择了同一行,然后基于最初选定的值更新该行时,

由于每个事物不知道其陆塌他事务的存在,最后的更新就会覆盖其他事务所做的更新;

脏读: 一个事务正在对一条记录做修改,这个事务完成并提交前,这条记录就处于不一致状态。

这时,另外一个事务也来读取同一条记录,如果不加控制,

第二个事务读取了这些“脏”数据,并据此做了进一步的处理,就会产生提交的数据依赖关系。

这种现象就叫“脏读”。

2. 范围内数据量发生了变化导致:

不可重复读:一个事早带圆务在读取某些数据后的某个时间,再次读取以前读过的数据,

却发现其读出的数据已经发生了改变,或者某些记录已经被删除了。

这种现象就叫“不可重复读”。

幻读:一个事务按相同的查询条件重新读取以前检索过的数据,

却发现其他事务插入了满足其查询条件的新数据,这种现象称为“幻读”。

可以简单的认为满足条件的数据量变化了。

因为无控制的并发会带来一系列的问题,这些问题会导致无法满足我们所需要的结果。因此我们需要控制并发,以实现我们所期望的结果(隔离级别)。

MySQL 隔离级别的实现

InnoDB 通过加锁的策略来支持这些隔离级别。

行锁包含:

Record Locks

索引记录锁,索引记录锁始终锁定索引记录,即使表中未定义索引,

这种情况下,InnoDB 创建一个隐藏的聚簇索引,并使用该索引进行记录锁定。

Gap Locks

间隙锁是索引记录之间的间隙上的锁,或者对之一条记录之前或者最后一条记录之后的锁。

间隙锁是性能和并发之间权衡的一部分。

对于无间隙的数据范围不需要间隙锁,因为没有间隙。

Next-Key Locks

索引记录上的记录锁和索引记录之前的 gap lock 的组合。

假设索引包含 10、11、13 和 20。

可能的next-key locks包括以下间隔,其中圆括号表示不包含间隔端点,方括号表示包含端点:

(负无穷大, 10>    (10, 11>    (11, 13>    (13, 20>    (20, 正无穷大)对于最后一个间隔,next-key将会锁定索引中更大值的上方,

左右滑动进行查看

“上确界”伪记录的值高于索引中任何实际值。

上确界不是一个真正的索引记录,因此,实际上,这个 next-key 只锁定更大索引值之后的间隙。

基于此,当获取的数据范围中,数据已填充了所有的数据范围,那么此时是不存在间隙的,也就不需要 gap lock。

对于数据范围内存在间隙的,需要根据隔离级别确认是否对间隙加锁。

默认的 REPEATABLE READ 隔离级别,为了保证可重复读,除了对数据本身加锁以外,还需要对数据间隙加锁。

READ COMMITTED 已提交读,不匹配行的记录锁在 MySQL 评估了 where 条件后释放。

对于 update 语句,InnoDB 执行 “semi-consistent” 读取,这样它会将最新提交的版本返回到 MySQL,

以便 MySQL 可以确定该行是否与 update 的 where 条件相匹配。

总结&延展:

唯一索引存在唯一约束,所以变更后的数据若违反了唯一约束的原则,则会失败。

当 where 条件使用二级索引筛选数据时,会对二级索引命中的条目和对应的聚簇索引都加锁;所以其他事务变更命中加锁的聚簇索引时,都会等待锁。

行锁的增加是一行一行增加的,所以可能导致并况下死锁的发生。

例如,

在 session A 对符合条件的某聚簇索引加锁时,可能 session B 已持有该聚簇索引的 Record Locks,而 session B 正在等待 session A 已持有的某聚簇索引的 Record Locks。

session A 和 session B 是通过两个不相干的二级索引定位到的聚簇索引。

session A 通过索引 idA,session B通过索引 idB 。

当 where 条件获取的数据无间隙时,无论隔离级别为 rc 或 rr,都不会存在间隙锁。

比如通过唯一索引获取到了已完全填充的数据范围,此时不需要间隙锁。

间隙锁的目的在于阻止数据插入间隙,所以无论是通过 insert 或 update 变更导致的间隙内数据的存在,都会被阻止。

rc 隔离级别模式下,查询和索引扫描将禁用 gap locking,此时 gap locking 仅用于外键约束检查和重复键检查(主要是唯一性检查)。

rr 模式下,为了防止幻读,会加上 Gap Locks。

事务中,SQL 开始则加锁,事务结束才释放锁。

就锁类型而言,应该有优化锁,锁升级等,例如rr模式未使用索引查询的情况下,是否可以直接升级为表锁。

就锁的应用场景而言,在回放场景中,如果确定事务可并发,则可以考虑不加锁,加快回放速度。

锁只是并发控制的一种粒度,只是一个很小的部分:

从不同场景下是否需要控制并发,(已知无交集且有序的数据的变更,MySQL 的 MTS 相同前置事务的多事务并发回放)

并发控制的粒度,(锁是一种逻辑粒度,可能还存在物理层和其他逻辑粒度或方式)

相同粒度下的优化,(锁本身存在优化,如IX、IS类型的优化锁)

粒度加载的安全&性能(如获取行锁前,先获取页锁,页锁在执行获取行锁操作后即释放,无论是否获取成功)等多个层次去思考并发这玩意。

数据库隔离的特性的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于数据库隔离的特性,数据库隔离特性:保证数据一致性和完整性,mysql 的事务隔离级别 及各个隔离级别应用场景,详细的信息别忘了在本站进行查找喔。


数据运维技术 » 数据库隔离特性:保证数据一致性和完整性 (数据库隔离的特性)