关于InnoDB事务的一个“诡异”现象
??? 在隔离机制中,InnoDB默认采用的Repeatable Read 和MVCC机制保证在事务内部尽量保证逻辑一致性。但如下的现象依然让人觉得不太合理。
?
1、复现
a)????? 表结构
CREATE TABLE `t` (
? `a` int(11) NOT NULL DEFAULT ‘0′,
? `b` int(11) DEFAULT NULL,
? PRIMARY KEY (`a`)
) ENGINE=InnoDB DEFAULT CHARSET=gbk
表中2条记录
| 1 |? 100 |
| 4 |? 400 |
+—+——+
?
b)????? 操作过程:开两个session,操作序列如下
Session 1Session 21)Begin?2)Select * from t;?
| 1 |? 100 |
| 4 |? 400 |
2 rows in set (0.01 sec)
??3)Insert into t vlaues(2, 200);4)Select * from t;?
| 1 |? 100 |
| 4 |? 400 |
2 rows in set (0.01 sec)
?5)Update t set b = 200 where a = 2;?
Query OK, 0 rows affected (0.01 sec)
Rows matched: 1? Changed: 0? Warnings: 0
?6)Select * from t;?
| 1 |? 100 |
| 2 |? 200 |
| 4 | ?400 |
3 rows in set (0.01 sec)
??
从session 1整个过程看来,它试图更新一个不存在的记录(a=2),结果更新成功,并且之后这个记录可以访问。
?
2、分析
?????? 从其他正常的表象看来,在事务内,只要不涉及更新,事务外的任何更新都是不可见的。上面试验中session 1内update之前执行的select *得到的结果仍是2条记录。
?????? 虽然更新冲突时的策略见仁见智,但例子中的这个现象应该提供一种可以选择的方式(至少应该允许配置)。
?????? 接下来的篇幅主要分析出现这种现象的原因,以及通过简单修改实现如下的方式:对于查询不可见的记录,update操作不应该成功。
?????? 由于更新冲突策略的复杂性,本文不解决更多的问题,简单比如:insert操作由于主键冲突的原因,插入依旧不允许。
?
3、源码相关
?????? 先来说明一下为什么步骤4)中的查询结果仍为2条记录。
?????? Innodb内部每个事务开始时,都会有一个事务id, 同时事务对象中还有一个read_view变量,用于控制该事务可见的记录范围(MVCC)。对于每个访问到的记录行,会根据read_view的trx_id(事务id)与行记录的trx_id比较,判断记录是否逻辑上可见。
?????? Session 2中插入的记录不可见,原因即为session 1先于session 2,因此新插入的数据经过判断,不在可见范围内。对应的源码在row/row0sel.c [4040-4055].
?????? {说明: 源码版本5.1.45, 下同}
?????? 发生的逻辑为
If(!lock_clust_rec_cons_read_sees(..)){?
??? //检查该记录是否本事务可见?
?? row_sel_build_prev_vers_for_mysql(….); //不可见则找上一个版本??????
?? if (old_vers == NULL) {goto next_rec;} //上一个版本没有这个记录,放弃
}
?
?????? 注意到表格中出现的Rows matched: 1。 这里是例子出现诡异的开始,也是根源。我们知道innoDB内部更新数据实际上是“先查后改”,跟这个Rows matched: 1结合起来,不难联想到,在执行update操作是,在“查”的阶段,事务能够访问到新插入的行。
猜测:问题出在,执行更新的时候,是否没有判断事务可见范围?
?????? 事实上确实如此,源代码上翻几行可以看到,在行数[3897-4017-4071]这个if-else逻辑。
if (prebuilt->select_lock_type != LOCK_NONE) {??
????????????//该操作需要加锁
? }
else{
?????? //{CODES A}
}
执行查询语句走的是else的逻辑,而控制版本可见范围的代码就在{CODES A}的位置中。
?????? 而当我们在session 1中执行update操作时,走的是if()的逻辑,这里,没有判断版本可见范围。
?
????? 4、简单修改?
既然是因为update的“查”过程没有检查版本可见范围造成,我们试着加上。
在row/row0sel.c[3907]行插入如下:
if(trx->read_view){?
??? if (UNIV_LIKELY(srv_force_recovery < 5)?
??????????????? && !lock_clust_rec_cons_read_sees(rec, clust_index, offsets, trx->read_view)) {?
??????? rec_t*? old_vers;
??????? err = row_sel_build_prev_vers_for_mysql(
??????????????????????????????????????? trx->read_view, clust_index,
??????????????????????????????????????? prebuilt, rec, &offsets, &heap,
??????????????????????????????????????? &old_vers, &mtr);
?????? if (err != DB_SUCCESS) {
?????????? goto lock_wait_or_error;
?????? }??????
????? if (old_vers == NULL) {
?????????? goto next_rec;
????? }??????
?? }??????
}??????
?
新的执行结果为
Session 1Session 21)Begin?2)Select * from t;?
| 1 |? 100 |
| 4 |? 400 |
2 rows in set (0.01 sec)
??3)Insert into t vlaues(2, 200);4)Select * from t;?
| 1 |? 100 |
| 4 |? 400 |
2 rows in set (0.01 sec)
?5)Update t set b = 200 where a = 2;?
Query OK, 0 rows affected (0.01 sec)
Rows matched: 0? Changed: 0? Warnings: 0
?6)Select * from t;?
| 1 |? 100 |
| 4 |? 400 |
2?rows in set (0.01 sec)
??
重申:这个修改仅仅从本文的例子出发,达到“事务内查询无法访问的记录,不能更新”这个目的, 其他更新冲突策略不在此范围内。 仅作交流使用 -_-
Update t set b = 233 where a = 2;