|
|
51CTO旗下网站
|
|
移动端

利用MySQL日志模拟恢复数据变化轨迹(中)

在上篇《利用MySQL日志模拟恢复数据变化轨迹》中,我们已经介绍了我们方案的大致思路,其原理就是某网友提到的捞日志方式。通过mysqlbinlog解析binlog之后,我们可以发现对我们有用的信息都是以###开头,通过正则表达式匹配,我们就可以得到。

作者:智盛来源:taobaodba|2012-12-07 14:27

在上篇《利用MySQL日志模拟恢复数据变化轨迹》中,我们已经介绍了我们方案的大致思路,其原理就是某网友提到的捞日志方式。

通过mysqlbinlog解析binlog之后,我们可以发现对我们有用的信息都是以###开头,通过正则表达式匹配,我们就可以得到。

在日志中有@1,@2等字符, 这是代表表结构的字段名,即@1表示表中第一个字段,@2表示表中第二个字段等。然后我们通过查询INFORMATION_SCHEMA.COLUMNS表可以找到表的所有字段,然后一一替换掉即可。对于INSERT 和 DELETE两种操作,其数据行只有一份,而UPDATE有两份数据行。对此,我们需要第二份。

例如:

表结构信息

binlog信息

我们需要将其翻译成完全可执行的sql:insert into a (id, num) values (1, 199);

在截取字段值时,我们遇到一下几个坑:

1、字段值为日期类型。在日志中保存的格式为 @1=2012-12-04 13:14:35,此时,必须将2012-12-04 13:14:35加上引号。

2、负数。负数在日志中保存的格式为 @1=-1 (4294967295), 此时,我们其实只需要‘-1’即可。

3、转义字符集。日志当中显示的字段值信息与数据库中字段值信息一致,但是mysql在插入数据库是做了转义,导致日志中的内容不能马上截取直接使用。对此,我们修改了mysqlbinlog这个工具,让其解析出来的文本是未被转义的。例举几个:

root@test 09:50:58>insert into tx values(‘a\’b');

root@test 09:56:47>insert into tx values(‘a\tb’);

root@test 10:06:01>insert into tx values(‘a\bb’);

root@test 10:06:04>insert into tx values(‘a\0b’);

——————————————————-

原版

### INSERT INTO test.tx

### SET

### @1=’a'b’

### INSERT INTO test.tx

### SET

### @1=’a\x09b’

### INSERT INTO test.tx

### SET

### @1=’a\x08b’

### INSERT INTO test.tx

### SET

### @1=’a\x00b’

——————————————————-

修改版

### INSERT INTO test.tx

### SET

### @1=’a\’b’

### INSERT INTO test.tx

### SET

### @1=’a\tb’

### INSERT INTO test.tx

### SET

### @1=’a\bb’

### INSERT INTO test.tx

### SET

### @1=’a\0b’

具体内容可以参照:https://bugs.launchpad.net/percona-server/+bug/949965

4、双字节字符问题。

碰到一次解析binlog得到

·······

### @1=’休闲女鞋白黄粉黒’

······

解析出来的sql是insert into a values (‘黒\’),插回到数据库报错。原因是多了一个转义字符,在回去查看binlog时,并没有这个多余的转义字符‘\’。仔细看后,发现这并不是那个‘黑’,前者的十六进制是(FC5C),后者的十六进制是(BADA)。查看ASCII码表后得知,5C对应的字符是‘\’,而在第三类问题上已经对转义字符集修改,导致在解析出来的时候变成了 @1=’黒\’。

5、未发现问题。这个就需要我们大家更多的测试实践才能发现了。

PS:下篇文章中将献上已经修改过的mysqlbinlog以及工具脚本的代码。

【编辑推荐】

  1. MySQL从库集群方案之HAProxy篇
  2. Linux下MySQL服务器级优化技巧
  3. Mysql安全删除大表
  4. 利用MySQL日志模拟数据变化轨迹(上)
【责任编辑:黄丹 TEL:(010)68476606】

点赞 0
分享:
大家都在看
猜你喜欢

订阅专栏+更多

活学活用 Ubuntu Server

活学活用 Ubuntu Server

实战直通车
共35章 | UbuntuServer

230人订阅学习

Java EE速成指南

Java EE速成指南

掌握Java核心
共30章 | 51CTO王波

87人订阅学习

Mysql DBA修炼之路

Mysql DBA修炼之路

MySQL入门到高阶
共24章 | 51CTO叶老师

483人订阅学习

读 书 +更多

计算机病毒分析与防治简明教程

本书全面翔实地介绍了各种病毒的原理,以操作系统的发展为主线,结合病毒的发展过程来综合分析病毒。在分析工具上,较多地利用了脚本语言、...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊

51CTO服务号

51CTO播客