Redis持久化

Mahe666

RDB

在指定的时间间隔内将内存中的数据集快照写入磁盘，也就是行话讲Snapshot快照，它恢复时是将快照文件直接读到内存里。

Redis会单独创建（fork）一个子进程来进行持久化，会先将数据写入到一个临时文件中，待持久化过程都结束了，再用这个临时文件替换上次持久化好的文件。整个过程中，主进程是不进行任何IO操作的。这就确保了极高的性能。如果需要进行大规模数据的恢复，且对于数据恢复的完整性不是非常敏感，那RDB方式要比AOF方式更加的高效。RDB的缺点是最后一次持久化后的数据可能丢失。我们默认的就是RDB，一般情况下不需要修改这个配置！

rdb保存的文件是dump.rdb。都是在我们的配置文件中快照中进行配置的！

触发机制

save的规则满足的情况下，会自动触发rdb规则!
执行flushall 命令，也会触发我们的rdb规则！
退出redis，也会产生rdb文件！

备份完成后就会生成一个dump.rdb文件

如何恢复RDB文件

只需要将rdb文件放在我们redis启动目录就可以，redis启动的时候会自动检查dump.rdb恢复其中的数据！
查看rdb文件需要存放的位置
```
config get dir
```

优点：

适合大规模的数据恢复！
要求：对数据的完整性不高！

缺点：

需要一定的时间间隔进程操作！如果redis意外宕机了，这个最后一次修改数据就没有了！
fork进程的时候，会占用一定的内存空间！

AOF

默认是不开启的，我们需要手动进行配置！我们只需要将appendonly改为yes就开启了aof！

重启，redis 就可以生效了！

如果这个aof文件有错误，这时候redis 是启动不起来的吗，我们需要修复这个aof文件redis 给我们提供了一个修复工具

redis-check-aof - -fix

如果文件正常，重启就可以直接恢复了！

重写规则说明：

aof默认就是文件的无限追加，文件会越来越大！

如果aof文件大于64mb，太大了！fork一个新的进程来将我们的文件进行重写！

默认是不开启aof模式的，默认是使用rdb模式持久化。大部分情况下，rdb完全够用

优点和缺点：

appendfsync always # 每次修改都会sync，消耗性能。
appendfsync everysec # 每秒执行一次sync，可能会丢失这一秒数据。
appendfsync no     # 不执行，这个时候操作系统自己同步数据，速度最快

优点：

每一次修改都同步，文件的完整会更加好！
每秒同步一次，可能会丢失一秒的数据
从不同步，效率最高的！

缺点：

相对于数据文件来说，aof远远大于rdb，修复的速度也比rdb慢！
Aof运行效率也要比rdb慢，所以我们redis默认的配置就是rdb持久化！

扩展

RDB持久化方式能够在指定的时间间隔内对你的数据进行快照存储
AOF持久化方式记录每次对服务器写的操作，当服务器重启的时候会重新执行这些命令来恢复原始的数据，AOF命令以Redis协议追加保存每次写的操作到文件末尾，Redis还能对AOF文件进行后台重写，使得AOF文件的体积不至于过大。
只做缓存，如果你只希望你的数据在服务器运行的时候存在，你也可以不使用任何持久化。
同时开启两种持久化方式
- 在这种情况下，当redis重启的时候会优先载入AOF文件来恢复原始的数据，因为在通常情况下AOF文件保存的数据集要比RDB文件保存的数据集要完整。
- RDB的数据不实时，同时使用两者时服务器重启也只会找AOF文件，那要不要只使用AOF呢？作者建议不要，因为RDB更适合用于备份数据库（AOF在不断变化不好备份），快速重启，而且不会有AOF可能潜在的Bug，留着作为一个万一的手段。
性能建议
- 因为RDB文件只用作后备用途，建议只在Slave上持久化RDB文件，而且只要15分钟备份一次就够了，只保留save 900 1这条规则。
- 如果Enable AOF，好处是在最恶劣情况下也只会丢失不超过两秒数据，启动脚本较简单只load自己的AOF文件就可以了，代价一是带来了持续的I0，二是AOF rewrite的最后将 rewrite过程中产生的新数据写到新文件造成的阻塞几乎是不可避免的。只要硬盘许可，应该尽量减少AOF rewrite的频率，AOF重写的基础大小默认值64M太小了，可以设到5G以上，默认超过原大小100%大小重写可以改到适当的数值。
- 如果不Enable AOF，仅靠Master-Slave Replcation实现高可用性也可以，能省掉一大笔lO，也减少了rewrite时带来的系统波动。代价是如果Master/Slave 同时倒掉，会丢失十几分钟的数据，启动脚本也要比较两个Master/Slave中的RDB文件，载入较新的那个，微博就是这种架构。