Redis 常见的性能问题和解决方法

全部 Hibernate Spring Struts iBATIS 企业应用 Lucene SOA Java综合 Tomcat 设计模式 OO JBoss

浏览 14923 次

锁定老帖子主题：Redis 常见的性能问题和解决方法精华帖 (0) :: 良好帖 (1) :: 新手帖 (0) :: 隐藏帖 (0)
作者	正文
温柔一刀等级: 性别: 文章: 801 积分: 1192 来自: 上海	发表时间：2012-07-03 最后修改：2012-07-04 相关推荐: 10.1.2 redis常见性能问题和解决方案.md Redis常见性能问题和解决方案提升node.js中使用redis的性能遇到的问题及解决方法 redis常见问题及解决方案 Redis常见性能问题和解决办法更多相关推荐 Redis 1.Master写内存快照，save命令调度rdbSave函数，会阻塞主线程的工作，当快照比较大时对性能影响是非常大的，会间断性暂停服务，所以Master最好不要写内存快照。 2.Master AOF持久化，如果不重写AOF文件，这个持久化方式对性能的影响是最小的，但是AOF文件会不断增大，AOF文件过大会影响Master重启的恢复速度。 3.Master调用BGREWRITEAOF重写AOF文件，AOF在重写的时候会占大量的CPU和内存资源，导致服务load过高，出现短暂服务暂停现象。下面是我的一个实际项目的情况，大概情况是这样的：一个Master，4个Slave，没有Sharding机制，仅是读写分离，Master负责写入操作和AOF日志备份，AOF文件大概5G，Slave负责读操作，当Master调用BGREWRITEAOF时，Master和Slave负载会突然陡增，Master的写入请求基本上都不响应了，持续了大概5分钟，Slave的读请求过也半无法及时响应，Master和Slave的服务器负载图如下： Master Server load： Slave server load：上面的情况本来不会也不应该发生的，是因为以前Master的这个机器是Slave，在上面有一个shell定时任务在每天的上午10点调用BGREWRITEAOF重写AOF文件，后来由于Master机器down了，就把备份的这个Slave切成Master了，但是这个定时任务忘记删除了，就导致了上面悲剧情况的发生，原因还是找了几天才找到的。将no-appendfsync-on-rewrite的配置设为yes可以缓解这个问题，设置为yes表示rewrite期间对新写操作不fsync，暂时存在内存中，等rewrite完成后再写入。最好是不开启Master的AOF备份功能。 4.Redis主从复制的性能问题，第一次Slave向Master同步的实现是：Slave向Master发出同步请求，Master先dump出rdb文件，然后将rdb文件全量传输给slave，然后Master把缓存的命令转发给Slave，初次同步完成。第二次以及以后的同步实现是：Master将变量的快照直接实时依次发送给各个Slave。不管什么原因导致Slave和Master断开重连都会重复以上过程。Redis的主从复制是建立在内存快照的持久化基础上，只要有Slave就一定会有内存快照发生。虽然Redis宣称主从复制无阻塞，但由于磁盘io的限制，如果Master快照文件比较大，那么dump会耗费比较长的时间，这个过程中Master可能无法响应请求，也就是说服务会中断，对于关键服务，这个后果也是很可怕的。以上1.2.3.4根本问题的原因都离不开系统io瓶颈问题，也就是硬盘读写速度不够快，主进程 fsync()/write() 操作被阻塞。 5.单点故障问题，由于目前Redis的主从复制还不够成熟，所以存在明显的单点故障问题，这个目前只能自己做方案解决，如：主动复制，Proxy实现Slave对Master的替换等，这个也是Redis作者目前比较优先的任务之一，作者的解决方案思路简单优雅，详情可见 Redis Sentinel design draft http://redis.io/topics/sentinel-spec。总结： 1.Master最好不要做任何持久化工作，包括内存快照和AOF日志文件，特别是不要启用内存快照做持久化。 2.如果数据比较关键，某个Slave开启AOF备份数据，策略为每秒同步一次。 3.为了主从复制的速度和连接的稳定性，Slave和Master最好在同一个局域网内。 4.尽量避免在压力较大的主库上增加从库 5.为了Master的稳定性，主从复制不要用图状结构，用单向链表结构更稳定，即主从关系为：Master<--Slave1<--Slave2<--Slave3.......，这样的结构也方便解决单点故障问题，实现Slave对Master的替换，也即，如果Master挂了，可以立马启用Slave1做Master，其他不变。今天暂时写这么多吧，以后再补充。声明：ITeye文章版权属于作者，受法律保护。没有作者书面许可不得转载。推荐链接
返回顶楼

xbcoil 等级: 初级会员性别: 文章: 62 积分: 70 来自: 北京	发表时间：2012-07-04 给力，长见识了。
返回顶楼	回帖地址 0 0 请登录后投票

wangqj 等级: 初级会员性别: 文章: 90 积分: 30 来自: 北京	发表时间：2012-07-04 不用redis做数据库的话，只做缓存用的话，master-slave就没必要了吧，不如节省点空间，多起几个服务，把数据切分一下。本身故障率就不大
返回顶楼	回帖地址 0 0 请登录后投票

islandhn 等级: 初级会员性别: 文章: 3 积分: 60 来自: 北京	发表时间：2012-07-04 实践总结： 1.Master最好不要做任何持久化工作，包括内存快照和AOF日志文件，特别是不要启用内存快照做持久化。 master要是重启怎么办？把数据从slave拷贝过来？ 2.如果数据比较关键，某个Slave开启AOF备份数据，策略为每秒同步一次。 3.为了主从复制的速度和连接的稳定性，Slave和Master最好在同一个局域网内。 4.为了充分利用CPU，可以在同一个服务器上启多个Redis实例，实例个数最好和CPU个数相同。 master在做数据备份的时候好像会启动另外一个cpu，也就是说这时会有两个cpu在处理了。 5.为了Master的稳定性，主从复制不要用图状结构，用单向链表结构更稳定，即主从关系为：Master<--Slave1<--Slave2<--Slave3.......，这样做也方便实现Slave对Master的替换，也即，如果Master挂了，可以立马启用Slave1做Master，其他不变。个人觉得这个得看场景。一个节点挂掉，后面的都挂了。。。。今天暂时写这么多吧，要睡觉了，以后再补充。
返回顶楼	回帖地址 0 0 请登录后投票

温柔一刀等级: 性别: 文章: 801 积分: 1192 来自: 上海	发表时间：2012-07-04 wangqj 写道不用redis做数据库的话，只做缓存用的话，master-slave就没必要了吧，不如节省点空间，多起几个服务，把数据切分一下。本身故障率就不大 Sharding并不一定提高性能，如果数据量不大没有必要做Sharding，如果只做缓存的化，可以不用持久化数据。
返回顶楼	回帖地址 0 0 请登录后投票

温柔一刀等级: 性别: 文章: 801 积分: 1192 来自: 上海	发表时间：2012-07-04 islandhn 写道 5.为了Master的稳定性，主从复制不要用图状结构，用单向链表结构更稳定，即主从关系为：Master<--Slave1<--Slave2<--Slave3.......，这样做也方便实现Slave对Master的替换，也即，如果Master挂了，可以立马启用Slave1做Master，其他不变。个人觉得这个得看场景。一个节点挂掉，后面的都挂了。。。。恩，这个主要是解决Master挂了的问题，Slave挂了很容易可以恢复，Master挂了如果数据量大恢复的时间就比较长。
返回顶楼	回帖地址 0 0 请登录后投票

islandhn 等级: 初级会员性别: 文章: 3 积分: 60 来自: 北京	发表时间：2012-07-06 温柔一刀写道 islandhn 写道 5.为了Master的稳定性，主从复制不要用图状结构，用单向链表结构更稳定，即主从关系为：Master<--Slave1<--Slave2<--Slave3.......，这样做也方便实现Slave对Master的替换，也即，如果Master挂了，可以立马启用Slave1做Master，其他不变。个人觉得这个得看场景。一个节点挂掉，后面的都挂了。。。。恩，这个主要是解决Master挂了的问题，Slave挂了很容易可以恢复，Master挂了如果数据量大恢复的时间就比较长。我觉得应该图状结构更好，可以有多个slave，有的专门用来做只读操作，有的用来做持久化
返回顶楼	回帖地址 0 0 请登录后投票

jiangzhouyun 等级: 初级会员性别: 文章: 54 积分: 30 来自: 杭州	发表时间：2012-07-06 温柔一刀写道 wangqj 写道不用redis做数据库的话，只做缓存用的话，master-slave就没必要了吧，不如节省点空间，多起几个服务，把数据切分一下。本身故障率就不大 Sharding并不一定提高性能，如果数据量不大没有必要做Sharding，如果只做缓存的化，可以不用持久化数据。做缓存，多服务，Sharding也是必须的，不过Sharding所带来的一致性，容错等处理要做好。
返回顶楼	回帖地址 0 0 请登录后投票

finallygo 等级: 初级会员性别: 文章: 393 积分: 40 来自: 厦门-->北京	发表时间：2012-07-07 我想问楼主,如果要写内存快照的时候,你说会阻塞主线程的工作,这个时候客户端是不是会出现连接超时的异常呢??还有就是为什么会阻塞主线程呢,我看好像多出了一个线程单独处理呀,难道和java虚拟机的垃圾回收机制一样,需要那个时候数据是不可以动的???
返回顶楼	回帖地址 0 0 请登录后投票

温柔一刀等级: 性别: 文章: 801 积分: 1192 来自: 上海	发表时间：2012-07-07 最后修改：2012-07-07 finallygo 写道我想问楼主,如果要写内存快照的时候,你说会阻塞主线程的工作,这个时候客户端是不是会出现连接超时的异常呢??还有就是为什么会阻塞主线程呢,我看好像多出了一个线程单独处理呀,难道和java虚拟机的垃圾回收机制一样,需要那个时候数据是不可以动的??? 客户端会出现拿不到资源异常，不会阻塞Redis主线程，是磁盘io阻塞导致主线程无法处理写入请求
返回顶楼	回帖地址 0 0 请登录后投票

论坛首页 → Java企业应用版

跳转论坛: