huorongbj

浏览: 21347 次

最近访客更多访客>>

dove19900520

wd1282988143

abc123

morningking

博主相关

博客

微博

相册

留言

关于我

文章分类

全部博客 (38)

社区版块

存档分类

分布式系统关注点(18)——「缓存穿透」和「缓存雪崩」到底啥区别？

分布式分布式系统缓存分布式缓存缓存设计

如果第二次看到我的文章，欢迎文末扫码订阅我的个人公众号（跨界架构师）哟~

本文长度为2805字，建议阅读8分钟。

坚持原创，每一篇都是用心之作～

有句话说得好，欲要使其毁灭，先要使其疯狂。当你沉浸在缓存所带来的系统tps飙升的喜悦中时，使你系统毁灭的种子也已经埋在其中。

而且，你所承载的tps越高，它所带来的毁灭性更大。

在前两篇《360°全方位解读「缓存」》和《先写DB还是「缓存」？》中，我们已经对缓存有了一定的认识，并且知道了关于缓存相关的「一致性」问题的最佳实践。

这次，我们就来聊聊隐藏在缓存中的毁灭性种子是什么？

我们从前一篇文章《先写DB还是「缓存」？》中多次提到的「cache miss」说起。

缓存雪崩

在前一篇文章《先写DB还是「缓存」？》中，我们多次提到了「cache miss」这个词，利用「cache miss」来更好的保障DB和缓存之间的数据一致性。

然而，任何事物都是有两面性的，「cache miss」在提供便利的同时，也带来了一个潜在风险。

这个风险就是「缓存雪崩」。

在图中的第二步，大量的请求并发进入，这里的一次「cache miss」就有可能导致产生「缓存雪崩」。

不过，虽然「cache miss」会产生「缓存雪崩」，但「缓存雪崩」并不仅仅产生于「cache miss」。

雪崩一词源于「雪崩效应」，是指像「多米勒骨牌」这样的级联反应。前面没顶住，导致影响后面，如此蔓延。（关于对应雪崩的方式参考之前的文章，文末放链接）

所以「缓存雪崩」的根本问题是：缓存由于某些原因未起到预期的缓冲效果，导致请求全部流转到数据库，造成数据库压力过重。

因此，流量激增、高并发下的缓存过期、甚至缓存系统宕机都有可能产生「缓存雪崩」问题。

怎么解决这个问题呢？宕机可以通过做高可用来解决（可以参考之前的文章，文末放链接）。而在“流量激增”、“高并发下的缓存过期”这两种场景下，也有两种方式可以来解决。

加锁排队

通过加锁或者排队机制来限制读数据库写缓存的线程数量。比如，下面的伪代码就是对某个key只允许一个线程进入的效果。

key = "aaa"；

var cacheValue = cache.read(key);
if (cacheValue != null) {
    return cacheValue;
}
else {
    lock(key) {
        cacheValue = cache.read(key);
        if (cacheValue != null) {
            return cacheValue;
        } 
        else {
            cacheValue = db.read(key);
            cache.set(key,cacheValue);
        }
    }
    return cacheValue;
}

这个比较好理解，就不废话了。

缓存时间增加随机值

这个主要针对的是「缓存定时过期」机制下的取巧方案。它的目的是避免多个缓存key在同一时间失效，导致压力更加集中。

比如，你有10个key，他们的过期时间都是30分钟的话，那么30分钟后这10个key的所有请求会同时流到db去。

而这里说的这种方式就是将这10个key的过期时间打乱，比如设置成25、26、27、...、34分的过期时间，这样压力就被分散了，每分钟只有一个key过期。

最简单粗暴的方式就是在设置「过期时间」的时候加一个随机数字。

cache.set(key,cacheValue,30+random())

总体来看，相比后者，前者的适用面更广，所以Z哥建议你用「加锁排队」作为默认的通用方案不失为一个不错的选择。

「缓存穿透」、「缓存雪崩」傻傻分不清楚？

如果你听说过「缓存穿透」的话，可能会问：「缓存雪崩」和「缓存穿透」一样吗？

从产生的效果上看是一样的，但是过程不同。

来举个例子。例子纯属虚构，别太在意合理性～

在一个方圆一万里的地区内，只有一个修手机的老师傅。他收了一个徒弟，希望徒弟能帮他分担掉一部分的工作压力。这里的老师傅可以看作是DB，徒弟看作是缓存。

老师傅对徒弟说，如果遇到你不会做的事你来请教我。

然后，一个客户过来说要修一下他的卫星电话，徒弟去请教老师傅，老师傅说他也不会，先拒绝了吧。

但是由于没告诉他后续遇到修卫星电话的人该怎么做，所以后续这个客户一直来问，徒弟每次都又去请教老师傅。最终，在修卫星电话这件事上，徒弟并没有帮老师傅缓解任何的压力，快被烦死了。

上面这个故事就好比「缓存穿透」。

而「缓存雪崩」则是，由于徒弟年轻力壮，精力充沛，1小时能修20个手机，老师傅只能修10个（但是手艺好，更考究）。

然后，有一天徒弟请假了，但恰巧这天来了2000个修手机的，老师傅修不过来就被累垮了。

所以，「缓存穿透」和「缓存雪崩」最终产生的效果是一样的，就是因为大量请求流到DB后，把DB拖垮（正如前面故事中的老师傅）。

两者最大的不同在于，「缓存雪崩」问题只要数据从db中找到并放入缓存就能恢复正常（徒弟休假归来），而「缓存穿透」指的是所需的数据在DB中一直不存在的情况（老师傅也不会修）。并且，由于DB中数据不存在，所以自然每次从缓存中也找不到（徒弟也不会修）。

清楚了两者的区别之后，我们下面就来聊聊「缓存穿透」的常见应对方式。

缓存穿透

「缓存穿透」有时也叫做「缓存击穿」，产生的逻辑过程是这样，一直在虚线范围内流转。

在这种场景下，缓存的作用完全失效，每次请求都“穿透”到了DB中。

可能你会想，为什么会存在大量的这种db中数据不存在的情况呢？其实，任何依赖外部参数进行查询的地方都可能有这个问题的存在。比如，一个文本输入框，本来是让你输入用户名的，但是手误输入了密码，自然就找不到数据咯。更主要的问题是，会有恶意分子利用这种机制来对你的系统进行攻击，击穿缓存搞垮你的数据库，导致整个系统全面瘫痪。

同样也有两种方式来解决这个问题。

布隆过滤器（bloomfilter）

布隆过滤器就是由一个很长的二进制向量和一系列随机映射函数组成，将确定不存在的数据构建到过滤器中，用它来过滤请求。这里就放个图，具体就不展开了，后续我们再聊（有兴趣的可以先到搜索引擎搜《Space time trade-offs in hash coding with allowable errors》找到bloom的原始论文）。

实现代码其实并不很复杂，参考论文或者网上其他作者的一些实现就可以写出来。

不过，布隆过滤器有一个最大的缺点，也是其为了高效利用内存而付出的代价，就是无法确保100%的准确率。

所以，如果你的场景要求是100%准确的，就只能用下面这种方式了。

缓存空对象

其实就是哪怕从db中取出的数据是“空（null）”，也把它丢失到缓存中。

这样一来，虽然缓存中存在着一个value为空的数据，但是至少他能表示“数据库里也没有不用找了”。

其实这个思路和布隆过滤器有些类似，但是它对内存的消耗会大很多，毕竟布隆过滤器是利用的bit位来存储。不过这种方式的优势是前面提到的，不会出现误差，而布隆过滤器的错误率会随着「位数」的增加而减少，会不断趋近于0，但不会为0。

总结

好了，我们一起总结一下。

这次呢，Z哥主要和你聊了隐藏在缓存中的两颗具有“毁灭性”的种子，「缓存雪崩」和「缓存穿透」，以及应对这两颗种子的常用方式。

而且，顺便帮你区分清楚了「缓存雪崩」和「缓存穿透」的差异。

希望对你有所启发。

作者：Zachary

出处：https://www.cnblogs.com/Zachary-Fan/p/destroyseed.html

如果你喜欢这篇文章，可以下方扫码关注我的个人「原创」公众号哦。

▶关于作者：张帆（Zachary，个人微信号：Zachary-ZF）。坚持用心打磨每一篇高质量原创。欢迎扫描下方的二维码~。

定期发表原创内容：架构设计丨分布式系统丨产品丨运营丨一些思考。

如果你是初级程序员，想提升但不知道如何下手。又或者做程序员多年，陷入了一些瓶颈想拓宽一下视野。欢迎关注我的公众号「跨界架构师」，回复「技术」，送你一份我长期收集和整理的思维导图。

如果你是运营，面对不断变化的市场束手无策。又或者想了解主流的运营策略，以丰富自己的“仓库”。欢迎关注我的公众号「跨界架构师」，回复「运营」，送你一份我长期收集和整理的思维导图。

0
顶

0
踩

分享到：

分布式系统关注点(19)——深入浅出「异步」 | 分布式系统关注点——先写DB还是「缓存」？

2019-04-25 10:15
浏览 857
评论(0)
分类:企业架构
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

大型分布式网站架构设计与实践.rar: 书中会详细讨论缓存的一致性策略，例如强一致性与最终一致性，以及如何在分布式环境中解决缓存穿透、缓存雪崩等问题。接下来，数据库的分布式设计也是重点内容。随着数据量的增加，单机数据库的性能瓶颈逐渐显现，...

大厂面试题，面经分享，进大厂必备: 2. **缓存**：了解Redis或Memcached的使用，理解缓存穿透、缓存雪崩等问题。 3. **数据库**：熟悉SQL语言，理解关系型数据库（如MySQL）的基本原理和优化技巧。 4. **消息队列**：理解消息中间件如RabbitMQ或Kafka的...

Java面试解析总结：Java+Redis+数据库+解决方案+分布式...docx: 而AOP（Aspect Oriented Programming，面向切面编程）则是一种编程范式，用于模块化横向关注点。 - **Spring Bean生命周期**：Spring容器负责管理Bean的生命周期，从创建、初始化到销毁。理解这些阶段有助于更好地...

三电平SVPWM模型的Matlab仿真及其在逆变器性能优化中的应用: 内容概要：本文详细介绍了三电平SVPWM模型在Matlab中的搭建与研究，重点探讨了三电平逆变器的工作原理、性能特点以及参数优化方法。文中不仅解释了三电平逆变器相较于传统两电平逆变器的优势，如更高的电压分辨率和更低的谐波失真，还深入讨论了SVPWM控制策略的具体实现步骤，包括扇区划分、中性点电压平衡、死区时间和波形生成等关键环节。此外，文章还强调了仿真与实际应用之间的差异，指出仿真只是调试的起点而非终点。适合人群：从事电力电子、自动化控制领域的研究人员和技术人员，尤其是对逆变器建模和仿真相关工作的从业者。使用场景及目标：适用于需要深入了解三电平逆变器特性和优化控制策略的研究项目，旨在帮助读者掌握基于Matlab的三电平SVPWM模型构建技巧，从而更好地进行逆变器性能评估和改进。其他说明：文章提供了大量实用的Matlab代码片段，便于读者理解和实践。同时提醒读者关注仿真与现实应用间的细微差别，确保理论成果能够顺利转化为实际效益。

spring-boot-2.3.9.RELEASE.jar中文文档.zip: # 压缩文件中包含：中文文档 jar包下载地址 Maven依赖 Gradle依赖源代码下载地址 # 本文件关键字： jar中文文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压最外层zip，再解压其中的zip包，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件；

水利规范-7p倒虹吸工程及渠道防渗衬砌设计图集.zip: 水利规范-7p倒虹吸工程及渠道防渗衬砌设计图集.zip

JAVAWeb外文文献毕业设计样本.doc: JAVAWeb外文文献毕业设计样本.doc

scratch少儿编程逻辑思维游戏源码-我的世界冒险通过 V5.zip: scratch少儿编程逻辑思维游戏源码-我的世界冒险通过 V5.zip

scratch少儿编程逻辑思维游戏源码-星之卡比动画.zip: scratch少儿编程逻辑思维游戏源码-星之卡比动画.zip

spring-data-redis-1.1.0.RELEASE.jar中文-英文对照文档.zip: # 压缩文件中包含：中文-英文对照文档 jar包下载地址 Maven依赖 Gradle依赖源代码下载地址 # 本文件关键字： jar中文-英文对照文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压最外层zip，再解压其中的zip包，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件；

scratch少儿编程逻辑思维游戏源码-我的世界构建像素立方体.zip: scratch少儿编程逻辑思维游戏源码-我的世界构建像素立方体.zip

spring-boot-2.5.1.jar中文文档.zip: # 压缩文件中包含：中文文档 jar包下载地址 Maven依赖 Gradle依赖源代码下载地址 # 本文件关键字： jar中文文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压最外层zip，再解压其中的zip包，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件；

scratch少儿编程逻辑思维游戏源码-仙人掌内战.zip: scratch少儿编程逻辑思维游戏源码-仙人掌内战.zip

scratch少儿编程逻辑思维游戏源码-贪食蛇.zip: scratch少儿编程逻辑思维游戏源码-贪食蛇.zip

rocksdbjni-6.29.4.jar中文-英文对照文档.zip: # 压缩文件中包含：中文-英文对照文档 jar包下载地址 Maven依赖 Gradle依赖源代码下载地址 # 本文件关键字： jar中文-英文对照文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压最外层zip，再解压其中的zip包，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件；

spring-boot-1.3.6.RELEASE.jar中文-英文对照文档.zip: # 压缩文件中包含：中文-英文对照文档 jar包下载地址 Maven依赖 Gradle依赖源代码下载地址 # 本文件关键字： jar中文-英文对照文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压最外层zip，再解压其中的zip包，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件；

独家分享耗时3个月整理的开发者必备资源库 - 百度/迅雷/夸克三端同步更新: 复制链接到浏览器打开即可，https://link3.cc/diwangluo

基于Matlab的水果识别程序：融合图像处理与深度学习技术: 内容概要：本文详细介绍了使用Matlab编写的水果识别程序。首先简述了人工智能和机器学习在水果识别领域的应用背景，强调了Matlab作为强大编程环境的优势。接着，文章逐步讲解了水果识别程序的具体实现流程，涵盖数据预处理、特征提取、模型训练以及最终的识别算法实现。每个环节都采用了先进的技术和方法，如图像去噪、大小调整、深度学习算法（特别是卷积神经网络CNN），并通过训练神经网络模型来提升识别精度。此外，还讨论了相关技术手段和技术挑战，展示了Matlab在图像处理和计算机视觉方面的强大能力。适合人群：对图像处理、机器学习感兴趣的科研人员、学生及工程师。使用场景及目标：适用于希望深入了解Matlab环境下水果识别程序的设计与实现的研究者；旨在帮助使用者掌握从数据准备到模型部署的一系列技能，为实际项目提供理论支持和技术指导。其他说明：文中不仅提供了详细的程序实现步骤，还对未来发展方向进行了展望，鼓励更多人参与到水果识别及相关领域的研究中。

rocksdbjni-6.16.4.jar中文文档.zip: # 压缩文件中包含：中文文档 jar包下载地址 Maven依赖 Gradle依赖源代码下载地址 # 本文件关键字： jar中文文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压最外层zip，再解压其中的zip包，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件；

西门子S7-300 PLC在汽车生产线自动化中的模块化编程与Profibus DP网络集成方案: 内容概要：本文介绍了西门子S7-300 PLC在某汽车生产线的应用，涵盖了从硬件配置到软件编程的各个方面。硬件部分包括300 CPU、TP700触摸屏、远程ET200站点和Profibus DP网络系统。软件部分涉及PLC程序、HMI界面、IO表和图纸。重点在于模块化编程方法，如模拟量采集、气缸控制、线体阻挡、延时控制和自动换班等功能块的集成。同时，文中提到压力值和位移传感器的数据采集，并通过触摸屏以曲线形式展示。此外，还讨论了梯形图、STL和SCL三种编程语言的混合使用，确保程序结构清晰且易于维护。最后强调了Profibus DP网络在各站点间数据传输中的重要作用。适合人群：从事工业自动化领域的工程师和技术人员，尤其是对PLC编程和Profibus DP网络有研究兴趣的人群。使用场景及目标：适用于汽车制造业及其他类似行业，旨在提高生产线的自动化程度和生产效率，确保产品质量。通过对S7-300 PLC的学习和应用，掌握模块化编程技巧和网络通信协议，优化生产线管理。阅读建议：读者可以通过本文深入了解S7-300 PLC的具体应用场景和技术细节，特别是模块化编程的优势和混合编程的实际操作。同时，关注Profibus DP网络的作用，理解其在网络架构中的重要地位。

最近访客 更多访客>>