分享

面试官:你简历上写着有分布式开发经验,怎么对缓存雪崩不了解?

 爱开发 2022-08-02 发布于广东

作为一名java程序员,关于缓存,求职面试时经常会遇到。

张工是一名java程序员,最近到某知名互联网公司面试,面试官提出这样的一个问题:

缓存穿透和缓存雪崩有什么区别?

对于缓存,张工平时只是简单知道怎么使用而已,并没有深入研究,对于分布式开发,也只是了解个大概,张工一时间没有回答上来,面试官:我看你简历写着有分布式开发经验,怎么连缓存雪崩都没有了解啊。

被面试官这么一说,张工有点不好意思了。

缓存是分布式系统中的重要组件,主要解决高并发,大数据场景下,热点数据访问的性能问题,提供高性能的数据快速访问。

缓存是走内存的,内存天然就支持高并发。其中缓存穿透、缓存击穿、缓存雪崩,是缓存的三大问题。

1、缓存穿透

用户想要查询一个数据,一般是先到缓存中查,要是查不到,也就是缓存没有命中,于是向持久层数据库查询。发现也没有,于是返回空,这本来没什么问题。

但要是用户很多的时候,缓存都没有命中,又都直接去请求数据库了,这会给数据库造成很大的压力。

例如。数据表id是自增长的, 从 1 开始的,用户发过来的请求 id 全部都是负数。这样的话,缓存中查不到,于是都去请求了持久层数据库,这会给数据库造成很大的压力。也就是缓存穿透。

解决方案:

每次从数据库中只要没查到,就写一个空值到缓存里去,比如 set -999 unknown(未知的)。然后设置一个过期时间,这样的话,下次有相同的 key 来访问的时候,在缓存失效之前,都可以直接从缓存中取数据。

2、缓存击穿

缓存击穿,就是说某个 key 非常热点,访问非常频繁,处于集中式高并发访问的情况,缓存同一时间大面积的失效了,大量的请求就击穿了缓存,从而导致所有请求都去查数据库,量大的话数据库分分钟钟就支撑不了。

那有什么解决方案,答案当然是肯定的。缓存击穿不同场景下的不同的解决方案:

  • 若缓存的数据基本不会更新的,可尝试将该热点数据设置为永不过期。
  • 若缓存的数据更新不频繁,且缓存刷新的整个流程耗时较少情况下,则可以采用基于 redis等分布式中间件的分布式互斥锁,或者本地互斥锁以保证仅少量的请求能请求数据库并重新构建缓存,其余线程则在锁释放后能访问到新缓存。
  • 若缓存的数据更新频繁或者缓存刷新的流程耗时较长情况下,可采用调度任务在缓存过期前主动的重新构建缓存或者延后缓存的过期时间,以保证所有的请求能一直访问到对应的缓存。

3、缓存雪崩


缓存雪崩是指,缓存层出现了异常,不能正常工作了。于是所有的请求都会达到存储层,存储层的调用量会暴增,造成存储层也会挂掉的情况。

对于系统 ,假设每天高峰期每秒 5000 个请求,本来缓存在高峰期可以扛住每秒 4000 个请求,但是缓存机器意外发生了全盘宕机。

缓存服务挂了,此时 1 秒 5000 个请求全部落数据库,数据库扛不住了,告警后就挂了。这种情况下,要是没有预备方案,会让人抓狂的。

这就是缓存雪崩。


缓存雪崩的事前事中事后的解决方案:
  • 事前:redis 高可用,主从+哨兵,redis cluster,避免全盘崩溃;
  • 事中:本地 ehcache 缓存 + hystrix 限流&降级,避免数据库支撑不了;
  • 事后:redis 持久化,一旦重启,自动从磁盘上加载数据,快速恢复缓存数据。

用户发送一个请求,系统收到请求后,先查本地 ehcache 缓存,如果查不到再去查 redis。如果 ehcache 和 redis 都没有, 再查数据库,将查到的结果写入 ehcache 和 redis 中。
限流组件,比如Sentinel,可以设置每秒的请求,有多少能通过组件,剩余的未通过的请求,怎么办?走降级,可以返回一些默认的值或者友情提示等。
这样做的好处有下面几点:
保证数据库不会挂,因为限流组件确保了每秒只能有多少个请求能通过。
只要数据库没有挂,就是说,对用户来说,有一部分的请求都是可以被处理的。
只要有一部分的请求可以被处理,就意味着系统还在正常运行,只是对用户来说,可能就需要等待,页面点击几次有可能刷不出来,但是多点几次,还是可以刷出来一次的,就是体验不是很友好。

总结:
关于缓存的使用,平时工作中要注意总结和积累,查漏补缺,不断完善自己的知识体系。
由于笔者水平有限,文中纰漏之处在所难免,权当抛砖引玉,不妥之处,请大家批评指正。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多