Redis的其他操作

一、Redis发布订阅

1、概念

Redis发布订阅(pub/sub)是一种消息通信模式:发送者(pub)发送消息,订阅者(sub)接收消息。微博、微信、关注系统。

Redis客户端可以订阅任意数量的频道。

订阅/发布消息图:

第一个:消息发送者、第二个:频道、第三个:消息订阅者。

image-20201022124700946

下图展示了频道channel1,以及订阅这个频道的三个客户端--client2、client5、client1之间的关系。

image-20201022152049348

当有新消息通过publish命令发送给频道channel1时,这个消息就会被发送给订阅它的三个客户端。

image-20201022152225876

2、命令

这些命令被广泛用于构建即时通信应用,比如网络聊天室和实时广播,实时提醒等。

image-20201022153118232

3、测试

# 订阅端
127.0.0.1:6379> SUBSCRIBE nongyanxia # 1、订阅一个名叫nongyanxia的频道
Reading messages... (press Ctrl-C to quit)
1) "subscribe"
2) "nongyanxia"
3) (integer) 1
# 3、实时接收到消息
1) "message" 
2) "nongyanxia" # 订阅的频道
3) "hello,nongyanxia" # 消息的具体内容
1) "message"
2) "nongyanxia"
3) "hello,yuhuangye"

# 发布端
127.0.0.1:6379> PUBLISH nongyanxia "hello,nongyanxia" # 2、重新打开一个窗口向nongyanxia频道发送消息。
(integer) 1
127.0.0.1:6379> PUBLISH nongyanxia "hello,yuhuangye"
(integer) 1

使用场景:

1、实时消息系统。

2、实时聊天。

3、订阅、关注系统。

稍微复杂的场景就会使用消息中间件MQ。

二、Redis主从复制

1、概念

主从复制,是指将一台Redis服务器的数据,复制到其他的Redis服务器,前者称为主节点(master/leader),后者称为从节点(slave/follower);数据的复制是单向的,只能从主节点到从节点。Master以写为主,Slave以读为主。

默认情况下,每台Redis服务器都是主节点,且一个主节点可以有多个从节点,或者没有从节点,但一个从节点只能有一个主节点。

主从复制的作用主要包括:

1、数据冗余:主从复制实现了数据的热备份,是持久化之外的一种数据冗余方式。

2、故障恢复:当主节点出现问题时,可以由从节点提供服务,实现快速的故障恢复,实际上是一种服务的冗余。

3、负载均衡:在主从复制的基础上,配合读写分离,可以由主节点提供写服务,由从节点提供读服务(即写Redis数据时应用连接主节点,读Redis数据时应用连接从节点),分担服务器负载;尤其是在写少读多的情况下,通过多个节点分担读负载,可以大大提高Redis服务器的并发量。

4、高可用基石:除了上述作用外,主从复制还是哨兵和集群能够实施的基础,因此说主从复制是Redis高可用的基础。

image-20201023084748498

主从复制,读写分离。80%的情况下都是在进行读操作,减缓服务器的压力,架构中经常使用。一主二从。

2、环境配置

只配置从库,不用配置主库。

127.0.0.1:6379> info replication # 查看当前库的信息
# Replication
role:master # 角色 master
connected_slaves:0 # 从机: 0
master_replid:4f9c4beba962e9124b4cacf1e93f873557e41dcd
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:0
second_repl_offset:-1
repl_backlog_active:0
repl_backlog_size:1048576
repl_backlog_first_byte_offset:0
repl_backlog_histlen:0

复制三个配置文件,然后修改对应的信息

1、端口号

2、pid名字

3、日志名字

4、rdb的文件名字

修改完毕之后启动三个redis服务

image-20201023135733648

注意:如果redis的主机设置了密码,需要在从机的config文件中进行配置对从机的config文件中的masterauth位置进行配置

masterauth  youpassword

3、一主二从

默认情况下,每台redis服务器都是主机,一般情况下只用配置从机就好了。一主(79)二从(80、81)

127.0.0.1:6380> SLAVEOF 127.0.0.1 6379 # SLAVEOF host port 找谁当主机
OK
127.0.0.1:6380> info replication
# Replication
role:slave # 从机
master_host:127.0.0.1 # 主机信息
master_port:6379
master_link_status:up
master_last_io_seconds_ago:2
master_sync_in_progress:0
slave_repl_offset:462
slave_priority:100
slave_read_only:1
connected_slaves:0
master_replid:32b0efaf64700f0eb2f0aa347f2c48733351a4f1
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:462
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:462

# 在主机中查看
127.0.0.1:6379> info replication
# Replication
role:master
connected_slaves:1 # 从机数量
slave0:ip=127.0.0.1,port=6380,state=online,offset=14,lag=0 # 从机信息
master_replid:32b0efaf64700f0eb2f0aa347f2c48733351a4f1
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:14
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:14

如果两个都配置完了,那么就有两个从机了。

image-20201023142325402

真实的主从配置应该在配置文件中配置,这样的话是永久的,我们使用命令时暂时的。

4、细节

主机可以写,从机不能写只能读!主机中的所有信息和数据,都会自动被从机保存

主机写:

image-20201023143006409

从机只能读:

image-20201023143017065

测试:

主机断开连接,从机依旧是连接到主机的,但是没有写操作了,这个时候,如果主机回来了,从机依旧可以直接获取到主机写的信息。

如果是使用命令行来配置的从机,这个时候从机重启后便会变成从机。只要变回从机,立马就会从主机中获取值!

5、复制原理

Slave启动成功连接到master后会发送一个sync命令

Master接到命令后,启动后台的存盘进程,同时收集所有接收到的用于修改数据集的命令,在后台执行完毕之后,master将传送整个数据文件到slave,并完成一次完全同步。

全量复制:而slave服务在接收到数据库文件数据后,将其存盘并加载到内存中。

增量复制:Master继续将新的所有收集到的修改命令依次传给slave,完成同步。

但是只要重新连接master,一次完全同步(全量复制)将被自动执行。

6、层层链路

上一个master连接下一个slave

image-20201023145632323

这时候也可以完成主从复制。

如果主机宕机了,这个时候能不能选择一个主机出来呢?在哨兵模式出来之前,我们可以手动配置主机。

127.0.0.1:6380> SLAVEOF no one # 将自己变成主机,然后其他的节点就可以手动连接到这个新的主机。(手动)
OK
127.0.0.1:6380> info replication
# Replication
role:master
connected_slaves:1
slave0:ip=127.0.0.1,port=6381,state=online,offset=3818,lag=0
master_replid:61afaa6fffdc5a5bbf533fe3a39f87a9f5681f71
master_replid2:32b0efaf64700f0eb2f0aa347f2c48733351a4f1
master_repl_offset:3818
second_repl_offset:3819
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:3818

7、哨兵模式

参考博客:https://www.jianshu.com/p/06ab9daf921d

(自动选举主机的模式)

主从切换技术的方法是:当主服务器宕机后,需要手动把一台从服务器切换为主服务器,这就需要人工干预,费事费力,还会造成一段时间内服务不可用。这不是一种推荐的方式,更多时候,我们优先考虑哨兵模式。Redis从2.8开始正式提供了Sentinel(哨兵)架构来解决这个问题。

哨兵模式是一种特殊的模式,首先Redis提供了哨兵的命令,哨兵是一个独立的进程,作为进程,它会独立运行。其原理是哨兵通过发送命令,等待Redis服务器响应,从而监控运行的多个Redis实例。

image-20201023151108686

这里的哨兵有两个作用

  • 通过发送命令,让Redis服务器返回监控其运行状态,包括主服务器和从服务器。
  • 当哨兵监测到master宕机,会自动将slave切换成master,然后通过发布订阅模式通知其他的从服务器,修改配置文件,让它们切换主机。

然而一个哨兵进程对Redis服务器进行监控,可能会出现问题,为此,我们可以使用多个哨兵进行监控。各个哨兵之间还会进行监控,这样就形成了多哨兵模式。

image-20201023151633271

用文字描述一下故障切换(failover)的过程。假设主服务器宕机,哨兵1先检测到这个结果,系统并不会马上进行failover过程,仅仅是哨兵1主观的认为主服务器不可用,这个现象成为主观下线。当后面的哨兵也检测到主服务器不可用,并且数量达到一定值时,那么哨兵之间就会进行一次投票,投票的结果由一个哨兵发起,进行failover操作。切换成功后,就会通过发布订阅模式,让各个哨兵把自己监控的从服务器实现切换主机,这个过程称为客观下线。这样对于客户端而言,一切都是透明的。

测试:

我们目前的状态是一主二从

1、配置哨兵配置文件 sentinel.conf

# 禁止保护模式
protected-mode no
# 配置监听的主服务器,这里sentinel monitor代表监控,mymaster代表服务器的名称,可以自定义,127.0.0.1代表监控的主服务器,6379代表端口,2代表只有两个或两个以上的哨兵认为主服务器不可用的时候,才会进行failover操作。
sentinel monitor myredis 127.0.0.1 6379 1
# sentinel author-pass定义服务的密码,mymaster是服务名称,123456是Redis服务器密码
# sentinel auth-pass <master-name> <password>
sentinel auth-pass myredis 529122

后面的这个数字 1 ,代表主机挂了,从机投票看让谁接替成为主机,票数最多的就会成为主机。

2、启动哨兵

[root@izwz946byjjeib859u0izez bin]# ./redis-sentinel gconfig/sentinel.conf  # 启动命令
12142:X 23 Oct 2020 15:37:18.284 # oO0OoO0OoO0Oo Redis is starting oO0OoO0OoO0Oo
12142:X 23 Oct 2020 15:37:18.284 # Redis version=5.0.7, bits=64, commit=00000000, modified=0, pid=12142, just started
12142:X 23 Oct 2020 15:37:18.284 # Configuration loaded
                _._                                                  
           _.-``__ ''-._                                             
      _.-``    `.  `_.  ''-._           Redis 5.0.7 (00000000/0) 64 bit
  .-`` .-```.  ```\/    _.,_ ''-._                                   
 (    '      ,       .-`  | `,    )     Running in sentinel mode
 |`-._`-...-` __...-.``-._|'` _.-'|     Port: 26379
 |    `-._   `._    /     _.-'    |     PID: 12142
  `-._    `-._  `-./  _.-'    _.-'                                   
 |`-._`-._    `-.__.-'    _.-'_.-'|                                  
 |    `-._`-._        _.-'_.-'    |           http://redis.io        
  `-._    `-._`-.__.-'_.-'    _.-'                                   
 |`-._`-._    `-.__.-'    _.-'_.-'|                                  
 |    `-._`-._        _.-'_.-'    |                                  
  `-._    `-._`-.__.-'_.-'    _.-'                                   
      `-._    `-.__.-'    _.-'                                       
          `-._        _.-'                                           
              `-.__.-'                                               

12142:X 23 Oct 2020 15:37:18.288 # Sentinel ID is dbdcbe8cf6702e006f2d6c40421cc3473318d2bd
12142:X 23 Oct 2020 15:37:18.288 # +monitor master myredis 127.0.0.1 6379 quorum 1
12142:X 23 Oct 2020 15:37:18.289 * +slave slave 127.0.0.1:6380 127.0.0.1 6380 @ myredis 127.0.0.1 6379
12142:X 23 Oct 2020 15:37:18.292 * +slave slave 127.0.0.1:6381 127.0.0.1 6381 @ myredis 127.0.0.1 6379

如果Master节点断开了,这个时候就会从从机中随机选择一个服务器(这里面有自己的算法)

哨兵日志:

image-20201023154200774

如果主机此时回来了,只能归并到新的主机下,变成从机,这就是哨兵模式的规则。

哨兵模式

优点:

1、哨兵集群,基于主从复制模式,所有的主从配置优点,它全都有。

2、主从可以切换,故障可以转移,系统的可用性就会更好

3、哨兵模式就是主从模式的升级,从手动到自动,更加方便

缺点:

1、redis不好在线扩容,集群容量一旦到达上限,在线扩容就十分麻烦

2、实现哨兵模式的配置其实是很麻烦的,里面有很多选择。

哨兵模式的其他配置:

image-20201023155231974

sentinel down-after-milliseconds配置项只是一个哨兵在超过规定时间依旧没有得到响应后,会自己认为主机不可用。对于其他哨兵而言,并不是这样认为。哨兵会记录这个消息,当拥有认为主观下线的哨兵达到sentinel monitor所配置的数量时,就会发起一次投票,进行failover,此时哨兵会重写Redis的哨兵配置文件,以适应新场景的需要。

三、Redis缓存穿透与雪崩

1、缓存穿透(查不到)

1.1、概念

缓存穿透的概念很简单,用户想要查询一个数据,发现redis内存数据库没有,也就是缓存没有命中,于是向持久层数据库查询。发现也没有,于是本次查询失败。当用户很多的时候,缓存都没有命中,于是都去请求了持久层数据库。这会给持久层数据库造成很大的压力,这时候就相当于出现了缓存穿透。

1.2、解决方案:

布隆过滤器

布隆过滤器是一种数据结构,对所有可能查询的参数以hash的形式存储,在控制层先进行校验,不符合则丢弃,从而避免了对底层存储系统的查询压力。

image-20201023173957316

缓存空对象

当存储层不命中后,即使返回的空对象也将其缓存起来,同时会设置一个过期时间,之后再访问这个数据将会从缓存中获取,保护了后端数据源。

image-20201023174302940

但是这种方法会存在两个问题:

1、如果空值能够被缓存起来,这就意味着缓存需要更多的空间存储更多的键,因为这当中可能会有很多空值的键;

2、即使对空值设置了过期时间,还是会存在缓存层和存储层的数据会有一段时间窗口的不一致,这对需要保持一致性的业务会有影响。

2、缓存击穿(量太大,缓存过期)

例如:微博服务器宕机(热搜)

2.1、概念

这里需要注意和缓存穿透的区别,缓存击穿,是指一个key非常热点,在不停的扛着大并发,大并发集中对这一个点进行访问,当这个key在失效的瞬间,持续的大并发就穿破缓存,直接请求数据库,就像在一个屏障上凿开了一个洞。

当某个key在过期的瞬间,有大量的请求并发访问,这类数据一般是热点数据,由于缓存过期,会同时访问数据库来查询最新数据,并且写回缓存,会导致数据库瞬间压力过大。

2.2、解决方案

设置热点数据永不过期

从缓存层面看,没有设置过期时间,所以不会出现热点key过期后产生的问题。

使用互斥锁(mutex key)

业界比较常用的做法,是使用mutex。简单地来说,就是在缓存失效的时候(判断拿出来的值为空),不是立即去load db,而是先使用缓存工具的某些带成功操作返回值的操作(比如Redis的SETNX或者Memcache的ADD)去set一个mutex key,当操作返回成功时,再进行load db的操作并回设缓存;否则,就重试整个get缓存的方法。

3、缓存雪崩

3.1、概念

缓存雪崩是指,缓存层出现了错误,不能正常工作了。于是所有的请求都会达到存储层,存储层的调用量会暴增,造成存储层也会挂掉的情况。

image-20201023180059556

3.2、解决方案

redis高可用

这个思想的含义是,既然redis有可能挂掉,那我多增设几台redis,这样一台挂掉之后其他的还可以继续工作,其实就是搭建的集群。

限流降级

这个解决方案的思想是,在缓存失效后,通过加锁或者队列来控制读数据库写缓存的线程数量。比如对某个key只允许一个线程查询数据和写缓存,其他线程等待。

数据预热

数据加热的含义就是在正式部署之前,我先把可能的数据先预先访问一遍,这样部分可能大量访问的数据就会加载到缓存中。在即将发生大并发访问前手动触发加载缓存不同的key,设置不同的过期时间,让缓存失效的时间点尽量均匀。

Q.E.D.