无盘复制的需求背景

redis在启动后自动生成一个唯一的标识符run_id，这个run_id在持久化的时候存在于RDB文件中（如果有启用RDB或者做了RBD备份操作），但是并不存在与AOF文件中（包括混合是持久化文件），如果下次重启从RDB加载数据，那么这个run_id可以保存。如果同时启用了RDB和AOF持久化，redis重启时会优先加载AOF文件，如果从AOF加载，那么这个run_id会重新生成。

redis复制环境下（不管是简单的主从复制，Sentinel，Cluster）主从节点之间依赖run_id做身份标识，当redis重启后，如果不是从RDB中加载的，其身份标识run_id会发生变化，当前实例相当于一个全新的节点，此时会进行一个全量的同步操作（比如从节点重启后，run_id发生了变化，从节点的身份会变为一个“全新的节点”，会向主节点做一次全量同步的请求），以从节点重启后run_id重新生成导致的全量同步步骤大概如下：

----》从节点请求全量同步

--------》主节点生成RDB文件到磁盘（主节点磁盘写操作）

----------》主节点发送RDB文件到从节点（主节点磁盘读操作）

------------》从节点接收主节点发送的RDB文件到本地磁盘（从节点磁盘写操作）

--------------》从节点接从本地接收的RDB文件到加载数据到磁盘（从节点磁盘读操作）

如果是主节点重启，从AOF中加载持久化的数据，那么会从节点会做类似的全量同步操作

可见全量同步过程中，会在主节点上经历一次磁盘写操作和一次磁盘读操作，从节点上经历一次磁盘写操作和磁盘读操作，如果磁盘速度跟不上，可能会拉长全量同步的时长，因此无盘同步的需求就出现了（假设节点间网络没有瓶颈）。

无盘复制过程

一个无盘复制的日志大概如下

从节点的日志

33300:S 06 Apr 2024 19:29:32.276 * Connecting to MASTER ***.***.***.***:***　　　　　　　　　　　　　　#从节点连接至主节点
33300:S 06 Apr 2024 19:29:32.276 * MASTER <-> REPLICA sync started
33300:S 06 Apr 2024 19:29:32.276 * Non blocking connect for SYNC fired the event.
33300:S 06 Apr 2024 19:29:32.276 * Master replied to PING, replication can continue...
33300:S 06 Apr 2024 19:29:32.277 * Partial resynchronization not possible (no cached master)　　　　#从节点重启后，run_id发生变化，作为一个新的从节点，需要做全量同步
33300:S 06 Apr 2024 19:29:37.953 * Full resync from master: f2ec97e11ec65d3e9ecdfd822b93905a9fac37a3:911741
33300:S 06 Apr 2024 19:29:37.958 * MASTER <-> REPLICA sync: receiving streamed RDB from master with EOF to parser #从节点从socket中接收主节点的全量RDB数据
33300:S 06 Apr 2024 19:29:37.958 * MASTER <-> REPLICA sync: Loading DB in memory
33300:S 06 Apr 2024 19:29:37.958 * Loading RDB produced by version 7.0.11
33300:S 06 Apr 2024 19:29:37.958 * RDB age 0 seconds
33300:S 06 Apr 2024 19:29:37.958 * RDB memory usage when created 62.40 Mb
33300:S 06 Apr 2024 19:30:25.667 * Done loading RDB, keys loaded: 191498, keys expired: 0.
33300:S 06 Apr 2024 19:30:25.667 * MASTER <-> REPLICA sync: Swapping active DB with loaded DB　　　　　　
33300:S 06 Apr 2024 19:30:25.667 * MASTER <-> REPLICA sync: Discarding old DB in background　　
33300:S 06 Apr 2024 19:30:25.667 * MASTER <-> REPLICA sync: Finished with success　　#从节点加载全量数据

主节点的日志

32489:M 06 Apr 2024 19:29:32.277 * Replica ***.***.***.***:*** asks for synchronization　　　　#从节点请求主节点做全量复制 32489:M 06 Apr 2024 19:29:32.277 * Full resync requested by replica ***.***.***.***:*** 32489:M 06 Apr 2024 19:29:32.277 * Delay next BGSAVE for diskless SYNC　　　　　　　　　　　　　　#主节点由于diskless复制，并没有做bgsave持久化操作 32489:M 06 Apr 2024 19:29:37.952 * Starting BGSAVE for SYNC with target: replicas sockets　　 #主节点以socket网络传送方式传递全量数据 32489:M 06 Apr 2024 19:29:37.954 * Background RDB transfer started by pid 33306 33306:C 06 Apr 2024 19:30:25.186 * Fork CoW for RDB: current 1 MB, peak 1 MB, average 1 MB 32489:M 06 Apr 2024 19:30:25.186 # Diskless rdb transfer, done reading from pipe, 1 replicas still up. 32489:M 06 Apr 2024 19:30:25.276 * Background RDB transfer terminated with success 32489:M 06 Apr 2024 19:30:25.276 * Streamed RDB transfer with replica ***.***.***.***:*** succeeded (socket). Waiting for REPLCONF ACK from slave to enable streaming 32489:M 06 Apr 2024 19:30:25.276 * Synchronization with replica ***.***.***.***:*** succeeded

当从节点以"swapdb"在加载数据的过程中（一边接收主节点socket数据一边载入当前实例中），当前实例不可访问

对于Redis集群模式，不管是sentinel还是cluster，主从节点的身份都是相对的，都可以在故障发生时做主从切换，因此如果想要实现无盘复制，这几个参数需要再主从节点同时配置。

repl-diskless-sync yes
repl-diskless-sync-delay 15
repl-diskless-sync-max-replicas 0 
repl-diskless-load disabled #如果有足够多的内存，使用swapdb

无盘复制注意事项

1，较小的数据没必要使用无盘复制，想对无盘复制，传统的复制是生成RDB文件到磁盘，然后传输RDB，这个RDB是经过高度压缩的，其体积并不会太大
2，基于1，如果磁盘性能较高，生成RDB文件的速度较快的话，在网络中传输一个较小的，经过压缩的RDB文件不一定会很慢
3，相比基于经过压缩的RDB复制，基于无盘复制需要传输整个内存中的RDB数据，是一个非压缩的数据集，期代价需要在网络中是传输较多的数据，要求网络性能较高，延迟较高的网络无法提现无盘复制的优势

无盘复制的需求背景

相关参数

影响主节点的参数

repl-diskless-sync

repl-diskless-sync-delay

repl-diskless-sync-max-replicas

影响从节点的参数

repl-diskless-load

无盘复制过程

无盘复制注意事项