1
0
wiki/docs/OpenSSH/rsync 命令.md
2023-06-28 11:56:51 +08:00

322 lines
13 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
id: rsync 命令
title: rsync 命令
sidebar_position: 8
data: 2022年4月13日
---
## 简介
rsync 是一个常用的 Linux 应用程序,用于文件同步。
它可以在本地计算机与远程计算机之间,或者两个本地目录之间同步文件(但不支持两台远程计算机之间的同步)。它也可以当作文件复制工具,替代`cp`和`mv`命令。
它名称里面的`r`指的是 remotersync 其实就是“远程同步”remote sync的意思。与其他文件传输工具如 FTP 或 scp不同rsync 的最大特点是会检查发送方和接收方已有的文件,仅传输有变动的部分(默认规则是文件大小或修改时间有变动)。
虽然 rsync 不是 SSH 工具集的一部分,但因为也涉及到远程操作,所以放在这里一起介绍。
## 安装
如果本机或者远程计算机没有安装 rsync可以用下面的命令安装。
```bash
# Debian
$ sudo apt-get install rsync
# Red Hat
$ sudo yum install rsync
# Arch Linux
$ sudo pacman -S rsync
```
注意,传输的双方都必须安装 rsync。
## 基本用法
rsync 可以用于本地计算机的两个目录之间的同步。下面就用本地同步举例,顺便讲解 rsync 几个主要参数的用法。
### `-r`参数
本机使用 rsync 命令时,可以作为`cp`和`mv`命令的替代方法,将源目录拷贝到目标目录。
```bash
rsync -r source destination
```
上面命令中,`-r`表示递归,即包含子目录。注意,`-r`是必须的,否则 rsync 运行不会成功。`source`目录表示源目录,`destination`表示目标目录。上面命令执行以后,目标目录下就会出现`destination/source`这个子目录。
如果有多个文件或目录需要同步,可以写成下面这样。
```bash
rsync -r source1 source2 destination
```
上面命令中,`source1`、`source2`都会被同步到`destination`目录。
### `-a`参数
`-a`参数可以替代`-r`,除了可以递归同步以外,还可以同步元信息(比如修改时间、权限等)。由于 rsync 默认使用文件大小和修改时间决定文件是否需要更新,所以`-a`比`-r`更有用。下面的用法才是常见的写法。
```bash
rsync -a source destination
```
目标目录`destination`如果不存在rsync 会自动创建。执行上面的命令后,源目录`source`被完整地复制到了目标目录`destination`下面,即形成了`destination/source`的目录结构。
如果只想同步源目录`source`里面的内容到目标目录`destination`,则需要在源目录后面加上斜杠。
```bash
rsync -a source/ destination
```
上面命令执行后,`source`目录里面的内容,就都被复制到了`destination`目录里面,并不会在`destination`下面创建一个`source`子目录。
### `-n`参数
如果不确定 rsync 执行后会产生什么结果,可以先用`-n`或`--dry-run`参数模拟执行的结果。
```bash
rsync -anv source/ destination
```
上面命令中,`-n`参数模拟命令执行的结果,并不真的执行命令。`-v`参数则是将结果输出到终端,这样就可以看到哪些内容会被同步。
### `--delete`参数
默认情况下rsync 只确保源目录的所有内容(明确排除的文件除外)都复制到目标目录。它不会使两个目录保持相同,并且不会删除文件。如果要使得目标目录成为源目录的镜像副本,则必须使用`--delete`参数,这将删除只存在于目标目录、不存在于源目录的文件。
```bash
rsync -av --delete source/ destination
```
上面命令中,`--delete`参数会使得`destination`成为`source`的一个镜像。
## 排除文件
### `--exclude`参数
有时,我们希望同步时排除某些文件或目录,这时可以用`--exclude`参数指定排除模式。
```bash
$ rsync -av --exclude='*.txt' source/ destination
# 或者
$ rsync -av --exclude '*.txt' source/ destination
```
上面命令排除了所有 TXT 文件。
注意rsync 会同步以“点”开头的隐藏文件,如果要排除隐藏文件,可以这样写`--exclude=".*"`。
如果要排除某个目录里面的所有文件,但不希望排除目录本身,可以写成下面这样。
```bash
rsync -av --exclude 'dir1/*' source/ destination
```
多个排除模式,可以用多个`--exclude`参数。
```bash
rsync -av --exclude 'file1.txt' --exclude 'dir1/*' source/ destination
```
多个排除模式也可以利用 Bash 的大扩号的扩展功能,只用一个`--exclude`参数。
```bash
rsync -av --exclude={'file1.txt','dir1/*'} source/ destination
```
如果排除模式很多,可以将它们写入一个文件,每个模式一行,然后用`--exclude-from`参数指定这个文件。
```bash
rsync -av --exclude-from='exclude-file.txt' source/ destination
```
### `--include`参数
`--include`参数用来指定必须同步的文件模式,往往与`--exclude`结合使用。
```bash
rsync -av --include="*.txt" --exclude='*' source/ destination
```
上面命令指定同步时,排除所有文件,但是会包括 TXT 文件。
## 远程同步
### SSH 协议
rsync 除了支持本地两个目录之间的同步,也支持远程同步。它可以将本地内容,同步到远程服务器。
```bash
rsync -av source/ username@remote_host:destination
```
也可以将远程内容同步到本地。
```bash
rsync -av username@remote_host:source/ destination
```
rsync 默认使用 SSH 进行远程登录和数据传输。
由于早期 rsync 不使用 SSH 协议,需要用`-e`参数指定协议,后来才改的。所以,下面`-e ssh`可以省略。
```bash
rsync -av -e ssh source/ user@remote_host:/destination
```
但是,如果 ssh 命令有附加的参数,则必须使用`-e`参数指定所要执行的 SSH 命令。
```bash
rsync -av -e 'ssh -p 2234' source/ user@remote_host:/destination
```
上面命令中,`-e`参数指定 SSH 使用2234端口。
### rsync 协议
除了使用 SSH如果另一台服务器安装并运行了 rsync 守护程序,则也可以用`rsync://`协议默认端口873进行传输。具体写法是服务器与目标目录之间使用双冒号分隔`::`。
```bash
rsync -av source/ 192.168.122.32::module/destination
```
注意,上面地址中的`module`并不是实际路径名,而是 rsync 守护程序指定的一个资源名,由管理员分配。
如果想知道 rsync 守护程序分配的所有 module 列表,可以执行下面命令。
```bash
rsync rsync://192.168.122.32
```
rsync 协议除了使用双冒号,也可以直接用`rsync://`协议指定地址。
```bash
rsync -av source/ rsync://192.168.122.32/module/destination
```
## 增量备份
rsync 的最大特点就是它可以完成增量备份,也就是默认只复制有变动的文件。
除了源目录与目标目录直接比较rsync 还支持使用基准目录,即将源目录与基准目录之间变动的部分,同步到目标目录。
具体做法是,第一次同步是全量备份,所有文件在基准目录里面同步一份。以后每一次同步都是增量备份,只同步源目录与基准目录之间有变动的部分,将这部分保存在一个新的目标目录。这个新的目标目录之中,也是包含所有文件,但实际上,只有那些变动过的文件是存在于该目录,其他没有变动的文件都是指向基准目录文件的硬链接。
`--link-dest`参数用来指定同步时的基准目录。
```bash
rsync -a --delete --link-dest /compare/path /source/path /target/path
```
上面命令中,`--link-dest`参数指定基准目录`/compare/path`,然后源目录`/source/path`跟基准目录进行比较,找出变动的文件,将它们拷贝到目标目录`/target/path`。那些没变动的文件则会生成硬链接。这个命令的第一次备份时是全量备份,后面就都是增量备份了。
下面是一个脚本示例,备份用户的主目录。
```bash
#!/bin/bash
# A script to perform incremental backups using rsync
set -o errexit
set -o nounset
set -o pipefail
readonly SOURCE_DIR="${HOME}"
readonly BACKUP_DIR="/mnt/data/backups"
readonly DATETIME="$(date '+%Y-%m-%d_%H:%M:%S')"
readonly BACKUP_PATH="${BACKUP_DIR}/${DATETIME}"
readonly LATEST_LINK="${BACKUP_DIR}/latest"
mkdir -p "${BACKUP_DIR}"
rsync -av --delete \
"${SOURCE_DIR}/" \
--link-dest "${LATEST_LINK}" \
--exclude=".cache" \
"${BACKUP_PATH}"
rm -rf "${LATEST_LINK}"
ln -s "${BACKUP_PATH}" "${LATEST_LINK}"
```
上面脚本中,每一次同步都会生成一个新目录`${BACKUP_DIR}/${DATETIME}`,并将软链接`${BACKUP_DIR}/latest`指向这个目录。下一次备份时,就将`${BACKUP_DIR}/latest`作为基准目录,生成新的备份目录。最后,再将软链接`${BACKUP_DIR}/latest`指向新的备份目录。
## 配置项
`-a`、`--archive`参数表示存档模式保存所有的元数据比如修改时间modification time、权限、所有者等并且软链接也会同步过去。
`--append`参数指定文件接着上次中断的地方,继续传输。
`--append-verify`参数跟`--append`参数类似,但会对传输完成后的文件进行一次校验。如果校验失败,将重新发送整个文件。
`-b`、`--backup`参数指定在删除或更新目标目录已经存在的文件时,将该文件更名后进行备份,默认行为是删除。更名规则是添加由`--suffix`参数指定的文件后缀名,默认是`~`。
`--backup-dir`参数指定文件备份时存放的目录,比如`--backup-dir=/path/to/backups`。
`--bwlimit`参数指定带宽限制,默认单位是 KB/s比如`--bwlimit=100`。
`-c`、`--checksum`参数改变`rsync`的校验方式。默认情况下rsync 只检查文件的大小和最后修改日期是否发生变化,如果发生变化,就重新传输;使用这个参数以后,则通过判断文件内容的校验和,决定是否重新传输。
`--delete`参数删除只存在于目标目录、不存在于源目标的文件,即保证目标目录是源目标的镜像。
`-e`参数指定使用 SSH 协议传输数据。
`--exclude`参数指定排除不进行同步的文件,比如`--exclude="*.iso"`。
`--exclude-from`参数指定一个本地文件,里面是需要排除的文件模式,每个模式一行。
`--existing`、`--ignore-non-existing`参数表示不同步目标目录中不存在的文件和目录。
`-h`参数表示以人类可读的格式输出。
`-h`、`--help`参数返回帮助信息。
`-i`参数表示输出源目录与目标目录之间文件差异的详细情况。
`--ignore-existing`参数表示只要该文件在目标目录中已经存在,就跳过去,不再同步这些文件。
`--include`参数指定同步时要包括的文件,一般与`--exclude`结合使用。
`--link-dest`参数指定增量备份的基准目录。
`-m`参数指定不同步空目录。
`--max-size`参数设置传输的最大文件的大小限制比如不超过200KB`--max-size='200k'`)。
`--min-size`参数设置传输的最小文件的大小限制比如不小于10KB`--min-size=10k`)。
`-n`参数或`--dry-run`参数模拟将要执行的操作,而并不真的执行。配合`-v`参数使用,可以看到哪些内容会被同步过去。
`-P`参数是`--progress`和`--partial`这两个参数的结合。
`--partial`参数允许恢复中断的传输。不使用该参数时,`rsync`会删除传输到一半被打断的文件;使用该参数后,传输到一半的文件也会同步到目标目录,下次同步时再恢复中断的传输。一般需要与`--append`或`--append-verify`配合使用。
`--partial-dir`参数指定将传输到一半的文件保存到一个临时目录,比如`--partial-dir=.rsync-partial`。一般需要与`--append`或`--append-verify`配合使用。
`--progress`参数表示显示进展。
`-r`参数表示递归,即包含子目录。
`--remove-source-files`参数表示传输成功后,删除发送方的文件。
`--size-only`参数表示只同步大小有变化的文件,不考虑文件修改时间的差异。
`--suffix`参数指定文件名备份时,对文件名添加的后缀,默认是`~`。
`-u`、`--update`参数表示同步时跳过目标目录中修改时间更新的文件,即不同步这些有更新的时间戳的文件。
`-v`参数表示输出细节。`-vv`表示输出更详细的信息,`-vvv`表示输出最详细的信息。
`--version`参数返回 rsync 的版本。
`-z`参数指定同步时压缩数据。
## 参考链接
- [How To Use Rsync to Sync Local and Remote Directories on a VPS](https://www.digitalocean.com/community/tutorials/how-to-use-rsync-to-sync-local-and-remote-directories-on-a-vps), Justin Ellingwood
- [Mirror Your Web Site With rsync](https://www.howtoforge.com/mirroring_with_rsync), Falko Timme
- [Examples on how to use Rsync](https://linuxconfig.org/examples-on-how-to-use-rsync-for-local-and-remote-data-backups-and-synchonization), Egidio Docile
- [How to create incremental backups using rsync on Linux](https://linuxconfig.org/how-to-create-incremental-backups-using-rsync-on-linux), Egidio Docile