1
0
wiki/docs/OpenSSH/rsync 命令.md

322 lines
13 KiB
Markdown
Raw Normal View History

2022-04-13 16:10:57 +08:00
---
id: rsync 命令
title: rsync 命令
sidebar_position: 8
data: 2022年4月13日
---
## 简介
rsync 是一个常用的 Linux 应用程序,用于文件同步。
它可以在本地计算机与远程计算机之间,或者两个本地目录之间同步文件(但不支持两台远程计算机之间的同步)。它也可以当作文件复制工具,替代`cp`和`mv`命令。
它名称里面的`r`指的是 remotersync 其实就是“远程同步”remote sync的意思。与其他文件传输工具如 FTP 或 scp不同rsync 的最大特点是会检查发送方和接收方已有的文件,仅传输有变动的部分(默认规则是文件大小或修改时间有变动)。
虽然 rsync 不是 SSH 工具集的一部分,但因为也涉及到远程操作,所以放在这里一起介绍。
## 安装
如果本机或者远程计算机没有安装 rsync可以用下面的命令安装。
```bash
# Debian
$ sudo apt-get install rsync
# Red Hat
$ sudo yum install rsync
# Arch Linux
$ sudo pacman -S rsync
```
注意,传输的双方都必须安装 rsync。
## 基本用法
rsync 可以用于本地计算机的两个目录之间的同步。下面就用本地同步举例,顺便讲解 rsync 几个主要参数的用法。
### `-r`参数
本机使用 rsync 命令时,可以作为`cp`和`mv`命令的替代方法,将源目录拷贝到目标目录。
```bash
2022-05-30 12:27:50 +08:00
rsync -r source destination
2022-04-13 16:10:57 +08:00
```
上面命令中,`-r`表示递归,即包含子目录。注意,`-r`是必须的,否则 rsync 运行不会成功。`source`目录表示源目录,`destination`表示目标目录。上面命令执行以后,目标目录下就会出现`destination/source`这个子目录。
如果有多个文件或目录需要同步,可以写成下面这样。
```bash
2022-05-30 12:27:50 +08:00
rsync -r source1 source2 destination
2022-04-13 16:10:57 +08:00
```
上面命令中,`source1`、`source2`都会被同步到`destination`目录。
### `-a`参数
`-a`参数可以替代`-r`,除了可以递归同步以外,还可以同步元信息(比如修改时间、权限等)。由于 rsync 默认使用文件大小和修改时间决定文件是否需要更新,所以`-a`比`-r`更有用。下面的用法才是常见的写法。
```bash
2022-05-30 12:27:50 +08:00
rsync -a source destination
2022-04-13 16:10:57 +08:00
```
目标目录`destination`如果不存在rsync 会自动创建。执行上面的命令后,源目录`source`被完整地复制到了目标目录`destination`下面,即形成了`destination/source`的目录结构。
如果只想同步源目录`source`里面的内容到目标目录`destination`,则需要在源目录后面加上斜杠。
```bash
2022-05-30 12:27:50 +08:00
rsync -a source/ destination
2022-04-13 16:10:57 +08:00
```
上面命令执行后,`source`目录里面的内容,就都被复制到了`destination`目录里面,并不会在`destination`下面创建一个`source`子目录。
### `-n`参数
如果不确定 rsync 执行后会产生什么结果,可以先用`-n`或`--dry-run`参数模拟执行的结果。
```bash
2022-05-30 12:27:50 +08:00
rsync -anv source/ destination
2022-04-13 16:10:57 +08:00
```
上面命令中,`-n`参数模拟命令执行的结果,并不真的执行命令。`-v`参数则是将结果输出到终端,这样就可以看到哪些内容会被同步。
### `--delete`参数
默认情况下rsync 只确保源目录的所有内容(明确排除的文件除外)都复制到目标目录。它不会使两个目录保持相同,并且不会删除文件。如果要使得目标目录成为源目录的镜像副本,则必须使用`--delete`参数,这将删除只存在于目标目录、不存在于源目录的文件。
```bash
2022-05-30 12:27:50 +08:00
rsync -av --delete source/ destination
2022-04-13 16:10:57 +08:00
```
上面命令中,`--delete`参数会使得`destination`成为`source`的一个镜像。
## 排除文件
### `--exclude`参数
有时,我们希望同步时排除某些文件或目录,这时可以用`--exclude`参数指定排除模式。
```bash
$ rsync -av --exclude='*.txt' source/ destination
# 或者
$ rsync -av --exclude '*.txt' source/ destination
```
上面命令排除了所有 TXT 文件。
注意rsync 会同步以“点”开头的隐藏文件,如果要排除隐藏文件,可以这样写`--exclude=".*"`。
如果要排除某个目录里面的所有文件,但不希望排除目录本身,可以写成下面这样。
```bash
2022-05-30 12:27:50 +08:00
rsync -av --exclude 'dir1/*' source/ destination
2022-04-13 16:10:57 +08:00
```
多个排除模式,可以用多个`--exclude`参数。
```bash
2022-05-30 12:27:50 +08:00
rsync -av --exclude 'file1.txt' --exclude 'dir1/*' source/ destination
2022-04-13 16:10:57 +08:00
```
多个排除模式也可以利用 Bash 的大扩号的扩展功能,只用一个`--exclude`参数。
```bash
2022-05-30 12:27:50 +08:00
rsync -av --exclude={'file1.txt','dir1/*'} source/ destination
2022-04-13 16:10:57 +08:00
```
如果排除模式很多,可以将它们写入一个文件,每个模式一行,然后用`--exclude-from`参数指定这个文件。
```bash
2022-05-30 12:27:50 +08:00
rsync -av --exclude-from='exclude-file.txt' source/ destination
2022-04-13 16:10:57 +08:00
```
### `--include`参数
`--include`参数用来指定必须同步的文件模式,往往与`--exclude`结合使用。
```bash
2022-05-30 12:27:50 +08:00
rsync -av --include="*.txt" --exclude='*' source/ destination
2022-04-13 16:10:57 +08:00
```
上面命令指定同步时,排除所有文件,但是会包括 TXT 文件。
## 远程同步
### SSH 协议
rsync 除了支持本地两个目录之间的同步,也支持远程同步。它可以将本地内容,同步到远程服务器。
```bash
2022-05-30 12:27:50 +08:00
rsync -av source/ username@remote_host:destination
2022-04-13 16:10:57 +08:00
```
也可以将远程内容同步到本地。
```bash
2022-05-30 12:27:50 +08:00
rsync -av username@remote_host:source/ destination
2022-04-13 16:10:57 +08:00
```
rsync 默认使用 SSH 进行远程登录和数据传输。
由于早期 rsync 不使用 SSH 协议,需要用`-e`参数指定协议,后来才改的。所以,下面`-e ssh`可以省略。
```bash
2022-05-30 12:27:50 +08:00
rsync -av -e ssh source/ user@remote_host:/destination
2022-04-13 16:10:57 +08:00
```
但是,如果 ssh 命令有附加的参数,则必须使用`-e`参数指定所要执行的 SSH 命令。
```bash
2022-05-30 12:27:50 +08:00
rsync -av -e 'ssh -p 2234' source/ user@remote_host:/destination
2022-04-13 16:10:57 +08:00
```
上面命令中,`-e`参数指定 SSH 使用2234端口。
### rsync 协议
除了使用 SSH如果另一台服务器安装并运行了 rsync 守护程序,则也可以用`rsync://`协议默认端口873进行传输。具体写法是服务器与目标目录之间使用双冒号分隔`::`。
```bash
2022-05-30 12:27:50 +08:00
rsync -av source/ 192.168.122.32::module/destination
2022-04-13 16:10:57 +08:00
```
注意,上面地址中的`module`并不是实际路径名,而是 rsync 守护程序指定的一个资源名,由管理员分配。
如果想知道 rsync 守护程序分配的所有 module 列表,可以执行下面命令。
```bash
2022-05-30 12:27:50 +08:00
rsync rsync://192.168.122.32
2022-04-13 16:10:57 +08:00
```
rsync 协议除了使用双冒号,也可以直接用`rsync://`协议指定地址。
```bash
2022-05-30 12:27:50 +08:00
rsync -av source/ rsync://192.168.122.32/module/destination
2022-04-13 16:10:57 +08:00
```
## 增量备份
rsync 的最大特点就是它可以完成增量备份,也就是默认只复制有变动的文件。
除了源目录与目标目录直接比较rsync 还支持使用基准目录,即将源目录与基准目录之间变动的部分,同步到目标目录。
具体做法是,第一次同步是全量备份,所有文件在基准目录里面同步一份。以后每一次同步都是增量备份,只同步源目录与基准目录之间有变动的部分,将这部分保存在一个新的目标目录。这个新的目标目录之中,也是包含所有文件,但实际上,只有那些变动过的文件是存在于该目录,其他没有变动的文件都是指向基准目录文件的硬链接。
`--link-dest`参数用来指定同步时的基准目录。
```bash
2022-05-30 12:27:50 +08:00
rsync -a --delete --link-dest /compare/path /source/path /target/path
2022-04-13 16:10:57 +08:00
```
上面命令中,`--link-dest`参数指定基准目录`/compare/path`,然后源目录`/source/path`跟基准目录进行比较,找出变动的文件,将它们拷贝到目标目录`/target/path`。那些没变动的文件则会生成硬链接。这个命令的第一次备份时是全量备份,后面就都是增量备份了。
下面是一个脚本示例,备份用户的主目录。
```bash
#!/bin/bash
# A script to perform incremental backups using rsync
set -o errexit
set -o nounset
set -o pipefail
readonly SOURCE_DIR="${HOME}"
readonly BACKUP_DIR="/mnt/data/backups"
readonly DATETIME="$(date '+%Y-%m-%d_%H:%M:%S')"
readonly BACKUP_PATH="${BACKUP_DIR}/${DATETIME}"
readonly LATEST_LINK="${BACKUP_DIR}/latest"
mkdir -p "${BACKUP_DIR}"
rsync -av --delete \
"${SOURCE_DIR}/" \
--link-dest "${LATEST_LINK}" \
--exclude=".cache" \
"${BACKUP_PATH}"
rm -rf "${LATEST_LINK}"
ln -s "${BACKUP_PATH}" "${LATEST_LINK}"
```
上面脚本中,每一次同步都会生成一个新目录`${BACKUP_DIR}/${DATETIME}`,并将软链接`${BACKUP_DIR}/latest`指向这个目录。下一次备份时,就将`${BACKUP_DIR}/latest`作为基准目录,生成新的备份目录。最后,再将软链接`${BACKUP_DIR}/latest`指向新的备份目录。
## 配置项
`-a`、`--archive`参数表示存档模式保存所有的元数据比如修改时间modification time、权限、所有者等并且软链接也会同步过去。
`--append`参数指定文件接着上次中断的地方,继续传输。
`--append-verify`参数跟`--append`参数类似,但会对传输完成后的文件进行一次校验。如果校验失败,将重新发送整个文件。
`-b`、`--backup`参数指定在删除或更新目标目录已经存在的文件时,将该文件更名后进行备份,默认行为是删除。更名规则是添加由`--suffix`参数指定的文件后缀名,默认是`~`。
`--backup-dir`参数指定文件备份时存放的目录,比如`--backup-dir=/path/to/backups`。
`--bwlimit`参数指定带宽限制,默认单位是 KB/s比如`--bwlimit=100`。
`-c`、`--checksum`参数改变`rsync`的校验方式。默认情况下rsync 只检查文件的大小和最后修改日期是否发生变化,如果发生变化,就重新传输;使用这个参数以后,则通过判断文件内容的校验和,决定是否重新传输。
`--delete`参数删除只存在于目标目录、不存在于源目标的文件,即保证目标目录是源目标的镜像。
`-e`参数指定使用 SSH 协议传输数据。
`--exclude`参数指定排除不进行同步的文件,比如`--exclude="*.iso"`。
`--exclude-from`参数指定一个本地文件,里面是需要排除的文件模式,每个模式一行。
`--existing`、`--ignore-non-existing`参数表示不同步目标目录中不存在的文件和目录。
`-h`参数表示以人类可读的格式输出。
`-h`、`--help`参数返回帮助信息。
`-i`参数表示输出源目录与目标目录之间文件差异的详细情况。
`--ignore-existing`参数表示只要该文件在目标目录中已经存在,就跳过去,不再同步这些文件。
`--include`参数指定同步时要包括的文件,一般与`--exclude`结合使用。
`--link-dest`参数指定增量备份的基准目录。
`-m`参数指定不同步空目录。
`--max-size`参数设置传输的最大文件的大小限制比如不超过200KB`--max-size='200k'`)。
`--min-size`参数设置传输的最小文件的大小限制比如不小于10KB`--min-size=10k`)。
`-n`参数或`--dry-run`参数模拟将要执行的操作,而并不真的执行。配合`-v`参数使用,可以看到哪些内容会被同步过去。
`-P`参数是`--progress`和`--partial`这两个参数的结合。
`--partial`参数允许恢复中断的传输。不使用该参数时,`rsync`会删除传输到一半被打断的文件;使用该参数后,传输到一半的文件也会同步到目标目录,下次同步时再恢复中断的传输。一般需要与`--append`或`--append-verify`配合使用。
`--partial-dir`参数指定将传输到一半的文件保存到一个临时目录,比如`--partial-dir=.rsync-partial`。一般需要与`--append`或`--append-verify`配合使用。
`--progress`参数表示显示进展。
`-r`参数表示递归,即包含子目录。
`--remove-source-files`参数表示传输成功后,删除发送方的文件。
`--size-only`参数表示只同步大小有变化的文件,不考虑文件修改时间的差异。
`--suffix`参数指定文件名备份时,对文件名添加的后缀,默认是`~`。
`-u`、`--update`参数表示同步时跳过目标目录中修改时间更新的文件,即不同步这些有更新的时间戳的文件。
`-v`参数表示输出细节。`-vv`表示输出更详细的信息,`-vvv`表示输出最详细的信息。
`--version`参数返回 rsync 的版本。
`-z`参数指定同步时压缩数据。
## 参考链接
- [How To Use Rsync to Sync Local and Remote Directories on a VPS](https://www.digitalocean.com/community/tutorials/how-to-use-rsync-to-sync-local-and-remote-directories-on-a-vps), Justin Ellingwood
- [Mirror Your Web Site With rsync](https://www.howtoforge.com/mirroring_with_rsync), Falko Timme
- [Examples on how to use Rsync](https://linuxconfig.org/examples-on-how-to-use-rsync-for-local-and-remote-data-backups-and-synchonization), Egidio Docile
- [How to create incremental backups using rsync on Linux](https://linuxconfig.org/how-to-create-incremental-backups-using-rsync-on-linux), Egidio Docile