在生产环境,有时会需要两台主机的特定目录实现实时同步。比如,将NFS共享目录的数据文件,自动实时同步到备份的服务器特定目录中
实现实时同步的方法
inotify + rsync 方式实现数据同步sersync :前金山公司周洋(花椒直播)在 inotify 软件基础上进行开发的,功能更加强大工作原理:
要利用监控服务(inotify),监控同步数据服务器目录中信息的变化发现目录中数据产生变化,就利用rsync服务推送到备份服务器上inotify:
异步的文件系统事件监控机制,利用事件驱动机制,而无须通过诸如cron等的轮询机制来获取事件,linux内核从2.6.13起支持 inotify,通过inotify可以监控文件系统中添加、删除,修改、移动等各种事件
[root@data-centos8 ~]#grep -i inotify /boot/config-4.18.0-80.el8.x86_64 CONFIG_INOTIFY_USER=y #被集成在内核文件里实现inotify软件:
inotify-toolssersynclrsyncdinotify+rsync使用方式
inotify 对同步数据目录信息的监控rsync 完成对数据的同步利用脚本进行结合内核是否支持inotify
Linux支持inotify的内核最小版本为 2.6.13,参看man 7 inotify
#列出下面的文件,说明服务器内核支持inotify [root@centos8 ~]#ls -l /proc/sys/fs/inotify -rw-r--r-- 1 root root 0 Jul 7 08:49 max_queued_events -rw-r--r-- 1 root root 0 Jul 7 08:49 max_user_instances -rw-r--r-- 1 root root 0 Jul 7 08:49 max_user_watches [root@centos8 ~]#cat /proc/sys/fs/inotify/max_queued_events 16384 [root@centos8 ~]#cat /proc/sys/fs/inotify/max_user_instances 128 [root@centos8 ~]#cat /proc/sys/fs/inotify/max_user_watches 8192inotify内核参数说明:
max_queued_events:inotify 事件队列最大长度,如值太小会出现 Event Queue Overflow 错误,默认值:16384, 生产环境建议调大,比如:327679max_user_instances:每个用户创建inotify实例最大值,默认值:128max_user_watches:可以监视的文件的总数量(inotifywait 单进程),默认值:8192,建议调大范例:修改inotify内核参数默认值
[root@data-centos8 ~]#vim /etc/sysctl.conf fs.inotify.max_queued_events=66666 fs.inotify.max_user_watches=100000 [root@centos8 ~]#sysctl -p fs.inotify.max_queued_events = 66666 fs.inotify.max_user_watches = 100000 [root@centos8 ~]#cat /proc/sys/fs/inotify/* 66666 128 100000inotify-tools参考文档:https://github.com/rvoicilas/inotify-tools/wiki
安装inotify-tools:基于epel源
[root@data-centos8 ~]# yum -y install inotify-toolsinotify-tools包主要工具:
inotifywait: 在被监控的文件或目录上等待特定文件系统事件(open ,close,delete等)发生,会在屏幕上打印相关信息,常用于实时同步的目录监控(相对常用)inotifywatch:收集被监控的文件系统使用的统计数据,指文件系统事件发生的次数统计(相对少用)inotifywait 命令
格式:
inotifywait [ options ] file1 [ file2 ] [ file3 ] [ ... ]常用选项:
-m, --monitor 始终保持事件监听 -d, --daemon 以守护进程方式执行,和-m相似,配合-o使用 -r, --recursive 递归监控目录数据信息变化 -q, --quiet 输出少量事件信息 --exclude <pattern> 指定排除文件或目录,使用扩展的正则表达式匹配的模式实现 --excludei <pattern> 和exclude相似,不区分大小写 -o, --outfile <file> 打印事件到文件中,相当于标准正确输出,注意:使用绝对路径 -s, --syslogOutput 发送错误到syslog相当于标准错误输出 --timefmt <fmt> 指定时间输出格式 --format <fmt> 指定的输出格式;即实际监控输出内容 -e 指定监听指定的事件,如果省略,表示所有事件都进行监听inotifywait 的–timefmt 时间格式
参考 man 3 strftime
%Y 年份信息,包含世纪信息 %y 年份信息,不包括世纪信息 %m 显示月份,范围 01-12 %d 每月的第几天,范围是 01-31 %H 小时信息,使用 24小时制,范围 00-23 %M 分钟,范围 00-59 %S 秒,范例 0-60范例:
--timefmt "%Y-%m-%d %H:%M:%S"inotifywait 的 --format 格式定义
%T 输出时间格式中定义的时间格式信息,通过 --timefmt option 语法格式指定时间信息 %w 事件出现时,监控文件或目录的名称信息,相当于dirname %f 事件出现时,将显示监控目录下触发事件的文件或目录信息,否则为空,相当于basename %e 显示发生的事件信息,不同的事件默认用逗号分隔 %Xe 显示发生的事件信息,不同的事件指定用X进行分隔范例:
--format "%T %w%f event: %;e" --format '%T %w %f'inotifywait -e 选项指定的事件类型
create 文件或目录创建 delete 文件或目录被删除 modify 文件或目录内容被写入 attrib 文件或目录属性改变 close_write 文件或目录关闭,在写入模式打开之后关闭的 close_nowrite 文件或目录关闭,在只读模式打开之后关闭的 close 文件或目录关闭,不管读或是写模式 open 文件或目录被打开 lsdir 浏览目录内容 moved_to 文件或目录被移动到监控的目录中 moved_from 文件或目录从监控的目录中被移动 move 文件或目录不管移动到或是移出监控目录都触发事件 access 文件或目录内容被读取 delete_self 文件或目录被删除,目录本身被删除 unmount 取消挂载范例:只把关注的事件显示出来
-e create,delete,moved_to,close_write, attrib范例:使用inotifywait
#监控一次性事件 inotifywait /data/www #跟踪一个文件夹,一次性的任务 Setting up watches. Watches established. /data/www/ CREATE f1.txt #-m持续前台监控,-r递归监控目录,-q输出少量信息,排除.swx和swp为后缀文件 inotifywait -mrq /data/www --exclude=".*\.swx|\.swp" /data/www/ OPEN f1.txt /data/www/ ACCESS f1.txt /data/www/ CLOSE_NOWRITE,CLOSE f1.txt #持续后台监控,并记录日志 inotifywait -o /root/inotify.log -drq /data/www --timefmt "%Y-%m-%d %H:%M:%S" --format "%T %w%f event: %e" #-o输出信息传到文件里,-d后台执行 #持续前台监控特定事件 inotifywait -mrq /data/www --timefmt "%F %H:%M:%S" --format "%T %w%f event:%;e" -e create,delete,moved_to,close_write,attrib #-e只把我们关注的事件显示出来rsync 常用于做为 linux系统下的数据镜像备份工具,实现远程同步,支持本地复制,或者与其他SSH、rsync主机同步数据,支持增量备份,配合任务计划,rsync能实现定时或间隔同步,配合inotify或sersync,可以实现触发式的实时数据同步
官方网站: http://rsync.samba.org/
软件包:rsync,rsync-daemon(CentOS 8)
服务文件:/usr/lib/systemd/system/rsyncd.service
配置文件:/etc/rsyncd.conf
端口:873/tcp
rsync 格式
#Local: rsync [OPTION...] SRC... [DEST] #Access via remote shell: Pull:远程文件拉到本机 rsync [OPTION...] [USER@]HOST:SRC... [DEST] Push:本机文件推到目标机器 rsync [OPTION...] SRC... [USER@]HOST:DEST #Access via rsync daemon: Pull: rsync [OPTION...] [USER@]HOST::SRC... [DEST] rsync [OPTION...] rsync://[USER@]HOST[:PORT]/SRC... [DEST] Push: rsync [OPTION...] SRC... [USER@]HOST::DEST rsync [OPTION...] SRC... rsync://[USER@]HOST[:PORT]/DEST #The ':' usages connect via remote shell, while '::' & 'rsync://' usages connect to an rsync daemon, and require SRC or DEST to start with a module name. #一个:就代表是远程ssh,两个:代表是守护进程rsync有三种工作方式:
本地文件系统上实现同步。命令行语法格式为上述"Local"段的格式。
本地主机使用远程shell和远程主机通信。命令行语法格式为上述"Access via remote shell"段的格式。
本地主机通过网络套接字连接远程主机上的rsync daemon。命令行语法格式为上述"Access via rsync daemon"段的格式。
前两者的本质是通过本地或远程shell,而第3种方式则是让远程主机上运行rsyncd服务,使其监听在一个端口上,等待客户端的连接。
常见选项:
-v: 显示rsync过程中详细信息。可以使用"-vvvv"获取更详细信息。 -P: 显示文件传输的进度信息。(实际上"-P"="--partial --progress",其中的"--progress"才是显示进度信息的)。 -n --dry-run : 仅测试传输,而不实际传输。常和"-vvvv"配合使用来查看rsync是如何工作的。 -a --archive : 归档模式,表示递归传输并保持文件属性。等同于"-rtopgDl"。 -r --recursive:递归到目录中去。 -t --times: 保持mtime属性。强烈建议任何时候都加上"-t",否则目标文件mtime会设置为系统时间,导致下次更新 : 检查出mtime不同从而导致增量传输无效。 -o --owner: 保持owner属性(属主)。 -g --group: 保持group属性(属组)。 -p --perms: 保持perms属性(权限,不包括特殊权限)。 -D : 是"--device --specials"选项的组合,即也拷贝设备文件和特殊文件。 -l --links: 如果文件是软链接文件,则拷贝软链接本身而非软链接所指向的对象 -z : 传输时进行压缩提高效率 -R --relative: 使用相对路径。意味着将命令行中指定的全路径而非路径最尾部的文件名发送给服务端,包括它们的属性。用法见下文示例。 --size-only : 默认算法是检查文件大小和mtime不同的文件,使用此选项将只检查文件大小。 -u --update : 仅在源mtime比目标已存在文件的mtime新时才拷贝。注意,该选项是接收端判断的,不会影响删除行为。 -d --dirs : 以不递归的方式拷贝目录本身。默认递归时,如果源为"dir1/file1",则不会拷贝dir1目录,使用该选项将拷贝dir1但不拷贝file1。 --max-size : 限制rsync传输的最大文件大小。可以使用单位后缀,还可以是一个小数值(例如:"--max-size=1.5m") --min-size : 限制rsync传输的最小文件大小。这可以用于禁止传输小文件或那些垃圾文件。 --exclude : 指定排除规则来排除不需要传输的文件。 --delete : 以SRC为主,对DEST进行同步。多则删之,少则补之。注意"--delete"是在接收端执行的,所以它是在 :exclude/include规则生效之后才执行的。 -b --backup : 对目标上已存在的文件做一个备份,备份的文件名后默认使用"~"做后缀。 --backup-dir: 指定备份文件的保存路径。不指定时默认和待备份文件保存在同一目录下。 -e : 指定所要使用的远程shell程序,默认为ssh。 --port : 连接daemon时使用的端口号,默认为873端口。 --password-file:daemon模式时的密码文件,可以从中读取密码实现非交互式。注意,这不是远程shell认证的密码,而是rsync模块认证的密码。 -W --whole-file:rsync将不再使用增量传输,而是全量传输。在网络带宽高于磁盘带宽时,该选项比增量传输更高效。 --existing : 要求只更新目标端已存在的文件,目标端还不存在的文件不传输。注意,使用相对路径时如果上层目录不存在也不会传输。 --ignore-existing:要求只更新目标端不存在的文件。和"--existing"结合使用有特殊功能,见下文示例。 --remove-source-files:要求删除源端已经成功传输的文件范例:两种格式访问 rsync daemon 服务(这两种方式最大的缺陷就是任何人不用key验证就可以进行同步,很不安全)
#在备份服务器启动 rsync 进程 [root@backup-centos8 ~]#rsync --daemon Failed to parse config file: /etc/rsyncd.conf [root@backup-centos8 ~]#touch /etc/rsyncd.conf [root@backup-centos8 ~]#rsync --daemon [root@backup-centos8 ~]#ss -ntlp|grep rsync LISTEN 0 5 0.0.0.0:873 0.0.0.0:* users:(("rsync",pid=2697,fd=4)) LISTEN 0 5 [::]:873 [::]:* users:(("rsync",pid=2697,fd=5)) [root@backup-centos8 ~]# [root@backup-centos8 ~]#cat /etc/rsyncd.conf [backup] #模块名,代表指定的共享资源的目录 path = /data/backup/ read only = no #指定可读写,默认只读 #指定目录给nobody权限,默认用户以nobody访问此目录 [root@backup-centos8 ~]#setfacl -m u:nobody:rwx /data/backup/ #查看rsync服务器的模块名称 [root@data-centos8 ~]#rsync rsync://backup-server backup [root@data-centos8 ~]#rsync backup-server:: backup #访问rsync服务器的共享目录 [root@data-centos8 ~]#rsync /etc/networks root@backup-server::backup [root@data-centos8 ~]#rsync /etc/shells rsync://root@backup-server/backup [root@data-server ~]#rsync 10.0.0.18::backup/* /opt [root@data-server ~]#rsync rsync://10.0.0.18/backup/* /mnt范例:以独立服务方式运行 rsync
[root@backup-centos8 ~]#dnf install rsync-daemon #创建rsync服务器的配置文件 [root@centos8 ~]#vi /etc/rsyncd.conf uid = root #提定以哪个用户来访问共享目录,将之指定为生成的文件所有者,默认为nobody gid = root #默认为nobody #port = 874 可指定非标准端口,默认873/tcp #use chroot = no max connections = 0 ignore errors exclude = lost+found/ log file = /var/log/rsyncd.log pid file = /var/run/rsyncd.pid lock file = /var/run/rsyncd.lock reverse lookup = no #hosts allow = 10.0.0.0/24 [backup] #每个模块名对应一个不同的path目录,如果同名后面模块生效 path = /data/backup/ comment = backup dir read only = no #默认是yes,即只读 auth users = rsyncuser #默认anonymous可以访问rsync服务器,这里指定用户访问 secrets file = /etc/rsync.pas #用户密码 #服务器端准备目录 [root@backup-centos8 ~]#mkdir -pv /data/backup #服务器端生成验证文件 [root@backup-centos8 ~]#echo "rsyncuser:magedu" > /etc/rsync.pas [root@backup-centos8 ~]#chmod 600 /etc/rsync.pas #服务器端启动rsync服务 [root@backup-centos8 ~]#rsync --daemon #可加入/etc/rc.d/rc.local实现开机启动 [root@backup-centos8 ~]#systemctl start rsyncd #CentOS 7 以上版本 #客户端配置密码文件 #也可将密码赋值给环境变量RSYNC_PASSWORD变量,但不安全 #export RSYNC_PASSWORD=magedu [root@data-centos8 ~]#echo "magedu" > /etc/rsync.pas [root@data-centos8 ~]#chmod 600 /etc/rsync.pas #此为必要项,权限必须修改 #查看远程rsync服务器的模块信息 [root@data-server ~]#rsync rsync://10.0.0.18 backup backup dir #查看具体模块内的文件需要验证 [root@data-server ~]#rsync rsync://10.0.0.18/backup Password: #客户端测试同步数据 [root@data-centos8 ~]#rsync -avz --delete --password-file=/etc/rsync.pas /data/www/ rsyncuser@rsync服务器IP::backup [root@data-centos8 ~]#rsync -avz --delete --password-file=/etc/rsync.pas rsyncuser@rsync服务器IP::backup /data/www/按 5.3 搭建好 rsyncd的备份服务器,在数据服务器上创建inotify_rsync.sh脚本
注意: 此脚本执行前先确保两主机初始数据处于同步状态,此脚本实现后续的数据同步
[root@data-centos8 ~]#vim inotify_rsync.sh #!/bin/bash SRC='/data/www/' #注意最后的/ DEST='rsyncuser@rsync服务器IP::backup' rpm -q rsync &> /dev/null || yum -y install rsync inotifywait -mrq --exclude=".*\.swp" --timefmt '%Y-%m-%d %H:%M:%S' --format '%T %w %f' -e create,delete,moved_to,close_write,attrib ${SRC} |while read DATE TIME DIR FILE;do FILEPATH=${DIR}${FILE} rsync -az --delete --password-file=/etc/rsync.pas $SRC $DEST && echo "At ${TIME} on ${DATE}, file $FILEPATH was backuped up via rsync" >> /var/log/changelist.log done #查看文件传输日志 [root@data-server www]#touch f1.txt [root@data-centos8 ~]#tail -f /var/log/changelist.log At 10:13:38 on 2020-07-08, file /data/www/f1.txt was backuped up via rsync At 10:13:38 on 2020-07-08, file /data/www/f1.txt was backuped up via rsync At 10:13:38 on 2020-07-08, file /data/www/f1.txt was backuped up via rsyncsersync类似于inotify,同样用于监控,但它克服了inotify的缺点.
inotify最大的不足是会产生重复事件,或者同一个目录下多个文件的操作会产生多个事件,例如,当监控目录中有5个文件时,删除目录时会产生6个监控事件,从而导致重复调用rsync命令。比如:vim文件时,inotify会监控到临时文件的事件,但这些事件相对于rsync来说是不应该被监控的
sersync 优点:
sersync是使用c++编写,而且对linux系统文件系统产生的临时文件和重复的文件操作进行过滤,所以在结合rsync同步的时候,节省了运行时耗和网络资源。因此更快。sersync配置很简单,其中提供了静态编译好的二进制文件和xml配置文件,直接使用即可sersync使用多线程进行同步,尤其在同步较大文件时,能够保证多个服务器实时保持同步状态sersync有出错处理机制,通过失败队列对出错的文件重新同步,如果仍旧失败,则按设定时长对同步失败的文件重新同步sersync不仅可以实现实时同步,另外还自带crontab功能,只需在xml配置文件中开启,即也可以按要求隔一段时间整体同步一次,而无需再额外配置crontab功能sersync 可以二次开发sersync项目地址: https://code.google.com/archive/p/sersync/
sersync下载地址: https://code.google.com/archive/p/sersync/downloads