http://www.dytaobao.com/blog/html/y2010/1121.html
問題:如何避開同步指定的文件夾? –exclude
參考這篇:
rsync – exclude files and folders
http://articles.slicehost.com/2007/10/10/rsync-exclude-files-and-folders
很常見的情況:我想同步/下的 /usr /boot/ , 但是不想複製/proc /tmp 這些文件夾
如果想避開某個路徑 直接添加—exclude 即可
比如—exclude “proc”
–exclude ‘sources’
Note: the directory path is relative to the folder you are backing up.
注意:這個路徑必須是一個相對路徑,不能是絕對路徑
例子:源服務器/home/yjwan/bashshell有一個checkout文件夾
[root@CentOS5-4 bashshell]# ls -dl checkout
drwxr-xr-x 2 root root 4096 Aug 21 09:14 checkou
現在想要完全避開復制這個文件夾內容怎麼辦?
目標服務器執行
rsync -av –exclude “checkout” [email protected]:/home/yjwan/bashshell /tmp
將不會複製這個文件夾
[root@free /tmp/bashshell]# ls -d /tmp/bashshell/checkout
ls: /tmp/bashshell/checkout: No such file or directory
注意:
1事實上,系統會把文件和文件夾一視同仁,如果checkout是一個文件,一樣不會複製
2 如果想避開復制checkout裏面的內容,可以這麼寫—exclude “checkout/123”
3 切記不可寫爲 —exclude “/checkout”這樣絕對路徑
這樣寫 將不會避免checkout被複制
比如
[root@free /tmp/bashshell]# rsync -av –exclude “/checkout” [email protected]:/home/yjwan/bashshell /tmp
receiving file list … done
bashshell/checkout/
4可以使用通配符 避開不想複製的內容
比如—exclude “fire*”
那麼fire打頭的文件或者文件夾全部不會被複制
5如果想要避開復制的文件過多,可以這麼寫
–exclude-from=/exclude.list
exclude.list 是一個文件,放置的位置是絕對路徑的/exclude.list ,爲了避免出問題,最好設置爲絕對路徑。
裏面的內容一定要寫爲相對路徑
比如 我想避開checkout文件夾和fire打頭的文件
那麼/exclude.list 寫爲
checkout
fire*
然後執行以下命令,注意寫爲–exclude-from或者–exclude-from=都可以
但是不能爲—exclude
rsync -av –exclude-from=”/exclude.list” [email protected]:/home/yjwan/bashshell /tmp
檢查結果:確實避開了checkout文件夾和fire打頭的文件
問題:如何計算對比複製以後的文件數量是否正確呢?
1 查看錯誤日誌,看是否複製時候出問題了
2在源服務器執行可知道具體文件和文件夾的總個數
ls –AlR|grep “^[-d]”|wc
然後目標服務器在計算一遍個數
看看數字是不是能對的上就ok了
對不上再研究怎麼回事
3現在的問題是:如果我使用了—exclude參數就麻煩了
我怎麼知道要複製幾個文件?
首先,前面命令時候提到過一種寫法,就是隻有源地址,沒有目標地址的寫法,這種寫法可以用來列出所有應該被複制的文件
那麼用這個命令,可以計算出這個/root/bashshell下面文件和文件夾數量
在服務器端執行
[root@CentOS5-4 bashshell]# rsync -av /root/bashshell/ |grep “^[-d]” | wc
62 310 4249
和ls 得到的結果一致的
[root@CentOS5-4 bashshell]# ls -AlR |grep “^[-d]“|wc
62 558 3731
因此,比如說我不要fire 打頭的文件,可以在服務器端先這樣計算要複製的文件
[root@CentOS5-4 bashshell]# rsync -av –exclude “fire*” /root/bashshell/ |grep “^[-d]” | wc
44 220 2695
然後複製過去
看目標機器的文件和文件夾數量爲
[root@free /tmp]# ls -AlR /tmp/bashshell/ |grep “^[-d]“|wc
44 396 2554
可以知道2者是同步的
問題:Rsync的其他幾個常見參數
1
-z –compress compress file data during the transfer
–compress-level=NUM explicitly set compression level
–skip-compress=LIST skip compressing files with suffix in LIST
壓縮傳輸,如果網絡帶寬不夠,那麼應該壓縮以後傳輸,消耗的當然是機器資源,但是如果內網傳輸的話,文件數量不是很多的話,這個參數不必要的。
2
-password-file=FILE
前面說過了,只有遠端機器是rsync服務器,才能用這個參數
如果你以爲個FILE寫的是ssh 登陸的密碼,那就大錯特錯了,不少人犯了這個錯誤。
3
–stats: Adds a little more output regarding the file transfer status.
4
–progress: shows the progress of each file transfer. Can be useful to know if you have large files being backup up.
關於這個參數:
I frequently find myself adding the -P option for large transfers. It preserves partial transfers in case of interuption, and gives a progress report on each file as it’s being uploaded.
I move large media files back and forth on my servers, so knowing how long the transfer has remaining is very useful.