Linux下SVN的三種備份方式

(本文例子基於FreeBSD/Linux實現,windows環境請自己做出相應修改)
 配置管理的一個重要使命是保證數據的安全性,防止服務器應硬盤損壞、誤操作造成數據無法恢復的災難性後果。因此制定一個完整的備份策略非常重要。

  一般來說,備份策略應規定如下幾部分內容:備份頻度、備份方式、備份存放地點、備份責任人、災難恢復檢查措施及規定。

 備份頻度、存放地點等內容可以根據自己的實際情況自行制定;本文重點描述備份方式。

 svn備份一般採用三種方式:1)svnadmin dump 2)svnadmin hotcopy 3)svnsync.

注意,svn備份不宜採用普通的文件拷貝方式(除非你備份的時候將庫暫停),如copy命令、rsync命令。
筆者曾經用 rsync命令來做增量和全量備份,在季度備份檢查審計中,發現備份出來的庫大部分都不可用,因此最好是用svn本身提供的功能來進行備份。

優缺點分析:
==============
第一種svnadmin dump是官方推薦的備份方式,優點是比較靈活,可以全量備份也可以增量備份,並提供了版本恢復機制。
 缺點是:如果版本比較大,如版本數增長到數萬、數十萬,那麼dump的過程將非常慢;備份耗時,恢復更耗時;不利於快速進行災難恢復。
 個人建議在版本數比較小的情況下使用這種備份方式。
第二種svnadmin hotcopy原設計目的估計不是用來備份的,只能進行全量拷貝,不能進行增量備份;
  優點是:備份過程較快,災難恢復也很快;如果備份機上已經搭建了svn服務,甚至不需要恢復,只需要進行簡單配置即可切換到備份庫上工作。
  缺點是:比較耗費硬盤,需要有較大的硬盤支持(俺的備份機有1TB空間,呵呵)。
第三種svnsync實際上是製作2個鏡像庫,當一個壞了的時候,可以迅速切換到另一個。不過,必須svn1.4版本以上才支持這個功能。
 優點是:當製作成2個鏡像庫的時候起到雙機實時備份的作用;
 缺點是:當作爲2個鏡像庫使用時,沒辦法做到“想完全拋棄今天的修改恢復到昨晚的樣子”;而當作爲普通備份機制每日備份時,操作又較前2種方法麻煩。      


下面具體描述這三種的備份的方法:
===============

1、svnadmin dump備份工具
------------------------
   這是subversion官方推薦的備份方式。

   1)定義備份策略:
      備份頻度:每週六進行一次全量備份,每週日到週五進行增量備份
      備份地點:備份存儲路徑到/home/backup/svn/
      備份命名:全量備份文件名爲:weekly_fully_backup.yymmdd,增量備份文件命名爲:daily-incremental-backup.yymmdd
      備份時間:每晚21點開始
      備份檢查:每月末進行svnadmin load恢復試驗。
   2)建立全量備份腳本:
      在~/下建立一個perl腳本文件,名爲weekly_backup.pl,執行全量備份,並壓縮備份文件,代碼如下(本代碼只針對一個庫的備份,如果是多個庫請做相應改動):

#!/usr/bin/perl -w
my $svn_repos="/home/svn/repos/project1";
my $backup_dir="/home/backup/svn/";
my $next_backup_file = "weekly_fully_backup.".`date +%Y%m%d`;

$youngest=`svnlook youngest $svn_repos`;
chomp $youngest;

print "Backing up to revision $youngest/n";
my $svnadmin_cmd="svnadmin dump --revision 0:$youngest $svn_repos >$backup_dir/$next_backup_file";
`$svnadmin_cmd`;
open(LOG,">$backup_dir/last_backed_up"); #記錄備份的版本號
print LOG $youngest;
close LOG;
#如果想節約空間,則再執行下面的壓縮腳本
print "Compressing dump file.../n";
print `gzip -g $backup_dir/$next_backup_file`;

 3)建立增量備份腳本:
   在全量備份的基礎上,進行增量備份:在~/下建立一個perl腳本文件,名爲:daily_backup.pl,代碼如下:

#!/usr/bin/perl -w
my $svn_repos="/home/svn/repos/project1";
my $backup_dir="/home/backup/svn/";
my $next_backup_file = "daily_incremental_backup.".`date +%Y%m%d`;

open(IN,"$backup_dir/last_backed_up");
$previous_youngest = <IN>;
chomp $previous_youngest;
close IN;

$youngest=`svnlook youngest $svn_repos`;
chomp $youngest;
if ($youngest eq $previous_youngest)
{
 print "No new revisions to backup./n";
 exit 0;
}
my $first_rev = $previous_youngest + 1;
print "Backing up revisions $youngest .../n";
my $svnadmin_cmd = "svnadmin dump --incremental --revision $first_rev:$youngest $svn_repos > $backup_dir/$next_backup_file";
`$svnadmin_cmd`;
open(LOG,">$backup_dir/last_backed_up"); #記錄備份的版本號
print LOG $youngest;
close LOG;
#如果想節約空間,則再執行下面的壓縮腳本
print "Compressing dump file.../n";
print `gzip -g $backup_dir/$next_backup_file`;

  4)配置/etc/crontab文件
  配置 /etc/crontab 文件,指定每週六執行weekly_backup.pl,指定週一到週五執行daily_backup.pl;
  具體步驟俺就不囉嗦了.

  5)備份恢復檢查
  在月底恢復檢查中或者在災難來臨時,請按照如下步驟進行恢復:恢復順序從低版本逐個恢復到高版本;即,先恢復最近的一次完整備份weekly_full_backup.071201(舉例),然後恢復緊挨着這個文件的增量備份daily_incremental_backup.071202,再恢復後一天的備份071203,依次類推。如下:
user1>mkdir newrepos
user1>svnadmin create newrepos
user1>svnadmin load newrepos < weekly_full_backup.071201
user1>svnadmin load newrepos < daily_incremental_backup.071202
user1>svnadmin load newrepos < daily_incremental_backup.071203
....

如果備份時採用了gzip進行壓縮,恢復時可將解壓縮和恢復命令合併,簡單寫成:
user1>zcat weekly_full_backup.071201 | svnadmin load newrepos
user1>zcat daily_incremental_backup.071202 | svnadmin load newrepos
...

(這部分內容很多參考了《版本控制之道》)

2、svnadmin hotcopy整庫拷貝方式
-------------------------
  svnadmin hotcopy是將整個庫都“熱”拷貝一份出來,包括庫的鉤子腳本、配置文件等;任何時候運行這個腳本都得到一個版本庫的安全拷貝,不管是否有其他進程正在使用版本庫。
  因此這是俺青睞的備份方式。

 1)定義備份策略

   備份頻度:每天進行一次全量備份,
   備份地點:備份目錄以日期命名,備份路徑到 /home/backup/svn/${mmdd}
   備份保留時期:保留10天到15天,超過15天的進行刪除。
   備份時間:每晚21點開始
   備份檢查:備份完畢後自動運行檢查腳本、自動發送報告。

 2)建立備份腳本
 在自己home目錄 ~/下創建一個文件,backup.sh:

#!/bin/bash
SRCPATH=/home/svn/repos/; #定義倉庫parent路徑
DISTPATH=/home/backup/svn/`date +/%m%d`/ ; #定義存放路徑;
if [ -d "$DISTPATH" ]
then
else
  mkdir $DISTPATH
  chmod g+s $DISTPATH
fi
echo $DISTPATH
svnadmin hotcopy $SRCPATH/Project1 $DISTPATH/Project1 >/home/backup/svn/cpreport.log 2>&1;
svnadmin hotcopy $SRCPATH/Project2 $DISTPATH/Project2
cp $SRCPATH/access  $DISTPATH; #備份access文件
cp $SRCPATH/passwd  $DISTPATH; #備份passwd文件
perl /home/backup/svn/backup_check.pl #運行檢查腳本
perl /home/backup/svn/deletDir.pl  #運行刪除腳本,對過期備份進行刪除。

 3)建立檢查腳本
 在上面指定的地方/home/backup/svn/下建立一個perl腳本:backup_check.pl
備份完整性檢查的思路是:對備份的庫運行 svnlook youngest,如果能正確打印出最新的版本號,則表明備份文件沒有缺失;如果運行報錯,則說明備份不完整。我試過如果備份中斷,則運行svnlook youngest會出錯。
 perl腳本代碼如下:

#! /usr/bin/perl
## Author:xuejiang
## 2007-11-10
##
http://www.scmbbs.com
use strict;
use Carp;
use Net::SMTP;

#### defined the var #######

my $smtp =Net::SMTP->new('mail.scmbbs.com', Timeout => 30, Debug => 0)|| die "cann't connect to mail.scmbbs.com/n";

my $bkrepos="/home/backup/svn/".&get_day;#定義備份路徑
my $***epos="
http://www.scmbbs.com/repos";#定義倉庫url
my @repos = ("project1","project2");

my $title="echo /"如下是昨晚備份結果與真實庫對比的情況,如果給出備份版本數,則表示備份成功;如果給報錯信息或沒有備份版本數,則表示備份失敗:/" >./report";
system $title  || die "exec failed/n";
foreach my $myrepos(@repos)
{
   my $bkrepos1=$bkrepos."/".$myrepos;
 my $***epos1=$***epos."/".$myrepos;
 my $svnlookbk1 = "echo /"$myrepos 昨晚備份的版本是:/">>./report;svnlook youngest ".$bkrepos1." >> ./report 2>&1";
 my $svnlookss1 = "echo /"$myrepos 真實庫中的最新版本及最後修改時間是:/">>./report;svn log -r'HEAD' ".$***epos1." >> ./report 2>&1";
 system $svnlookbk1 || die "exec failed/n";
 system $svnlookss1 || die "exec failed/n";

}

my $body       ="echo /"=========================================================================/" >>./report";
my $bottom     ="echo /"備份位置:來自
http://www.scmbbs.com的".$bkrepos."/" >>./report";

system $body       || die "exec failed/n";
system $bottom     || die "exec failed/n";


###### report the result ####


open(SESAME,"./report")|| die "can not open ./report";
my @svnnews = <SESAME>;
close(SESAME);
foreach my $line1 (@svnnews)
{
     print $line1."/n";
}

my @email_addresses =("scm/@list.scmbbs.com","leader1/@scmbbs.com","leader2/@scmbbs.com");
my $to              = join(', ', @email_addresses);
$smtp->mail("scm/@scmbbs.com");
$smtp->recipient(@email_addresses);
$smtp->data();
$smtp->datasend("To:$to/n");
$smtp->datasend("From: svnReport/@scmbbs.com/n");
$smtp->datasend("Subject:svn備份檢查報告".&get_today."/n");
$smtp->datasend("Reply-to:scm/@scmbbs.com/n");
$smtp->datasend("@svnnews");
$smtp->dataend();
$smtp->quit;


#############


sub get_today
{
my( $sec, $min, $hour, $day, $month, $year ) = localtime( time() );
$year += 1900;
$month++;
my $today = sprintf( "%04d%02d%02d", $year, $month, $day);
return $today;
}
sub get_day
{
   my( $sec, $min, $hour, $day, $month, $year ) = localtime( time() );
$year += 1900;
$month++;
my $today = sprintf( "%02d%02d", $month, $day);
return $today;
}


 4)定義刪除腳本

  由於是全量備份,所以備份不宜保留太多,只需要保留最近10來天的即可,對於超過15天曆史的備份基本可以刪除了。
  在/home/backup/svn/下建立一個perl腳本:deletDir.pl
  (注意,刪除svn備份庫可不像刪除普通文件那麼簡單)
  腳本代碼請參看我的另一個帖子:
http://www.scmbbs.com/cn/systp/2007/12/systp6.php

  5)修改/etc/crontab 文件
  在該文件中指定每晚21點執行“backup.sh”腳本。

3、svnsync備份
-----------------------
 參閱:
http://www.scmbbs.com/cn/svntp/2007/11/svntp4.php
 使用svnsync備份很簡單,步驟如下:
1)在備份機上創建一個空庫:svnadmin create Project1
2)更改該庫的鉤子腳本pre-revprop-change(因爲svnsync要改這個庫的屬性,也就是要將源庫的屬性備份到這個庫,所以要啓用這個腳本):  
 cd SMP/hooks;
 cp pre-revprop-change.tmpl pre-revprop-change;
 chmod 755 pre-revprop-change;
 vi pre-revprop-change;
 將該腳本後面的三句註釋掉,或者乾脆將它弄成一個空文件。
3)初始化,此時還沒有備份任何數據:
svnsync init
file:///home/backup/svn/svnsync/Project1/http://svntest.subversion.com/repos/Project1
 語法是:svnsync init {你剛創建的庫url} {源庫url}
 注意本地url是三個斜槓的:///
4)開始備份(同步):
 svnsync sync
file:///home/backup/svn/svnsync/Project1
5)建立同步腳本
 備份完畢後,建立鉤子腳本進行同步。在源庫/hooks/下建立/修改post-commit腳本,在其中增加一行,內容如下:

   /usr/bin/svnsync sync  --non-interactive file:///home/backup/svn/svnsync/Project1

 你可能已經注意到上面的備份似乎都是本地備份,不是異地備份。實際上,我是通過將遠程的備份機mount(請參閱mount命令)到svn服務器上來實現的,邏輯上看起來是本地備份,物理上實際是異地備份。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章