1、SARG介紹
SARG的全稱是:Squid Analysis Report Generator
SARG作爲一款Squid日誌分析工具,它採用html格式,詳細列出了每一位用戶訪問internet的站點信息,時間佔用信息,排名,連接次數,訪問量,訪問量等。
軟件的主頁:http://www.sarg-squid.org/
2、安裝
下載了sarg的最新安裝包以後,進入下載的目錄,執行以下的操作進行安裝:
解壓縮安裝軟件包
#tar zxvf sarg-2.0.2.tar.gz
進入解壓後的目錄,
#cd sarg-2.0.2
#./configure
在這裏,也可以用./configure --help看看可以使用的configure可以使用的參數,一般來說,使用默認的選項就可以了。
#make
#make install
這樣,就完成了sarg的安裝,如果安裝過程中出現錯誤,可以看看有沒有安裝gcc,或者在安裝系統是沒有安裝相應的開發庫。如果使用默認的選項,可執行 文件是/usr/bin/sarg,配置文件是/usr/local/sarg/sarg.conf,在 /usr/local/sarg目錄下還有一些其他的文件和目錄。
3、配置
安裝成功後,在/usr/local/sarg/目錄中,有一個配置文件爲sarg.conf,我們通過修改配置文件的參數,來達到對日誌進行有規則的分析。也可以通過命令行參數實現。
sarg配置文件的方法和squid配置文件的配置方法類似,只要修改帶有關鍵字的行:
"language english"
指定網頁報告文件的語言類型,很可惜不支持中文網頁。
"access_log /usr/local/squid/logs/access.log"
指定squid日誌文件絕對路徑。
"title "squid user access reports"
指定網頁標題,可以寫中文網頁,內核支持先。
"temporary_dir /var/tmp"
指定臨時文件目錄,請確認該目錄所在的分區足夠大先,1g以上。
"output_dir /var/www/html/squid-reports"
指定網頁報告文件輸出路徑,推薦使用webmaster或其他非admin用戶運行sarg。
"topuser_sort_field connect reverse bytes reverse"
在top排序中,指定連接次數(connect),訪問字節數(bytes)採用降序排列,升序請使用normal替代reverse
"user_sort_field connect reverse"
對於每個用戶的訪問紀錄,連接次數按降序排列
"exclude_hosts /usr/local/sarg/norecords"
指定不計入排序的站點列表文件名爲/usr/local/sarg/norecords,對於客戶端 訪問的這些站點,將不會被top排序中,norecords文件樣本:
google.com
csdn.net
microsoft.com
"date_format e"
啓動sarg進程是如果使用日期參數-d時,請使用和配置文件一致的日期格:
e (europe=dd/mm/yy),
u (usa=mm/dd/yy),
w (weekly=yy.ww)
"topuser_fields num date_time userid connect bytes %bytes in-cache-out used_time milisec %time total average"
指定top排序的域,可以取掉一些不關緊要的域:in-cache-out used_time等
"weekdays 1-5"
指定top排序星期週期爲星期一到星期五,0表示星期天
"hours 9-11,13-16"
指定top排序的時間週期爲9:00-11:59,13:00-16:59,哈哈,差不多爲上班時間
至此,sarg.conf文件的配置基本上over了,還有些不是太重要的配置一看就明白,在此就不耽誤大家的時間了。
sarg的命令行解釋如下:
# sarg -h
sarg: usage [options...]
-a hostname or ip address
指定不計入排序的主機名稱或地址
-b useragent log
用戶代理日誌文件輸出
-c exclude file
指定不計入排序的站點列表文件名爲/usr/local/sarg/norecords,對於客戶端訪問的這
些站點,將不會被top排序中
-d date from-until dd/mm/yyyy-dd/mm/yyyy
指定日期範圍
-e email address to send reports (stdout for console)
指定報告接收者郵件
-f config file (/usr/local/sarg/sarg.conf)
指定配置文件
-g date format [e=europe -> dd/mm/yy, u=usa -> mm/dd/yy]
指定輸入的日期格式
-h help (this...)
列幫助信息
-i reports by user and ip address
指定客戶端排序採用用戶名或者ip地址
-l input log
指定squid日誌文件絕對路徑。
-o output dir
指定網頁報告文件輸出路徑,推薦使用webmaster或其他非admin用戶運行
sarg。
-p use ip address instead userid (reports)
使用ip地址作爲userid域
-w temporary dir
指定臨時文件目錄,請確認該目錄所在的分區足夠大先,1g以上。
4、運行
一般來說,我們希望系統可以自動生成日誌分析以後的結果。在這裏,我們利用cron來實現,把以下的相應腳本放到cron裏面去執行即可
crontab -l
# m h dom mon dow command
59 23 * * * /etc/squid/daliy.sh
59 23 * * 0 /etc/squid/weekly.sh
59 23 * * * 1 * /etc/squid/monthly.sh
::::::::::::::
日報daliy.sh
::::::::::::::
#!/bin/bash
#Get current date
TODAY=$(date +%d/%m/%Y)
#Get one week ago today
YESTERDAY=$(date --date "1 day ago" +%d/%m/%Y)
/usr/bin/sarg -l /var/log/squid3/access.log -o /var/www/daily -z -d $YESTERDAY-$TODAY
exit 0
::::::::::::::
月報monthly.sh
::::::::::::::
#!/bin/bash
#Get current date
TODAY=$(date +%d/%m/%Y)
#Get one week ago today
LASTMONTH=$(date --date "1 month ago" +%d/%m/%Y)
/usr/bin/sarg -l /var/log/squid3/access.log -o /var/www/monthly -z -d $LASTMONTH-$TODAY
exit 0
::::::::::::::
週報weekly.sh
::::::::::::::
#!/bin/bash
#Get current date
TODAY=$(date +%d/%m/%Y)
#Get one week ago today
LASTWEEK=$(date --date "1 week ago" +%d/%m/%Y)
/usr/bin/sarg -l /var/log/squid3/access.log.* -o /var/www/weekly -z -d $LASTWEEK-$TODAY
exit 0
通過郵件發送報告:
#!/bin/bash
#Get current date
TODAY=$(date +%d/%m/%Y)
#Get one week ago today
YESTERDAY=$(date --date "1 day ago" +%d/%m/%Y)
/usr/bin/sarg -l /var/log/squid3/access.log -e [email protected] -z -d $YESTERDAY-$TODAY
exit 0