linux 服務器性能收集命令詳解

Tsar介紹

Tsar是淘寶的一個用來收集服務器系統和應用信息的採集報告工具,如收集服務器的系統信息(cpu,mem等),以及應用數據(nginx、swift等),收集到的數據存儲在服務器磁盤上,可以隨時查詢歷史信息,也可以將數據發送到nagios報警。

Tsar能夠比較方便的增加模塊,只需要按照tsar的要求編寫數據的採集函數和展現函數,就可以把自定義的模塊加入到tsar中。

Tsar安裝 

Tsar目前託管在github上,下載編譯安裝步驟:

$git clone git://github.com/kongjian/tsar.git
$cd tsar
$make
$make install

安裝後:


  1. 定時任務配置:/etc/cron.d/tsar,負責每分鐘調用tsar執行採集任務;

  2. 日誌文件輪轉配置:/etc/logrotate.d/tsar,每個月會把tsar的本地存儲進行輪轉;

  3. Tsar配置文件路徑:/etc/tsar/tsar.conf,tsar的採集模塊和輸出的具體配置;

  4. 模塊路徑:/usr/local/tsar/modules,各個模塊的動態庫so文件;


Tsar配置

Tsar剛安裝完,還沒有歷史數據,想要check是否正常,執行tsar -l,查看是否有實時信息輸出:

Tsar的配置主要都在/etc/tsar/tsar.conf中,常用的有:


  • 增加一個模塊,添加 mod_<yourmodname> on 到配置文件中

  • 打開或者關閉一個模塊,修改mod_<yourmodname> on/off

  • output_stdio_mod 能夠配置執行tsar時的輸出模塊

  • output_file_path 採集到的數據默認保存到的文件(如果修改的話需要對應修改輪轉的配置/etc/logrotate.d/tsar

  • output_interface 指定tsar的數據輸出目的,默認file保存本地,nagios/db輸出到監控中心/數據庫中,這兩個功能還需要結合其它配置,具體見後面

Tsar使用 



  • 查看歷史數據,tsar

  • -l/--list 查看可用的模塊列表

  • -l/--live 查看實時數據,tsar -l --cpu

  • -i/--interval 指定間隔,歷史,tsar -i 1 --cpu

  • --modname 指定模塊,tsar --cpu

  • -s/--spec 指定字段,tsar --cpu -s sys,util

  • -d/--date 指定日期,YYYYMMDD或者n代表n天前

  • -C/--check 查看最後一次的採集數據

  • -d/--detail 能夠指定查看主要字段還是模塊的所有字段

  • -h/--help 幫助功能


高級功能 


  • 輸出到nagios


配置: 首先配置output_interface file,nagios,增加nagios輸出

然後配置nagios服務器和端口,以及發送的間隔時間

####The IP address or the host running the NSCA daemon
server_addr nagios.server.com
####The port on which the daemon is running - default is 5667
server_port 8086
####The cycle of send alert to nagios
cycle_time 300

由於是nagios的被動監控模式,需要指定nsca的位置和配置文件位置

####nsca client program
send_nsca_cmd /usr/bin/send_nsca
send_nsca_conf /home/a/conf/amon/send_nsca.conf

接下來指定哪些模塊和字段需要進行監控,一共四個閥值對應nagios中的不同報警級別

####tsar mod alert config file
####threshold [hostname.]servicename.key;w-min;w-max;c-min;cmax;
threshold cpu.util;50;60;70;80;


  • 輸出到Mysql


配置: 首先配置output_interface file,db,增加db輸出

然後配置哪些模塊數據需要輸出

output_db_mod mod_cpu,mod_mem,mod_traffic,mod_load,mod_tcp,mod_udpmod_io

然後配置sql語句發送的目的地址和端口

output_db_addr console2:56677

目的地址在該端口監聽tcp數據,並且把數據入庫即可,可以參照 tsar2db

模塊開發

Tsar的一個比較好的功能是能夠增加自己的採集,這時候需要編寫模塊代碼,編譯成so文件即可。

首先安裝tsardevel,剛纔安裝時,如果執行make tsardevel,就會把模塊開發的基本文件安裝到系統 然後執行tsardevel ,就能在當前模塊生成一個模塊目錄:

[[email protected] tsar]$ tsardevel test
build:make
install:make install
uninstall:make uninstall
[[email protected] tsar]$ ls test
Makefile &nbsp;mod_test.c &nbsp;mod_test.conf

按照要求修改mod_test.c中的read_test_stats,set_test_record 完成後make;make install就完成新模塊的配置文件和so的設置,執行tsar --test就能查看效果。

另外也可以通過配置文件對自定義模塊傳遞參數,方法是修改配置文件中的mod_test on myparameter 然後在mod_test.c中的read_test_stats函數中,通過parameter參數就可以獲得剛纔配置文件中的內容。

使用:

命令行使用

tsar命令行主要擔負顯示歷史數據和實時數據的功能,因此有控制展示模塊和格式化輸出的參數,默認不帶任何參數/選項的情況下,tsar打印彙總信息。

tsar命令行主要顯示給人看的,所以數據展示中都進行了k/m/g等的進位。

tsar命令會在顯示20行數據後再次打印各個列的列頭,以利於用戶理解數據的含義。

tsar的列頭信息包括2行,第一行爲模塊名,第二行爲列名。

tsar輸出最後會作min/avg/max的彙總統計,統計所展示中的最小/平均/最大數據。

常用參數:

--help/-h 顯示提示信息和模塊信息

[like@mmdev5]tsar -h
Usage: tsar [options]
Options:
--cron/-c run in cron mode, output data to file
--interval/-i specify intervals numbers, in minutes if with --live, it is in seconds
--list/-L list enabled modules
--live/-l running print live mode, which module will print
--ndays/-n show the value for the past days (default: 1)
--merge/-m merge multiply item to one
--help/-h help
Modules Enabled:
--swap swap usage
--partition Disk and partition usage
--cpu CPU share (user, system, interrupt, nice, & idle)
--mem Physical memory share (active, inactive, cached, free, wired)
--traffic Net traffic statistics
--load System Run Queue and load average
--tcp TCP traffic (v4)
--udp UDP traffic (v4)
--tcpx TCP connection data
--pcsw Process (task) creation and context switch

--live/-l 啓用實時模式,類似iostat等,可以配合-i參數和模塊參數使用。

--interval/-i 控制時間間隔,在打印歷史數據中,單位是分鐘,默認顯示間隔5分鐘;而實時模式(-l)下,單位是秒,默認是5秒。

--ndays/-n 控制顯示多長時間的歷史數據,默認1,單位天

--merge/-m 對有多個數據的展示,進行彙總,如機器上跑了3個squid,可以用 tsar --squid -m的放式進行展示彙總。

--cron 用於cron運行tsar採集功能。

常見用法列表:

tsar -i 1 -l 以1秒鐘爲間隔,實時打印tsar的概述數據

[like@mmdev5 conf]$ tsar -i 1 -l
Time        ---cpu-- ---mem-- ---tcp-- -----traffic---- --sda---  ---load- 
Time          util     util   retran    pktin  pktout     util     load1   
13/05-18:44    0.5     18.4      0.0     75.0   525.0      3.3      0.1   
13/05-18:44    0.4     18.4      0.0     93.0   544.0      0.0      0.1

tsar 顯示1天內的歷史彙總(summury)信息,以默認5分鐘爲間隔

tsar --cpu -i 1 顯示一天內cpu的歷史信息,以1分鐘爲間隔

tsar --live --mem -i 2 以2秒鐘爲間隔,實時打印mem的數據。

tsar --cpu --mem -i 1 顯示一天內的cpu和內存歷史數據,以1分鐘爲間隔。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章