Linux 服務器維護常識

最近項目分了任務:維護linux服務器,工欲善其事,必先利其器。首先我們應瞭解一些維護服務器的基本知識。

1、服務器重啓命令:reboot

2、服務器關閉命令:shutdown -r now

3、查看服務器性能命令:uptime或者用top

load average後面的三個數字分別代表:不同時間段(一秒、五秒、十五秒)的系統平均負載,負載的數值越小越好,數字越高,說明服務器的負載越大,這也可能是服務器出現某種問題的信號。

4、查看服務器的CPU是幾核的命令:ls /proc/acpi/processor

5、利用遠程卡監控實體服務器,登陸遠程卡的地址,如果可以登陸說明實體機沒死機或關閉,具體步驟:在瀏覽器中輸入遠程登錄卡的ip即可

網絡通信命令:
1) write (向另外一個用戶發信息,以Ctrl+D作爲結束)
語法:write [用戶名]
例如:write samlee
2) wall (write all ,向所有用戶發送消息)
3) ping (查看網絡連接,在linux系統中不能自動終止,可以用ctrl+c終止)注:要看時延和丟包率

    ping 61.139.2.69 -t

	輸入後會顯示一條條例如:reply from 61.139.2.69 bytes=32 time=20  ttl=249
	bytes是發送的數據包大小,time是到達目標時間,這個時間越小越好,ttl表示生存時間。
	如果不定時顯示Request timed out,則說明你的網絡存在掉包現象


   ping 自己ip  檢測自己網絡是否有問題(ifconfig 可以查出本機ip地址)
   ping 對方ip  檢測兩個主機網絡是否連通(當然有時沒ping通也不代表網絡

不通,可能對方有防火牆,做了什麼設置)
   ping 迴環地址:ping 127.0.0.1 證明tcp/ip協議沒問題
   例如:ping -c 3 www.baidu.com (-c 3 表示ping三次)
         ping -s 6000 www.baidu.com (-s 6000 改變發送包大小)
4)ifconfig (注:dos裏面是ipconfig ,而unix裏面是ifconfig)
5)shutdown (關機)
例如:shutdown -h now 
6)reboot (重啓)
7)date (查看系統時間)

=================================================================================================

                        top命令


top命令經常用來監控linux的系統狀況,比如cpu、內存的使用,程序員基本都知道這個命令,但比較奇怪的是能用好它的人卻很少,例如top監控視圖中內存數值的含義就有不少的曲解。
本文通過一個運行中的WEB服務器的top監控截圖,講述top視圖中的各種數據的含義,還包括視圖中各進程(任務)的字段的排序。
 
top進入視圖
top視圖 01
top視圖 01
【top視圖 01】是剛進入top的基本視圖,我們來結合這個視圖講解各個數據的含義。

第一行:
10:01:23 當前系統時間
126 days, 14:29 系統已經運行了126天14小時29分鐘(在這期間沒有重啓過)
2 users 當前有2個用戶登錄系統
load average: 1.15, 1.42, 1.44 load average後面的三個數分別是1分鐘、5分鐘、15分鐘的負載情況。
load average數據是每隔5秒鐘檢查一次活躍的進程數,然後按特定算法計算出的數值。如果這個數除以邏輯CPU的數量,結果高於5的時候就表明系統在超負荷運轉了。
 
第二行:
Tasks 任務(進程),系統現在共有183個進程,其中處於運行中的有1個,182個在休眠(sleep),stoped狀態的有0個,zombie狀態(殭屍)的有0個。
 
第三行:cpu狀態
6.7% us 用戶空間佔用CPU的百分比。
0.4% sy 內核空間佔用CPU的百分比。
0.0% ni 改變過優先級的進程佔用CPU的百分比
92.9% id 空閒CPU百分比
0.0% wa IO等待佔用CPU的百分比
0.0% hi 硬中斷(Hardware IRQ)佔用CPU的百分比
0.0% si 軟中斷(Software Interrupts)佔用CPU的百分比
在這裏CPU的使用比率和windows概念不同,如果你不理解用戶空間和內核空間,需要充充電了。
 
第四行:內存狀態
8306544k total 物理內存總量(8GB)
7775876k used 使用中的內存總量(7.7GB)
530668k free 空閒內存總量(530M)
79236k buffers 緩存的內存量 (79M)
 
第五行:swap交換分區
2031608k total 交換區總量(2GB)
2556k used 使用的交換區總量(2.5M)
2029052k free 空閒交換區總量(2GB)
4231276k cached 緩衝的交換區總量(4GB)
 
這裏要說明的是不能用windows的內存概念理解這些數據,如果按windows的方式此臺服務器危矣:8G的內存總量只剩下530M的可用內存。Linux的內存管理有其特殊性,複雜點需要一本書來說明,這裏只是簡單說點和我們傳統概念(windows)的不同。
 
第四行中使用中的內存總量(used)指的是現在系統內核控制的內存數,空閒內存總量(free)是內核還未納入其管控範圍的數量。納入內核管理的內存不見得都在使用中,還包括過去使用過的現在可以被重複利用的內存,內核並不把這些可被重新使用的內存交還到free中去,因此在linux上free內存會越來越少,但不用爲此擔心。
如果出於習慣去計算可用內存數,這裏有個近似的計算公式:第四行的free + 第四行的buffers + 第五行的cached,按這個公式此臺服務器的可用內存:530668+79236+4231276 = 4.7GB。
 
對於內存監控,在top裏我們要時刻監控第五行swap交換分區的used,如果這個數值在不斷的變化,說明內核在不斷進行內存和swap的數據交換,這是真正的內存不夠用了。
 
第六行是空行
第七行以下:各進程(任務)的狀態監控
PID 進程id
USER 進程所有者
PR 進程優先級
NI nice值。負值表示高優先級,正值表示低優先級
VIRT 進程使用的虛擬內存總量,單位kb。VIRT=SWAP+RES
RES 進程使用的、未被換出的物理內存大小,單位kb。RES=CODE+DATA
SHR 共享內存大小,單位kb
S 進程狀態。D=不可中斷的睡眠狀態 R=運行 S=睡眠 T=跟蹤/停止 Z=殭屍進程
%CPU 上次更新到現在的CPU時間佔用百分比

%MEM 進程使用的物理內存百分比
TIME+ 進程使用的CPU時間總計,單位1/100秒
COMMAND 進程名稱(命令名/命令行)
多U多核CPU監控
在top基本視圖中,按鍵盤數字1,可監控每個邏輯CPU的狀況:
 
top視圖 02
top視圖 02
觀察上圖,服務器有16個邏輯CPU,實際上是4個物理CPU。
進程字段排序
默認進入top時,各進程是按照CPU的佔用量來排序的,在【top視圖 01】中進程ID爲14210的java進程排在第一(cpu佔用100%),進程ID爲14183的java進程排在第二(cpu佔用12%)。可通過鍵盤指令來改變排序字段,比如想監控哪個進程佔用MEM最多,我一般的使用方法如下:
1. 敲擊鍵盤b(打開/關閉加亮效果),top的視圖變化如下:
 
top視圖 03
top視圖 03
我們發現進程id爲10704的top進程被加亮了,top進程就是視圖第二行顯示的唯一的運行態(runing)的那個進程,可以通過敲擊y鍵關閉或打開運行態進程的加亮效果。
2. 敲擊鍵盤x(打開/關閉排序列的加亮效果),top的視圖變化如下:
 
top視圖 04
top視圖 04
可以看到,top默認的排序列是%CPU。
3. 通過shift + >或shift + <可以向右或左改變排序列,下圖是按一次shift + >的效果圖:
 
top視圖 05
top視圖 05
視圖現在已經按照%MEM來排序了。
改變進程顯示字段
1. 敲擊f鍵,top進入另一個視圖,在這裏可以編排基本視圖中的顯示字段:
 
top視圖 06
top視圖 06
這裏列出了所有可在top基本視圖中顯示的進程字段,有*並且標註爲大寫字母的字段是可顯示的,沒有*並且是小寫字母的字段是不顯示的。如果要在基本視圖中顯示CODE和DATA兩個字段,可以通過敲擊r和s鍵:
 
top視圖 07
top視圖 07
2. 回車返回基本視圖,可以看到多了CODE和DATA兩個字段:
 
top視圖 08
top視圖 08
top命令的補充
top命令是Linux上進行系統監控的首選命令,但有時候卻達不到我們的要求,比如當前這臺服務器,top監控有很大的侷限性。這臺服務器運行着websphere集羣,有兩個節點服務,就是【top視圖 01】中的老大、老二兩個java進程,top命令的監控最小單位是進程,所以看不到我關心的java線程數和客戶連接數,而這兩個指標是java的web服務非常重要的指標,通常我用ps和netstate兩個命令來補充top的不足。
 
監控java線程數:
ps -eLf | grep java | wc -l
監控網絡客戶連接數:
netstat -n | grep tcp | grep 偵聽端口 | wc -l
上面兩個命令,可改動grep的參數,來達到更細緻的監控要求。
 
在Linux系統一切都是文件的思想貫徹指導下,所有進程的運行狀態都可以用文件來獲取。系統根目錄/proc中,每一個數字子目錄的名字都是運行中的進程的PID,進入任一個進程目錄,可通過其中文件或目錄來觀察進程的各項運行指標,例如task目錄就是用來描述進程中線程的,因此也可以通過下面的方法獲取某進程中運行中的線程數量(PID指的是進程ID):
 
ls /proc/PID/task | wc -l
在linux中還有一個命令pmap,來輸出進程內存的狀況,可以用來分析線程堆棧:
pmap PID
 

==================================================================================================


Shell應用技巧
bash (ba shell)/bin/bash 應用技巧
1)<tab>鍵 補齊文件名或命令
2)<down><up>鍵查看以前執行過的命令
3) ctrl +l  清屏
4)ctrl +u  清除你剛敲這行命令

命令別名:
5) alias(別名) 命令別名設置:
例如:alias copy=cp
      alias xrm="rm -r"
查看別名信息直接用:alias
刪除別名:unadias copy

6)輸入/輸出重定向:
0 (STDIN) 標準輸入 (鍵盤鼠標)
1  (STDOUT)標準輸出   (顯示器)
2  (STDERR)標準錯誤輸出 (顯示器)
>或>> 輸出重定向
例如:ls -l /tmp > /tmp.msg (將/tmp中的詳細信息導入到tmp.msg中,這樣方

便給其他人看結果)
      date >> /tmp.msg(將date信息追加到/tmp.msg中,如果直接>則會覆蓋其

內容)
<     輸入重定向
例如:wall < /etc/motd (將/etc/motd中的內容作爲輸入廣播出去)
2>    錯誤輸出重定向
例如:cp -R /usr /backup/usr.bak 2> /bak.error(將/usr備份

到/backup/usr.bak中,如果出錯輸出到/bak.error中)
7)管道:
管道:將一個命令的輸出傳送給另一個命令,作爲另一個命令的輸入。
使用方法:
命令1|命令|2命令|3命令4、、、|命令n
例如:ls -l /etc |more
      ls -l /etc |grep init
      ls -l /etc |grep init |wc -l (其中wc -l 統計行數)
8)命令連接符
;用;間隔的各個命令按順序依次執行。
&& 前後命令的執行存在邏輯與關係,只有&&前面的命令執行成功後,它後面的命

令才被執行。
例如:write marry </home/samlee<love.txt && rm /home/samlee<love.txt
|| 前後命令的執行存在邏輯或關係,只有&&前面的命令執行失敗後,它後面的命

令才被執行。
例如:writ marry < /home/samlee<love.txt ||mail marry <

/home/samlee<love.text
9)` `命令替換符
命令替換:將一個命令的輸出作爲另一個命令的參數。
格式:命令1 `命令2`
例如:ls -l `which touch`

 



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章