Linux 服務器維護常識

最近項目分了任務：維護linux服務器，工欲善其事，必先利其器。首先我們應瞭解一些維護服務器的基本知識。

1、服務器重啓命令：reboot

2、服務器關閉命令：shutdown -r now

3、查看服務器性能命令：uptime或者用top

load average後面的三個數字分別代表：不同時間段（一秒、五秒、十五秒）的系統平均負載，負載的數值越小越好，數字越高，說明服務器的負載越大,這也可能是服務器出現某種問題的信號。

4、查看服務器的CPU是幾核的命令：ls /proc/acpi/processor

5、利用遠程卡監控實體服務器，登陸遠程卡的地址，如果可以登陸說明實體機沒死機或關閉，具體步驟：在瀏覽器中輸入遠程登錄卡的ip即可

網絡通信命令：
1) write (向另外一個用戶發信息，以Ctrl+D作爲結束)
語法：write [用戶名]
例如：write samlee
2) wall (write all ,向所有用戶發送消息)
3) ping (查看網絡連接，在linux系統中不能自動終止，可以用ctrl+c終止）注：要看時延和丟包率

ping 61.139.2.69 -t

	輸入後會顯示一條條例如:reply from 61.139.2.69 bytes=32 time=20  ttl=249
	bytes是發送的數據包大小，time是到達目標時間，這個時間越小越好，ttl表示生存時間。
	如果不定時顯示Request timed out，則說明你的網絡存在掉包現象

ping 自己ip 檢測自己網絡是否有問題（ifconfig 可以查出本機ip地址）
ping 對方ip 檢測兩個主機網絡是否連通（當然有時沒ping通也不代表網絡

不通，可能對方有防火牆，做了什麼設置）
   ping 迴環地址：ping 127.0.0.1 證明tcp/ip協議沒問題
   例如：ping -c 3 www.baidu.com （-c 3 表示ping三次）
         ping -s 6000 www.baidu.com (-s 6000 改變發送包大小)
4)ifconfig (注：dos裏面是ipconfig ，而unix裏面是ifconfig)
5)shutdown (關機)
例如：shutdown -h now
6)reboot (重啓)
7)date (查看系統時間)

=================================================================================================

top命令

top命令經常用來監控linux的系統狀況，比如cpu、內存的使用，程序員基本都知道這個命令，但比較奇怪的是能用好它的人卻很少，例如top監控視圖中內存數值的含義就有不少的曲解。

本文通過一個運行中的WEB服務器的top監控截圖，講述top視圖中的各種數據的含義，還包括視圖中各進程（任務）的字段的排序。

top進入視圖

top視圖 01

【top視圖 01】是剛進入top的基本視圖，我們來結合這個視圖講解各個數據的含義。

第一行：
10:01:23 當前系統時間
126 days, 14:29 系統已經運行了126天14小時29分鐘（在這期間沒有重啓過）
2 users 當前有2個用戶登錄系統
load average: 1.15, 1.42, 1.44 load average後面的三個數分別是1分鐘、5分鐘、15分鐘的負載情況。

load average數據是每隔5秒鐘檢查一次活躍的進程數，然後按特定算法計算出的數值。如果這個數除以邏輯CPU的數量，結果高於5的時候就表明系統在超負荷運轉了。

第二行：
Tasks 任務（進程），系統現在共有183個進程，其中處於運行中的有1個，182個在休眠（sleep），stoped狀態的有0個，zombie狀態（殭屍）的有0個。

第三行：cpu狀態
6.7% us 用戶空間佔用CPU的百分比。
0.4% sy 內核空間佔用CPU的百分比。
0.0% ni 改變過優先級的進程佔用CPU的百分比
92.9% id 空閒CPU百分比
0.0% wa IO等待佔用CPU的百分比
0.0% hi 硬中斷（Hardware IRQ）佔用CPU的百分比
0.0% si 軟中斷（Software Interrupts）佔用CPU的百分比

在這裏CPU的使用比率和windows概念不同，如果你不理解用戶空間和內核空間，需要充充電了。

第四行：內存狀態
8306544k total 物理內存總量（8GB）
7775876k used 使用中的內存總量（7.7GB）
530668k free 空閒內存總量（530M）
79236k buffers 緩存的內存量（79M）

第五行：swap交換分區
2031608k total 交換區總量（2GB）
2556k used 使用的交換區總量（2.5M）
2029052k free 空閒交換區總量（2GB）
4231276k cached 緩衝的交換區總量（4GB）

這裏要說明的是不能用windows的內存概念理解這些數據，如果按windows的方式此臺服務器危矣：8G的內存總量只剩下530M的可用內存。Linux的內存管理有其特殊性，複雜點需要一本書來說明，這裏只是簡單說點和我們傳統概念（windows）的不同。

第四行中使用中的內存總量（used）指的是現在系統內核控制的內存數，空閒內存總量（free）是內核還未納入其管控範圍的數量。納入內核管理的內存不見得都在使用中，還包括過去使用過的現在可以被重複利用的內存，內核並不把這些可被重新使用的內存交還到free中去，因此在linux上free內存會越來越少，但不用爲此擔心。

如果出於習慣去計算可用內存數，這裏有個近似的計算公式：第四行的free + 第四行的buffers + 第五行的cached，按這個公式此臺服務器的可用內存：530668+79236+4231276 = 4.7GB。

對於內存監控，在top裏我們要時刻監控第五行swap交換分區的used，如果這個數值在不斷的變化，說明內核在不斷進行內存和swap的數據交換，這是真正的內存不夠用了。

第六行是空行

第七行以下：各進程（任務）的狀態監控
PID 進程id
USER 進程所有者
PR 進程優先級
NI nice值。負值表示高優先級，正值表示低優先級
VIRT 進程使用的虛擬內存總量，單位kb。VIRT=SWAP+RES
RES 進程使用的、未被換出的物理內存大小，單位kb。RES=CODE+DATA
SHR 共享內存大小，單位kb
S 進程狀態。D=不可中斷的睡眠狀態 R=運行 S=睡眠 T=跟蹤/停止 Z=殭屍進程
%CPU 上次更新到現在的CPU時間佔用百分比

%MEM 進程使用的物理內存百分比
TIME+ 進程使用的CPU時間總計，單位1/100秒
COMMAND 進程名稱（命令名/命令行）

多U多核CPU監控

在top基本視圖中，按鍵盤數字1，可監控每個邏輯CPU的狀況：

top視圖 02

觀察上圖，服務器有16個邏輯CPU，實際上是4個物理CPU。

進程字段排序

默認進入top時，各進程是按照CPU的佔用量來排序的，在【top視圖 01】中進程ID爲14210的java進程排在第一（cpu佔用100%），進程ID爲14183的java進程排在第二（cpu佔用12%）。可通過鍵盤指令來改變排序字段，比如想監控哪個進程佔用MEM最多，我一般的使用方法如下：

1. 敲擊鍵盤b（打開/關閉加亮效果），top的視圖變化如下：

top視圖 03

我們發現進程id爲10704的top進程被加亮了，top進程就是視圖第二行顯示的唯一的運行態（runing）的那個進程，可以通過敲擊y鍵關閉或打開運行態進程的加亮效果。

2. 敲擊鍵盤x（打開/關閉排序列的加亮效果），top的視圖變化如下：

top視圖 04

可以看到，top默認的排序列是%CPU。

3. 通過shift + >或shift + <可以向右或左改變排序列，下圖是按一次shift + >的效果圖：

top視圖 05

視圖現在已經按照%MEM來排序了。

改變進程顯示字段

1. 敲擊f鍵，top進入另一個視圖，在這裏可以編排基本視圖中的顯示字段：

top視圖 06

這裏列出了所有可在top基本視圖中顯示的進程字段，有*並且標註爲大寫字母的字段是可顯示的，沒有*並且是小寫字母的字段是不顯示的。如果要在基本視圖中顯示CODE和DATA兩個字段，可以通過敲擊r和s鍵：

top視圖 07

2. 回車返回基本視圖，可以看到多了CODE和DATA兩個字段：

top視圖 08

top命令的補充

top命令是Linux上進行系統監控的首選命令，但有時候卻達不到我們的要求，比如當前這臺服務器，top監控有很大的侷限性。這臺服務器運行着websphere集羣，有兩個節點服務，就是【top視圖 01】中的老大、老二兩個java進程，top命令的監控最小單位是進程，所以看不到我關心的java線程數和客戶連接數，而這兩個指標是java的web服務非常重要的指標，通常我用ps和netstate兩個命令來補充top的不足。

監控java線程數：
ps -eLf | grep java | wc -l

監控網絡客戶連接數：
netstat -n | grep tcp | grep 偵聽端口 | wc -l

上面兩個命令，可改動grep的參數，來達到更細緻的監控要求。

在Linux系統一切都是文件的思想貫徹指導下，所有進程的運行狀態都可以用文件來獲取。系統根目錄/proc中，每一個數字子目錄的名字都是運行中的進程的PID，進入任一個進程目錄，可通過其中文件或目錄來觀察進程的各項運行指標，例如task目錄就是用來描述進程中線程的，因此也可以通過下面的方法獲取某進程中運行中的線程數量（PID指的是進程ID）：

ls /proc/PID/task | wc -l

在linux中還有一個命令pmap，來輸出進程內存的狀況，可以用來分析線程堆棧：

pmap PID

==================================================================================================

Shell應用技巧
bash （ba shell）/bin/bash 應用技巧
1)<tab>鍵補齊文件名或命令
2）<down><up>鍵查看以前執行過的命令
3) ctrl +l 清屏
4）ctrl +u 清除你剛敲這行命令

命令別名：
5) alias（別名）命令別名設置：
例如：alias copy=cp
alias xrm="rm -r"
查看別名信息直接用:alias
刪除別名：unadias copy

6)輸入/輸出重定向：
0 （STDIN) 標準輸入（鍵盤鼠標）
1 (STDOUT)標準輸出（顯示器）
2 (STDERR)標準錯誤輸出（顯示器）
>或>> 輸出重定向
例如：ls -l /tmp > /tmp.msg （將/tmp中的詳細信息導入到tmp.msg中，這樣方

便給其他人看結果）
date >> /tmp.msg（將date信息追加到/tmp.msg中，如果直接>則會覆蓋其

內容）
< 輸入重定向
例如：wall < /etc/motd (將/etc/motd中的內容作爲輸入廣播出去)
2> 錯誤輸出重定向
例如：cp -R /usr /backup/usr.bak 2> /bak.error(將/usr備份

令才被執行。
例如：write marry </home/samlee<love.txt && rm /home/samlee<love.txt
|| 前後命令的執行存在邏輯或關係，只有&&前面的命令執行失敗後，它後面的命

令才被執行。
例如：writ marry < /home/samlee<love.txt ||mail marry <

/home/samlee<love.text
9)` `命令替換符
命令替換：將一個命令的輸出作爲另一個命令的參數。
格式：命令1 `命令2`
例如：ls -l `which touch`

Linux 服務器維護常識

LoadRunner 學習筆記一

LoadRunner學習筆記二

Linux下時間同步與更改

Linux 服務器維護常識

Tcp/ip三次握手

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結