Linux故障分析與排錯

 

1.1、系統故障分析
a)         判斷問題的性質
b)         重演出錯過程
c)         查找進一步信息
d)         從簡單的的方法入手
e)         在修改的時候備份配置文件
f)          修復Linux系統不同階段的故障
g)         將系統引導到不同的運行級別
h)         使用救援模式
 
1.2、應用故障分析的方法:
 
a)         描繪問題的特徵
b)         發現全部信息
c)         查找可能的原因
d)         首先嚐試容易的事情
e)         配置文件:修改前要備份,使用可用的工具
f)          重現這個問題
 
1.3、有用的命令:
 
a)         History,
b)         grep,    less /var/log/messages |grep error
c)         diff, diff file1 file2
d)         find /目錄 -cmin -60 查找60分鐘以內被修改過的文件
e)         Strace command
f)          Tail -f logfile
 
1.4、X服務的故障
 
a)         不要在runlevel 5級別下進行X服務的排錯
 
b)         當改變了硬件時,先嚐試使用命令:system-config-display
c)         使用命令:X -probeonly
d)         查看/home與/tmp空間是否還有剩餘,或者使用者是否達到磁盤限額
 
 
1.5、Selinux服務的故障
 
a)         日誌幫助工具:setroubleshootd      sealert -b
b)         /var/log/messages
c)         /var/log/audit/audit.log
d)         查看幫助手冊,比如:httpd_selinux,samba_selinux,ftpd_selinux等等
e)         策略改變
f)          System-config-selinux
g)         Setenforce
h)         Setsebool
i)           Semanage
 
1.6、Networking的故障
 
a)         主機名的解析,dig   server1.example.com
b)         ip地址的配置,ifconfig,netconfig,setup,/etc/sysconfig/network-scripts/ifcfg-eth0
c)         默認網關與路由,查看網關路由:route -n或者 ip r
d)         模塊的詳細說明
e)         激活設備
 
1.7、Boot process的故障
 
a)         bootloader configuration
b)         kernel
c)         /sbin/init starting init
d)         /etc/rc.d/rc.sysinit
e)         /etc/rc.d/rc, /etc/rc.d/rc?.d/ 進入runlevel 級別
f)          /etc/rc.d/rc.local
g)         虛擬控制檯
h)         X display manager
1.8、rpm數據庫損壞
故障原因:
a)         非正常關機、誤刪除運行中的程序文件
b)         RPM數據文件被誤寫或刪除
 
故障現象:
a)         不能正常查詢rpm包信息 rpm -ql ; rpm -qa .....
b)         無法安裝、升級或卸載軟件包等 rpm -U ; rpm -i......
c)         解決方案:
d)         重建RPM數據庫
e)         重建命令:rpm --rebuilddb 或 rpm --initdb
 
1.9、磁盤資源耗盡故障
故障原因:
a)         磁盤空間已被大量的數據佔滿,空間耗盡
b)         雖然還有可用空間,但文件數i節點耗盡
 
故障現象:
a)         無法寫入新的文件,提示“… : 設備上沒有空間”
b)         部分程序無法運行,甚至系統無法啓動
 
解決方案:
a)         清理磁盤空間,刪除無用、冗餘的文件
b)         轉移或刪除佔用大量i節點的瑣碎文件
c)         進 入單用戶模式、急救模式進行修復
d)         用戶設置磁盤配額---系統管理中必做的

排錯實例文檔下載:http://down.51cto.com/data/509260

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章