Linux故障分析与排错

 

1.1、系统故障分析
a)         判断问题的性质
b)         重演出错过程
c)         查找进一步信息
d)         从简单的的方法入手
e)         在修改的时候备份配置文件
f)          修复Linux系统不同阶段的故障
g)         将系统引导到不同的运行级别
h)         使用救援模式
 
1.2、应用故障分析的方法:
 
a)         描绘问题的特征
b)         发现全部信息
c)         查找可能的原因
d)         首先尝试容易的事情
e)         配置文件:修改前要备份,使用可用的工具
f)          重现这个问题
 
1.3、有用的命令:
 
a)         History,
b)         grep,    less /var/log/messages |grep error
c)         diff, diff file1 file2
d)         find /目录 -cmin -60 查找60分钟以内被修改过的文件
e)         Strace command
f)          Tail -f logfile
 
1.4、X服务的故障
 
a)         不要在runlevel 5级别下进行X服务的排错
 
b)         当改变了硬件时,先尝试使用命令:system-config-display
c)         使用命令:X -probeonly
d)         查看/home与/tmp空间是否还有剩余,或者使用者是否达到磁盘限额
 
 
1.5、Selinux服务的故障
 
a)         日志帮助工具:setroubleshootd      sealert -b
b)         /var/log/messages
c)         /var/log/audit/audit.log
d)         查看帮助手册,比如:httpd_selinux,samba_selinux,ftpd_selinux等等
e)         策略改变
f)          System-config-selinux
g)         Setenforce
h)         Setsebool
i)           Semanage
 
1.6、Networking的故障
 
a)         主机名的解析,dig   server1.example.com
b)         ip地址的配置,ifconfig,netconfig,setup,/etc/sysconfig/network-scripts/ifcfg-eth0
c)         默认网关与路由,查看网关路由:route -n或者 ip r
d)         模块的详细说明
e)         激活设备
 
1.7、Boot process的故障
 
a)         bootloader configuration
b)         kernel
c)         /sbin/init starting init
d)         /etc/rc.d/rc.sysinit
e)         /etc/rc.d/rc, /etc/rc.d/rc?.d/ 进入runlevel 级别
f)          /etc/rc.d/rc.local
g)         虚拟控制台
h)         X display manager
1.8、rpm数据库损坏
故障原因:
a)         非正常关机、误删除运行中的程序文件
b)         RPM数据文件被误写或删除
 
故障现象:
a)         不能正常查询rpm包信息 rpm -ql ; rpm -qa .....
b)         无法安装、升级或卸载软件包等 rpm -U ; rpm -i......
c)         解决方案:
d)         重建RPM数据库
e)         重建命令:rpm --rebuilddb 或 rpm --initdb
 
1.9、磁盘资源耗尽故障
故障原因:
a)         磁盘空间已被大量的数据占满,空间耗尽
b)         虽然还有可用空间,但文件数i节点耗尽
 
故障现象:
a)         无法写入新的文件,提示“… : 设备上没有空间”
b)         部分程序无法运行,甚至系统无法启动
 
解决方案:
a)         清理磁盘空间,删除无用、冗余的文件
b)         转移或删除占用大量i节点的琐碎文件
c)         进 入单用户模式、急救模式进行修复
d)         用户设置磁盘配额---系统管理中必做的

排错实例文档下载:http://down.51cto.com/data/509260

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章