Linux常見運維故障及處理方法分享(持續更新)

1、Redhat7重啓後出現網卡名有變動,或者要固定使用eth的方式命名網卡。
(1)在/etc/sysconfig/grub.conf配置文件中追加參數net.ifnames=0
(2)執行命令grub2-mkconfig -o /etc/grub2.cfg,生層配置文件
(3) reboot重啓。


2、cpu佔用過高。
(1) 用ps aux查看哪個進程佔用cpu過高。
(2) top -H -p pid 查看哪個線程佔用cpu
(3)jstack pid
(4)對每個高耗CPU的線程,把線程id,轉換爲16進程數( 可以使用命令:printf "%x\n" tid ),然後從thread stack中搜索到對應的線程。
(5)按內存從大到小排列
ps -e -o "%C : %p : %z : %a"|sort -k5 -nr
(6)按cpu利用率從大到小排列
ps -e -o "%C : %p : %z : %a"|sort -nr


3、進程無法停止。
(1)用ps -aux 查看進程狀態。
如果進程狀態爲D狀態,D狀態爲不可中斷的深度睡眠,同步IO在做讀或寫操作,cpu不能做其他事情,只能等待。


4、服務器更換網卡後,讓ip從新生效。
(1)備份/etc/udev/rules.d/70-persistent-net.rules配置文件後將其刪除。
(2)reboot重啓系統後恢復。


5、Read-onlyfilesystem
A:可以重啓恢復。
B:重新掛載。
(1)rm -rf /etc/.pwd.lock。
(2)mount -o remount rw / 重新以可讀可寫的方式掛在/文件系統。
(3)如有報錯爲:/dev/sda1 這樣的分區信息error,那就執行fsck -y /dev/sda1修復。


6、Linux系統安裝初始狀態時,找不到硬盤,並無法進入下一步安裝。
(1)進入COMS設置,找到硬盤設置的相關選項,並設置爲兼容模式。


7、配置好iptables過濾規則後,重啓iptables服務後,發現原有的規則全部丟失。
(1)修改/etc/sysconfig/iptables-config配置文件,將IPTABLES_SAVE_ON_RESTART=”no”改爲yes。
(2)用iptables-save > /etc/sysconfig/iptables命令保存。


8、Vmware虛擬機中安裝redhat報錯,找不到硬盤。
(1)假如之前安裝了redhat5版本,現在要從新安裝redhat6,需要從新配置創建VMware。


9、redhat某一時間cpu利用率過高。
(1)將/var/log/sa/sa開頭的文件拷貝出來。
(2)用sar命令查看cpu等資源調用情況。


10、xfs文件系統報錯。
(1)執行xfs_repair -L /dev/sda1命令修復


11、創建,擴展LVM。
(1)添加物理卷:pvcreate /dev/sdc1
(2)創建卷組:vgcreate VG1 /dev/sdc1 /dev/sdc2
(3)創建邏輯卷1:lvcreate -n lv1 -L +50M VG1
(4)創建邏輯卷2:lvcreate -n lv2 -L +60M VG1
(5)刪除/dev/VG1/lv1:lvremove /dev/VG1/lv1
(6)刪除/dev/VG1:vgremove /dev/VG1
(7)刪除物理卷:pvremove /dev/sdc1
(8)擴展lv:lvextend -L +50M /dev/VG1/lv2


12、清除僵死進程
ps -eal | awk '{ if ($2 == "Z") {print $4}}' | kill -9


13、報toomanyopenfile錯誤。
(1)先執行
echo“”>>/etc/security/limits.conf
echo“softnproc65535″>>/etc/security/limits.conf
echo“
hardnproc65535″>>/etc/security/limits.conf
echo“softnofile65535″>>/etc/security/limits.conf
echo“
hardnofile65535″>>/etc/security/limits.conf
echo“”>>/root/.bash_profile
echo“ulimit-n65535″>>/root/.bash_profile
echo“ulimit-u65535″>>/root/.bash_profile
(2)重啓或者執行執行ulimit-u655345&&ulimit-n65535


14、mount命令掛載NFS服務的共享目錄,沒有響應。
(1)portmap服務沒有啓動,必須啓動該服務


15、查詢一個進程已經運行了多長時間。
(1)ps -eo comm,etime | grep syslogd | awk '{print $2}'


16、查看物理內存大小。
(1)dmidecode | grep Size | grep MB | awk '{a+=$2}END{print a}'


——————————————————
以上內容更新於2018-4-12,以後會持續更新。
如有錯誤的地方還請各位前輩私信指教~


17、問題:
xstart 圖形化遠程報錯(/etc/ssh/sshd_config 中已經開啓了X11Forwarding yes,但還是有報錯)
Linux常見運維故障及處理方法分享(持續更新)
解決方法:
安裝”xorg-x11-xauth“軟件包,在系統光盤裏就有。


18、查看系統最後重啓時間:
(1):
last reboot

(2):
uptime

(3):
who -b


19、sar性能數據分析。
若查看/root/sa29文件 從8:10-9:00的cpu佔用情況
命令:sar -u -s 08:10:00 -e 09:00:00 -f /root/sa29


20、
Linux常見運維故障及處理方法分享(持續更新)

解決方法:
echo -1 >/proc/sys/kernel/perf_event_paranoid


21、rhedhat6關閉transparent hugepage的方法
在Linux6版本關閉THP的方法如下:
一、永久關閉的方法:
(1). 在/boot/grub/grub.conf文件的kernel 所在行追加如下關鍵字:
transparent_hugepage=never
(2). 重啓操作系統後生效。
二、臨時關閉的方法(下次重啓時不生效):
以root身份運行如下命令:
echo never > /sys/kernel/mm/redhat_transparent_hugepage/enabled
echo never > /sys/kernel/mm/redhat_transparent_hugepage/defrag
按照以上操作後,可以通過如下命令檢查是否生效:
grep -i HugePages_Total /proc/meminfo
HugePages_Total: 0
如果顯示爲0,代表已經關閉成功。

——————————————————
以上內容更新於2018-6-1,以後會持續更新。
如有錯誤的地方還請各位前輩多指教~


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章