Linux常見運維故障及處理方法分享（持續更新）

1、Redhat7重啓後出現網卡名有變動，或者要固定使用eth的方式命名網卡。
（1）在/etc/sysconfig/grub.conf配置文件中追加參數net.ifnames=0
（2）執行命令grub2-mkconfig -o /etc/grub2.cfg，生層配置文件
（3） reboot重啓。

2、cpu佔用過高。
（1）用ps aux查看哪個進程佔用cpu過高。
（2） top -H -p pid 查看哪個線程佔用cpu
（3）jstack pid
（4）對每個高耗CPU的線程，把線程id，轉換爲16進程數（可以使用命令：printf "%x\n" tid ），然後從thread stack中搜索到對應的線程。
（5）按內存從大到小排列
ps -e -o "%C : %p : %z : %a"|sort -k5 -nr
（6）按cpu利用率從大到小排列
ps -e -o "%C : %p : %z : %a"|sort -nr

3、進程無法停止。
（1）用ps -aux 查看進程狀態。
如果進程狀態爲D狀態，D狀態爲不可中斷的深度睡眠，同步IO在做讀或寫操作，cpu不能做其他事情，只能等待。

4、服務器更換網卡後，讓ip從新生效。
（1）備份/etc/udev/rules.d/70-persistent-net.rules配置文件後將其刪除。
（2）reboot重啓系統後恢復。

5、Read-onlyfilesystem
A：可以重啓恢復。
B：重新掛載。
（1）rm -rf /etc/.pwd.lock。
（2）mount -o remount rw / 重新以可讀可寫的方式掛在/文件系統。
（3）如有報錯爲：/dev/sda1 這樣的分區信息error，那就執行fsck -y /dev/sda1修復。

6、Linux系統安裝初始狀態時，找不到硬盤，並無法進入下一步安裝。
（1）進入COMS設置，找到硬盤設置的相關選項，並設置爲兼容模式。

7、配置好iptables過濾規則後，重啓iptables服務後，發現原有的規則全部丟失。
（1）修改/etc/sysconfig/iptables-config配置文件，將IPTABLES_SAVE_ON_RESTART=”no”改爲yes。
（2）用iptables-save > /etc/sysconfig/iptables命令保存。

8、Vmware虛擬機中安裝redhat報錯，找不到硬盤。
（1）假如之前安裝了redhat5版本，現在要從新安裝redhat6，需要從新配置創建VMware。

9、redhat某一時間cpu利用率過高。
（1）將/var/log/sa/sa開頭的文件拷貝出來。
（2）用sar命令查看cpu等資源調用情況。

10、xfs文件系統報錯。
（1）執行xfs_repair -L /dev/sda1命令修復

11、創建，擴展LVM。
（1）添加物理卷：pvcreate /dev/sdc1
（2）創建卷組：vgcreate VG1 /dev/sdc1 /dev/sdc2
（3）創建邏輯卷1：lvcreate -n lv1 -L +50M VG1
（4）創建邏輯卷2：lvcreate -n lv2 -L +60M VG1
（5）刪除/dev/VG1/lv1：lvremove /dev/VG1/lv1
（6）刪除/dev/VG1：vgremove /dev/VG1
（7）刪除物理卷：pvremove /dev/sdc1
（8）擴展lv：lvextend -L +50M /dev/VG1/lv2

12、清除僵死進程
ps -eal | awk '{ if ($2 == "Z") {print $4}}' | kill -9

13、報toomanyopenfile錯誤。
（1）先執行
echo“”>>/etc/security/limits.conf
echo“softnproc65535″>>/etc/security/limits.conf
echo“hardnproc65535″>>/etc/security/limits.conf
echo“softnofile65535″>>/etc/security/limits.conf
echo“hardnofile65535″>>/etc/security/limits.conf
echo“”>>/root/.bash_profile
echo“ulimit-n65535″>>/root/.bash_profile
echo“ulimit-u65535″>>/root/.bash_profile
（2）重啓或者執行執行ulimit-u655345&&ulimit-n65535

14、mount命令掛載NFS服務的共享目錄，沒有響應。
（1）portmap服務沒有啓動，必須啓動該服務

15、查詢一個進程已經運行了多長時間。
（1）ps -eo comm,etime | grep syslogd | awk '{print $2}'

16、查看物理內存大小。
（1）dmidecode | grep Size | grep MB | awk '{a+=$2}END{print a}'

——————————————————
以上內容更新於2018-4-12,以後會持續更新。
如有錯誤的地方還請各位前輩私信指教~

17、問題：
xstart 圖形化遠程報錯（/etc/ssh/sshd_config 中已經開啓了X11Forwarding yes，但還是有報錯）

解決方法：
安裝”xorg-x11-xauth“軟件包，在系統光盤裏就有。

18、查看系統最後重啓時間:
(1):
last reboot

(2):
uptime

(3):
who -b

19、sar性能數據分析。
若查看/root/sa29文件從8:10-9:00的cpu佔用情況
命令：sar -u -s 08:10:00 -e 09:00:00 -f /root/sa29

20、

解決方法：
echo -1 >/proc/sys/kernel/perf_event_paranoid

21、rhedhat6關閉transparent hugepage的方法
在Linux6版本關閉THP的方法如下：
一、永久關閉的方法：
（1）. 在/boot/grub/grub.conf文件的kernel 所在行追加如下關鍵字：
transparent_hugepage=never
（2）. 重啓操作系統後生效。
二、臨時關閉的方法（下次重啓時不生效）：
以root身份運行如下命令：
echo never > /sys/kernel/mm/redhat_transparent_hugepage/enabled
echo never > /sys/kernel/mm/redhat_transparent_hugepage/defrag
按照以上操作後，可以通過如下命令檢查是否生效：
grep -i HugePages_Total /proc/meminfo
HugePages_Total: 0
如果顯示爲0，代表已經關閉成功。

——————————————————
以上內容更新於2018-6-1,以後會持續更新。
如有錯誤的地方還請各位前輩多指教~

Linux常見運維故障及處理方法分享（持續更新）

有些人你可以不必忘記，也不必留在回憶裏

敢不敢問你對象這些問題？

我爸養了我二十幾年我還會和他發脾氣，憑什麼跟你就要低三下四？

話雖刺耳，但你別不信

散心啊

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結