Linux - 阿里雲:記錄一次低配 ecs 服務器在 cpu、內存打滿情況下無法遠程連接的解決過程

背景

自我學習ing..然後在 1c2g 的雲服務器上起了 5 個 mysql 集羣節點,然後輸入命令就開始卡了,開始懷疑是不是系統資源爆掉了

 

來到阿里雲後臺

  • 因爲服務器已經連不上了,沒辦法通過 top 等命令查看系統資源情況,只能來到控制檯查看了
  • 然後就看到 CPU、內存都被打爆了...系統負載節節攀升(下圖是解決之後的截圖了)

 

嘗試解決一

  • 重啓機器,嘗試本地重新 ssh 連接:超時失敗
  • 通過阿里雲 workbench 遠程連接:超時失敗

 

 

嘗試解決二

  • 通過阿里雲提供的發送遠程命令(雲助手)嘗試把 docker 關掉:仍然失敗
  • 即使將遠程命令設置爲啓動執行,重啓機器:仍然失敗
  • 從下圖二可以看出,仍然是連接機器超時導致的

嘗試解決三

  • 無法解決之後,只能連接人工客服,告知我可以通過連接 VNC 來嘗試解決,因爲 VNC 的方式是不受遠程連接的影響的
  • 我自己連接 VNC 仍然沒連上,最後是通過客服小哥哥/小姐姐幫我搞定了

 

罪魁禍首

  • 機器本身配置最低,然後還起了 5 個數據庫集羣節點,直接把機器打掛了
  • 根因一:docker 服務使用了開機自啓動 sudo systemctl enable docker ,導致每次重啓機器的時候,docker 服務仍然啓動
  • 根因二:起的 5 個數據庫容器都添加了隨 docker 服務啓動而自啓動... --restart=always ,所以 docker 起來後,五個容器也自動起來了,仍然打掛了機器....

 

最後的解決方法

客服小哥哥/小姐姐幫我殺掉了 docker 服務,然後禁止了開機自啓動

 

仍然有個問題

如果此時我直接 start docker 仍然沒有解決根因二帶來的問題

 

最終解決方案

需要手動到每個容器配置文件中去掉 restart 參數值

具體操作可參考:https://www.cnblogs.com/poloyy/p/13985567.html

 

忠實建議

低配機器就不要將服務和容器設置爲自啓動了

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章