2019.3.11 全天服務器一切正常
2019.3.12 10:08 收到反饋服務崩潰
1.連接服務器發現Xshell-SSH無法連通
2.查看服務器狀態CPU 0%,內存16%(平時穩定50%+)
3.工具連數據庫無法打開具體庫,mysql報錯error 5
4.立即停止對服務器的一切操作,給供應商提交工單(意識到很大概率是供應商那邊出的問題)
5.工單回饋是否可以重啓,回覆:服務器隨意操作,等待問題反饋
6.看到對方重啓了我的服務器2次 未恢復,然後停止了服務器後再次啓動,發現cpu 0% 內存6%
7.意識到服務器正常啓動開始連接,Xshell正常、數據庫正常(數據未丟失)、服務器自啓動(mysql/nginx/git倉庫等等)正常
8.工單反饋正常,並保證在反饋問題前不會對服務器有任何操作(得給老子一個說法~)
9.對方反饋:您好,目前已經可以了,3月12日凌晨,華北資源池部分雲主機實例出現IO HANG,導致雲主機異常,目前已經都修復正常了,您觀察使用下,如果有異常您及時反饋下,謝謝!
10.啓動tomcat,服務恢復正常
11.聯繫供應商協商賠償
文章最後提醒各位手上有服務器且出現相同問題的兄弟們出現問題不要急着重啓解決,要找到供應商提交工單,讓對方說出具體錯誤原因(甩鍋甩的有理有據,還有賠償),如果盲目重啓後恢復正常有兩個弊端 1.留下隱患,可能以後出現相同錯誤,供應商收不到相關錯誤反饋不利於日後服務器的維護 2.沒有賠償,沒法甩鍋