上線服務觀察

上線一個服務需要觀察的點有
1. 服務的內存使用情況是否正常
在做agent的時候,由於後期改了監控的邏輯,導致一部分內存泄漏,內存持續增長。
覺得觀察的步驟是在程序上線幾個週期,5分鐘持續關注,如果一直上漲得思考,一天後也要一直關注5分鐘,這時候如果不是很高一般問題不大,不過幾天後也要看內存的增長情況,同時看看是否有錯誤日誌。
2. 錯誤日誌是否持續打印。
3. 查看程序的建立連接,如果close_wait的連接很多,就要抓包去看看到底是哪邊在斷連接。
4. 觀察程序的CPU使用率,如果使用率居高不下,就得用pstrace去看一下,程序到底一直在調用哪些系統調用。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章