上线服务观察

上线一个服务需要观察的点有
1. 服务的内存使用情况是否正常
在做agent的时候,由于后期改了监控的逻辑,导致一部分内存泄漏,内存持续增长。
觉得观察的步骤是在程序上线几个周期,5分钟持续关注,如果一直上涨得思考,一天后也要一直关注5分钟,这时候如果不是很高一般问题不大,不过几天后也要看内存的增长情况,同时看看是否有错误日志。
2. 错误日志是否持续打印。
3. 查看程序的建立连接,如果close_wait的连接很多,就要抓包去看看到底是哪边在断连接。
4. 观察程序的CPU使用率,如果使用率居高不下,就得用pstrace去看一下,程序到底一直在调用哪些系统调用。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章