因爲最近要跑網絡,想盡量提高服務器利用率,因此這裏記錄下如何監控各硬件使用情況。
首先,CPU和內存可以直接執行
$ top
然後出來的界面就能看到CPU和顯存MEM的使用情況了。但是這個界面全是數值,不好用。這裏推薦使用htop。執行
$ sudo apt-get install htop
$ htop
然後就能看到界面了。可以清晰地看到你有幾個CPU核,以及你的內存大小,內存佔用情況等。
接着GPU部分。nvidia-smi可以直接顯示顯卡情況,可以通過添加watch指令實時監控。
watch -n 0.1 nvidia-smi
這樣就可以在跑程序的時候動態監控了。不過這個界面還是太冗餘,尤其對於有多塊顯卡的服務器而言。因此,這裏推薦使用gpustat:
pip install gpustat
watch -n 0.1 gpustat
這裏就可以直接直觀的看到各顯卡的參數了。