如何查看服務器GPU狀態

nvidia-smi
在這裏插入圖片描述
GPU:GPU 編號;
Name:GPU 型號;
Persistence-M:持續模式的狀態。持續模式雖然耗能大,但是在新的GPU應用啓動時,花費的時間更少,這裏顯示的是off的狀態;
Fan:風扇轉速,從0到100%之間變動;
Temp:溫度,單位是攝氏度;
Perf:性能狀態,從P0到P12,P0表示最大性能,P12表示狀態最小性能(即 GPU 未工作時爲P0,達到最大工作限度時爲P12)。
Pwr:Usage/Cap:能耗;
Memory Usage:顯存使用率;
Bus-Id:涉及GPU總線的東西,domain🚌device.function;
Disp.A:Display Active,表示GPU的顯示是否初始化;
Volatile GPU-Util:浮動的GPU利用率;
Uncorr. ECC:Error Correcting Code,錯誤檢查與糾正;
Compute M:compute mode,計算模式。

下方的 Processes 表示每個進程對 GPU 的顯存使用率。

第二個命令:nvidia-smi -L
在這裏插入圖片描述
第三個命令:gpustat(最常用)
在這裏插入圖片描述
面的表格中的紅框中的信息與下面的四個框的信息是一一對應的:

原文鏈接:https://blog.csdn.net/huangfei711/article/details/79230446

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章