【深度學習】nvidia-smi 命令解讀

本文轉自:http://www.cnblogs.com/nowornever-L/p/6934605.html

nvidia-smi是用來查看GPU使用情況的。我常用這個命令判斷哪幾塊GPU空閒,但是最近的GPU使用狀態讓我很困惑,於是把nvidia-smi命令顯示的GPU使用表中各個內容的具體含義解釋一下。

這裏寫圖片描述

這是服務器上特斯拉K80的信息。 
上面的表格中: 
第一欄的Fan:N/A是風扇轉速,從0到100%之間變動,這個速度是計算機期望的風扇轉速,實際情況下如果風扇堵轉,可能打不到顯示的轉速。有的設備不會返回轉速,因爲它不依賴風扇冷卻而是通過其他外設保持低溫(比如我們實驗室的服務器是常年放在空調房間裏的)。 
第二欄的Temp:是溫度,單位攝氏度。 
第三欄的Perf:是性能狀態,從P0到P12,P0表示最大性能,P12表示狀態最小性能。 
第四欄下方的Pwr:是能耗,上方的Persistence-M:是持續模式的狀態,持續模式雖然耗能大,但是在新的GPU應用啓動時,花費的時間更少,這裏顯示的是off的狀態。 
第五欄的Bus-Id是涉及GPU總線的東西,domain:bus:device.function 
第六欄的Disp.A是Display Active,表示GPU的顯示是否初始化。 
第五第六欄下方的Memory Usage是顯存使用率。 
第七欄是浮動的GPU利用率。 
第八欄上方是關於ECC的東西。 
第八欄下方Compute M是計算模式。 
下面一張表示每個進程佔用的顯存使用率。

顯存佔用和GPU佔用是兩個不一樣的東西,顯卡是由GPU和顯存等組成的,顯存和GPU的關係有點類似於內存和CPU的關係。我跑caffe代碼的時候顯存佔得少,GPU佔得多,師弟跑TensorFlow代碼的時候,顯存佔得多,GPU佔得少。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章