如何查看Linux中 GPU 的佔用情況

鑑於自己經常不知道一些基本的硬件信息,所以今天下午決定好好學習一下如何查看GPU信息的命令:

  1. Linux查看顯卡信息:
    問題1,什麼是顯卡?
    顯卡(Video card,Graphics card)全稱顯示接口卡,又稱顯示適配器,是計算機最基本配置、最重要的配件之一。顯卡作爲電腦主機裏的一個重要組成部分,是電腦進行數模信號轉換的設備,承擔輸出顯示圖形的任務。顯卡接在電腦主板上,它將電腦的數字信號轉換成模擬信號讓顯示器顯示出來。
    lspci | grep -i vga
    前面的序號(03:00.0)是顯卡的代號在秦阿敏
    所以一共是有 5 個顯卡?
    查看指定顯卡的詳細信息命令:
    lspci -v -s 03:00.0
    問題2:什麼是 VGA
    VGA(Video Graphics Array)是IBM在1987年隨PS/2機一起推出的一種視頻傳輸標準,具有分辨率高、顯示速率快、顏色豐富等優點,在彩色顯示器領域得到了廣泛的應用。不支持熱插拔,不支持音頻傳輸。
    compatible:兼容的
    Linux查看Nvidia顯卡信息及使用情況:
    nvidia-smi
    ![Fan:顯示風扇轉速,數值在0到100%之間,是計算機的期望轉速,如果計算機不是通過風扇冷卻或者風扇壞了,顯示出來就是N/A
    Temp:顯卡內部的溫度,單位是攝氏度
    Perf:表徵性能狀態,從P0到P12,P0表示最大性能,P12表示狀態最小性能
    Pwr:能耗表示
    Bus-Id:涉及GPU總線的相關信息
    Disp.A:是Display Active的意思,表示GPU的顯示是否初始化
    Memory Usage:顯存的使用率
    Volatile GPU-Util:浮動的GPU利用率
    Compute M:計算模式
    下邊的Processes顯示每塊GPU上每個進程所使用的顯存情況
    (問題 3:什麼是顯存?
    顯存也叫做顯卡內存,顯存,也被叫做幀緩存,它的作用是用來存儲顯卡芯片處理過或者即將提取的渲染數據。如同計算機的內存一樣,顯存是用來存儲要處理的圖形信息的部件。)
    在這裏插入圖片描述
    Linux查看Nvidia顯卡信息及使用情況:
    nvidia-smi
    Fan:顯示風扇轉速,數值在0到100%之間,是計算機的期望轉速,如果計算機不是通過風扇冷卻或者風扇壞了,顯示出來就是N/ATemp:顯卡內部的溫度,單位是攝氏度Perf:表徵性能狀態,從P0到P12,P0表示最大性能,P12表示狀態最小性能Pwr:能耗表示Bus-Id:涉及GPU總線的相關信息Disp.A:是Display Active的意思,表示GPU的顯示是否初始化Memory Usage:顯存的使用率Volatile GPU-Util:浮動的GPU利用率Compute M:計算模式下邊的Processes顯示每塊GPU上每個進程所使用的顯存情況(問題 3:什麼是顯存?顯存也叫做顯卡內存,顯存,也被叫做幀緩存,它的作用是用來存儲顯卡芯片處理過或者即將提取的渲染數據。如同計算機的內存一樣,顯存是用來存儲要處理的圖形信息的部件。)

從上面的圖中我們可以瞭解到 一共有4個 GPU ,正在使用的是 第1塊,而且佔用顯存的主要是 python

問題 4:
torch 中如何使用 GPU?
首先你要查看當前 GPU的使用情況,然後再在終端指定使用 哪個 Gpu
CUDA_VISIBLE_DEVICES=2 python xxx.py
或者你可以在代碼中指定
import os
os.environ[“CUDA_VISIBLE_DEVICES”] = “2”

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章