瞭解顯卡

  1. 從零開始認識顯卡

硬件

  ROG Strix RTX 4080爲例:

  • 供電接口:8pin接口,單個提供225w供電,高功耗可使用多個

image

  該4080提供6個供電接口:

image

  還有背插顯卡,無需外接供電,需搭載特定主板和轉接頭使用:

image

  • 散熱模組由:風扇、鰭片、熱管、均熱板組成

image

  熱管利用汽熱轉換傳遞熱量

image

  • 電路板結構,其中gpu芯片由nvdia、amd、intel三家供應

image

  AIC廠商(如華碩)完成電路板與散熱的設計和生產

image

  • 視頻接口,對外傳輸圖像

image

  • PCIe接口,與主板、cpu、內存等元器件交互,如PCIe4.0單通道傳輸速率爲2GB

image

  • 供電模塊:核心PWM、電容、MOS管、現存PWM、電感組成

image

image

  • 顯存的總帶寬(每秒傳輸的數據量)由頻率、位寬、倍增係數決定的

    • 頻率:每秒傳輸多少個週期
    • 位寬:一次(週期)可以傳輸的數據量
    • 倍增係數:發揮多少倍性能

image

image

  • 顯卡的gpu核心

  • SM流式多處理器,負責幾乎所有的圖形運算,例如由76顆SM計算單元,每組SM單元中由128個流處理器,共9728個流處理器(也叫做CUDA核心),【處理器個數越多、頻率越高,性能越強】,若每組看成一個核心,就相當於76個核心,9728個線程的處理器,顯卡核心數量決定算力。

    image

    • nvidia ada-lovelace架構,459億顆晶體管

    image

image

image

image

image

image

  • 顯卡更適合做簡單的四則運算

  三角面的頂點座標(x,y,z),用32位的二進制表示,也叫做單精度浮點數(FP32)

image

  每秒能計算的次數就是單精度浮點算力,用於衡量圖形渲染的性能。

  GPU對比CPU更加適合圖形渲染

image

  一個CUDA核心能支持FP32計算,也能向下兼容半精度FP16計算。

image

  gpu的效率也和設計架構有關。

image

image

image

image

image

  架構不同,性能也不同。

image

  • 單精度浮點算力和架構決定了gpu的遊戲性能。

image

用於AI

  CUDA核心的旁邊是第4代Tensor Core張量核心,適合做AI相關的深度學習計算,如AI繪圖軟件可以調用Tensor Core,生成圖片的速度比純CUDA快。

image

image

  • 主流顯卡TimeSpy跑分天梯圖
  • 主流AIC廠商

image

  • 顯卡子型號

image

  ‍

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章