英偉達:比起股價,我們更關注計算的未來

機器之心報道

作者:李澤南

英偉達 GTC 中國大會這次搬到了蘇州。最近,人們關注的除了最新 GPU 產品之外,更多的是這家公司未來的發展方向。

今年的 GTC 系列大會已是第十屆,也是連續第三次進入國內,和每次一樣,英偉達首席執行官黃仁勳參加了本次大會,並在首日上午進行了主 Keynote 演講。

談到深度學習機器,我們首先想到的就是以 GPU 爲核心的計算機。不過,英偉達早已不滿足於芯片,近幾年開始了垂直方向的擴展,我們可以在很多地方看到英偉達的軟件、服務器,甚至自動駕駛汽車。但一直以來就像在遊戲和高性能計算中所做的那樣,這家公司一直致力於爲客戶提供更多選擇。

「如有需要,你可以自行採用英偉達產品的任何一部分。」

重新定義圖形計算

「我們今天首先要介紹的是,英偉達如何重新定義了圖形計算。」黃仁勳以最新的 RTX 技術開始了自己的演講。最近英偉達發佈了新一代消費級顯卡 RTX 20 系列。使用 Tensor Core、RT Core 和可編程着色器的架構,Turing 架構的 2080 Ti 峯值算力要比 Pascal 架構的最強芯片 Titan Xp 強 9 倍。

因爲擁有算力達到 104TFLOPS 的 Tensor Core,通過實時的計算,RTX2080 可以通過輸入低分辨率圖像,輸出高清圖像。黃仁勳在會上展示了國產遊戲《逆水寒》最新版本的圖像水平。其模型和光源在水面和光滑物體上的反射栩栩如生。「即使是雨點落在水面上產生了波紋,效果也是和真實情況下一樣」黃仁勳表示。「所有效果都是即時演算得出的,而對於開發者來說,需要額外做的工作也很少。」

在 Turing GPU 上,英偉達加入了全新的深度學習超級採樣(DLSS)技術。基於 Turing 架構的 DLSS 由兩個模型組成,其中一個模型經過訓練後可根據原始圖像生成超高畫質圖像,另一個經過訓練後可實現超分辨率並以此作爲輸出。經由 Tensor Core 的計算,RTX 系列顯卡可以同時實現高畫質和高分辨率。

當然,這些算法看起來只對擁有 Tensor Core 和 RTX Core 的新產品有優化,和上一代產品相比,RTX 顯卡在光線追蹤和 DLSS 上的性能達到了 3.5 倍的提升。

AI 自動化的世界

英偉達 12 年前推出編程計算平臺 CUDA 的時候,其應用範圍僅限於高性能計算。隨着 GPU 被廣泛用於深度學習,這家公司已在在 CUDA 上加入了很多新的功能,比如適用於 Tensor Core 的相關 API。

AI 改變了英偉達的芯片、軟件設計,也重塑了市場:2005 年的雲服務器的算力輸出基本全靠 CPU,而今天全球最強的兩臺超級計算機 Summit 和 Sierra 中,95% 的算力是由英偉達 GPU 提供的,其中在第一名 Summit 中有 27,648 塊 Tesla V100。而在全球能效最強的 25 臺超算中,有 22 臺包含英偉達的芯片和技術。

與生活密切相關的網上購物、醫療、交通等方面都離不開 AI 應用。今年的雙 11,阿里巴巴的銷售量達到了 310 億美元,其中基於大數據的智能推薦功不可沒。

黃仁勳認爲,AI 讓高性能計算領域產生了變革,今天人們有兩種擴大服務器算力的方式:第一種是傳統 HPC 模式,在單個服務器上增加算力;另一種是 Hyperscale,通過擴大小模組的數量增加算力,超大規模節點必須作爲一個計算集羣,訓練模型或分別爲運行 AI 模型的數百萬併發用戶提供服務。

英偉達 GPU 在兩種方向上都有自己的產品。HPC 模式對應的是「世界上最大的 AI 計算機」HGX-2 平臺,其中一個模組可以支持 8 個 V100 GPU,實現 1PFLOPS 的算力。

HGX-2 的板卡很沉,習慣手舉 GPU 擺造型的黃仁勳拿起來有點費勁,不禁自嘲:「I'm getting old.」

目前已經在製造 HGX-2 服務器的國內公司包括,華爲、浪潮、聯想、QCT、曙光和 Supermicro。很多公司爲了構建雲服務器購買了 HGX-2 平臺,而百度和騰訊還將要開放基於 HGX-2 的雲計算服務。

在 Hyperscale 的一邊,英偉達爲大規模計算集羣準備了「第一塊 Hyperscale GPU」Tesla T4 計算卡,以應對低延遲任務的需求。

30 天前,英偉達發佈了 Tesla T4 雲計算 GPU。這款計算卡包含 320 個 Turing 架構的 Tensor Core、2560 個 CUDA 核心,可輸出 64TFLOPS 的 fp16 算力,而功耗僅爲 70W。「它的功耗比 CPU 還要小,算力卻比 CPU 要高 400 倍,」黃仁勳表示。

英偉達稱,僅僅一個月的時間裏,各大服務商已經推出了 50 種該型號的計算卡。在國內,科大訊飛等公司已宣佈開始使用這種 GPU。

配合新一代的推理優化工具 TensorRT 5.0,T4 支持 Tesnor Core 和豐富的模型類型,CNN、RNN、MLP 和很多其他模型。

機器學習軟件

今天的深度學習軟件正變得原來越複雜,對於開發者來說最重要問題的是如何進行部署。

英偉達的新版 TensorRT 推理服務器現在是容器化的,可以在 Kubernetes 上運行。在大會上,英偉達宣佈 TensorRT Inference Server 已經開源,黃仁勳拿百度雲上的 Tesla T4 GPU 爲這一工具做了例子:在容器中,我們可以運行任何深度學習模型,並讓不同模型同時運行在同一個計算卡上以提高效率。

英偉達近日在 GTC 歐洲大會上發佈了 RAPID,可讓端到端工作負載加速 50 倍。「很多時候人們談到 GPU 時都在說深度學習,現在有了 RAPID 軟件,我們更可以加速機器學習。」黃仁勳表示。

RAPID 是一個開源機器學習庫,其中 CUDA 負責加速數據科學工作負載,另外幾個組件的功能則使用了很直白的形容方式:cuDF「類似於 Pandas」,而 cuML「類似於 ScikitLearn」。

機器學習意味着英偉達的產品正在進入更多行業,在國內,RAPID 已被一些傳統公司採用。華大基因、中國移動和平安科技已經在使用 RAPID 了。

「如果我們用常規架構的計算方式,可能要花 6 個月來預測流感,」黃仁勳說道,「等計算機『預測』出來,流感早就結束了。有了 RAPID,計算機處理速度提高了 50 倍,問題很快就解決了。」

2005 年,各家研究機構用在科學計算上的花費有 90 億美元,今天如果把百度、騰訊、阿里等公司的高性能計算花費加在一起,市場可以達到 370 億美元,這其中很大一部分是深度學習和機器學習的計算。英偉達的產品已經能夠覆蓋所有這些計算需求了。

開放系統

英偉達花費 20 億美元研發的 Xaiver 是一塊集中程度很高的芯片,它被黃仁勳稱爲目前全球效率最高、最複雜的處理器,其上集中了 90 億個晶體管,集成了英偉達自動駕駛汽車的所有最新技術。在 Xavier 中有 5 種不同的處理器:CPU、GPU、圖像處理器、深度學習加速器、信號處理器。在英偉達的眼裏,這款芯片被設計用於「自主機器」,包括自動駕駛、機器人和各種智能設備,它最多可以輸出 320TOPS TFLOPS FP32 算力。

英偉達將 Xavier 芯片和其他一些自動化相關業務歸類在新品牌 Nvidia AGX 中。

在芯片之上,AGX 平臺還包括 Clara 智能成像儀、Metropolis 視頻流分析應用程序、Isaac 機器人技術,以及 DRIVE 自動駕駛汽車平臺。在這些平臺中,每個加速堆棧都由三層組成:

  1. 內核操作系統和工程 API
  2. 算法和加速庫
  3. 特定領域算法或應用

英偉達稱,每個平臺都是開放的,開發者和客戶可以訪問任何層,並選擇使用每個層的所有部分。

平臺的構建速度如何?黃仁勳在大會上公佈了應用 Xavier 的首批國內廠商,京東、美團、菜鳥的無人遞送車已經選用了 Jetson AGX Xavier,它們中的一些正在展開測試:「在國內,每天都有百萬騎手負責遞送 3000 萬份外賣,想象一下如果他們都被無人車代替以後,效率會提高多少倍!」

英偉達同時宣佈面向自動駕駛的 NVIDIA DRIVE 開發系統已經上市,其中包括用於監控駕駛員的 DRIVE IX,以及 DRIVE AGX Xavier 開發套件。這一軟件堆棧支持完全自動駕駛所需的功能,從感知到定位,再到路徑規劃。

英偉達還在現場展示了在美國加州高速公路上 50 英里環線的 Level2 級自動駕駛。面對此前「Level 4 很難實現」的呼聲,這家公司的高官們有着特別的看法。「對於消費者來說,他們不需要了解什麼是 Level 幾,」英偉達副總裁 Rob Csongor 表示。「他們只會選擇當前最好的自動駕駛體驗。雖然在 Level 2 中人還需要隨時接管,Level 4 則意味着人可以在後座睡覺了。」

英偉達發現 level 2 和 level 4 的自動駕駛在功能上是完全一樣的,使用的軟件堆棧也是類似的。在美國目前賣得最好的車款 Tesla Model 3 上,我們可以找到自動駕駛功能,但我們仍然需要在駕駛時把手放在方向盤上。「這是一個有關認證的問題,英偉達在自動駕駛上的戰略,你現在可以把它視爲是面向 Level 2 的,但以後它可能會被認證爲 Level 4。」Csongor 稱。

英偉達在大會上宣佈了與沃爾沃的合作:幾個月後,擁有 Level2 自動駕駛的新款沃爾沃 XC60 就會上線。除此之外,已有超過 370 家公司在自動駕駛系統中使用了 DRIVE 平臺。

在 GTC 中國之前,英偉達最大的新聞就是 11 月 16 號剛剛公佈的今年第三季度財報了。報告顯示,英偉達第三季度營收爲 31.81 億美元,與上年同期 26.36 億美元的數字相比增長了 21%;公司淨利潤爲 12.30 億美元,與上年同期的 8.38 億美元相比增幅達到 47%。儘管如此,市場普遍認爲此數字低於預期,其股市也經歷了大幅震盪。

「股價的確很重要,(最近的下跌)一部分是由於加密貨幣的影響,一部分是因爲經濟大環境。但是這並不是我們所關注的全部。」英偉達全球副總裁 Jay Puri 在大會上表示。「英偉達的眼光放在未來的計算。我們關注遊戲、高性能計算、機器學習、自動駕駛等等。」

面對有關股價的擔憂,英偉達給出的迴應是:我們還有更重要的事去做。就像黃仁勳所說的,「如果大家都在做同一件事,英偉達就不會佔據優勢,我們會去挑戰最困難的問題。」這也是英偉達一直以來的生存之道。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章