獨家解析英偉達最新GPU-A100對AI行業帶來的影響

最近英偉達發佈了最新GPU-A100,當我們先後經歷了K系列、M系列、P系列、V系列之後,這一次的A系列發佈又會帶來哪些影響,未來行業的走勢如何,新入行的同學究竟選擇哪個領域入門比較合適。今天我將從3個方向爲大家一一剖析,

  • 計算力變強了,會給行業帶來什麼影響

  • 計算力變便宜了,會給行業帶來什麼影響

  • 英偉達的野心在哪裏,對行業有什麼影響

1 計算力變強的影響

這次新的GPU在算力方面變強的幅度是比較誇張的,根據官方數據顯示,在Bert模型的場景下,訓練和預測都有大幅度的提升。

同時新的機器搭載了三星的40G的超大HBM2顯存。這些信號意味着什麼呢?意味着計算框架的算力層面價值在弱化。過去提到TensorFlow、PyTorch,大家比的是哪種框架在分佈式場景下更快,因爲當模型的訓練量大到單機很難在短時間內收斂,因爲當模型大小大到單機內存沒法承載之後,只能依賴分佈式的方案去解決問題。

今天,A100即使在單機情況下也提供了可能過去可能2到5臺機器的分佈式能力。也就是說,今天單機的能力變強了。在計算框架層面,未來更多地需要從計算力優化的角度轉向如何提升用戶體驗,提供更簡單的開發接口。

所以,未來深度學習的開發會變得更簡單,得益於框架的向用戶體驗轉型。另外,框架級別的優化工作以及各種模型量化工作,將只在部分超大規模的應用場景下有意義。

如果把AI拆分成三層,最下方是計算力爲代表的芯片GPU,中層是計算框架,最上層的是CV、ASR、推薦、NLP等業務算法。對於新入行的同學,更多地關注最上層的業務會比較保險,因爲框架層的價值會隨着計算力的增強而弱化(在巨頭公司不會有這樣的情況,這裏泛指整個行業)。

2 計算力變便宜的影響

GPU發佈會提到了一個觀點,就是計算力的發展跟不上目前計算量的發展需求。這句話其實要延伸一下,並不是說之前V100卡不夠快,一定要更快的卡才能滿足用戶的業務,而是V100太貴了,很多客戶買不起。

英偉達應該也是意識到了這個問題,所以來了一個Slogan:“The more you buy, the more you save.”「現在,你只需要十分之一的硬件成本,二十分之一電力消耗就能做同樣的事。The more you buy, the more you save !」黃仁勳說道。

計算力變便宜了,後續會對行業有什麼影響呢?我們看到,雖然總體A100計算力增強了,但是單機8卡的GPU機器貌似比以前貴了,搭載8卡的DGX要賣到19.9萬美元,極高的價格。這個價格會讓很多腰部以下的互聯網廠商放棄自建IDC GPU集羣,從而選擇上雲,因爲買幾臺機器就要小1千萬。一家300人左右的互聯網公司每年的IT成本也就1千萬。所以對於雲廠商來講,關鍵是如何能讓昂貴的單點計算機器的資源更彈性。怎麼能滿足客戶彈性的需求,是雲廠商後續要重點關注的,基於K8S的實現如何做到資源的最大限度利用,是關鍵。

3 英偉達的野心對行業影響

雖然GPU已經在AI的計算力方面幾乎形成了壟斷,但是2020財年,英偉達的利潤總體出現下滑。這就意味着,單純最底層的芯片級別的技術演進,很難形成高增長,缺少軟件附加值。另外,新的A100技術架構,只有50倍左右的算力提升空間。當計算力的提升到了瓶頸,英偉達又將怎麼發展。

英偉達最新的舉措可以看一些端倪,在框架層面開始做很多文章,比如推出了語音交互框架Jarvis。後續英偉達一定會向上層的應用拓展業務,這樣就觸碰到了PyTorch、TensorFlow的領地,跟FaceBook和Google展開直接競爭。Google現在也在自己研製TPU芯片用來制衡GPU。後續的競爭可能不再是框架或者計算力的單點競爭,而是生態的競爭。

所以,今天只會TensorFlow或PyTorch都是不保險的,未來可能有新的框架進來。亙古不變的是上層的業務實現方式,瞭解CV的流程、ASR的流程、推薦的業務流程,這些業務的流程短時間內不會有大的變化,而且會兼容各種引擎和框架的發展,學好這些是安身立命的根本。

PS:本文只是作者自己YY,週末閱讀新聞的感想,權當消遣。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章