AI芯片從未成功過?

AI 芯片進入了市場檢驗期。

技術研發關卡

“無芯片不AI”。最近幾年,業界縈繞着對摩爾定律失效的擔憂。後摩爾定律時代,AI芯片的崛起被寄予厚望。

AI芯片一度站上了風口,熱度空前,與此同時,挑戰尤存。現階段的AI芯片處在發展早期,尚有諸多技術痛點待攻克。

在設計、研發上,一個最大的技術挑戰在於如何跟得上AI算法的演進。芯片研發速度往往落後於AI語言的迭代速度,很多芯片做出來時,AI 算法已發生了較大的改變,甚至已過時了。因此在芯片設計時,預測未來的前沿算法趨勢十分重要。

架構創新能力也是核心競爭力之一。擺在設計和研發前的第一個大難題就是解決架構問題,要具備適應所有應用的架構。正確的架構取決於對AI的理解,一些專家芯片設計能力很強,但對AI的計算或應用特點理解不深入,一些AI算法科學家在底層知識上有所欠缺。AI芯片的核心要點在於對整個AI算法、硬件能力有宏觀認知,及對未來發展趨勢有精準預判,具備這一綜合能力難度不小。去年初,圖靈獎得主John L .Hennessy 和DavidA. Patterson 曾在二人的合著論文中預判,未來十年,計算機架構將迎來新的黃金時代。

投入成本高企、進入門檻高、週期長、回報率低是整個AI芯片產業“頭頂”的幾座大山,也是目前行業發展的現實情況。一款AI芯片的研發週期一般在18個月左右,一款AI芯片產品問世後,可能要歷經N次迭代後才能獲得較大市場份額,這是一個更考驗耐心和韌性的行業。目前國內約有十幾家公司實現了實現AI芯片量產,包括華爲、寒武紀、依圖、鯤雲等公司。

億歐智庫調研數據顯示,以終端常用的28nm製程的芯片爲例,國內AI系統芯片的開發費用約爲2500萬美元。新鼎資本創始人張馳曾在接受InfoQ採訪時表示,寒武紀等AI芯片公司的研發支出主要花在流片上,高精尖工藝造成了流片成本高。一般一款芯片流片費用在千萬起步,如果要做到 7 納米,至少要花費五千萬,這還不包括流片失敗的費用。像寒武紀這種體量的公司,一般一款芯片流片的體量可能在三千萬 - 五千萬左右,甚至有可能單次上億。

英國AI芯片創企Graphcore高級副總裁兼中國區總經理盧濤對InfoQ表示,一款AI芯片的研發成本主要包括5個方面:

  • 開發工具的成本
  • IP購買成本。如果內部IP積累較少,需要購買IP,成本約在千萬美金級別。
  • 後端設計成本。如果沒有後端設計工藝,就需要依靠 Broadcom、IBM、TI 這樣的公司提供幫助。一些較新的工藝或涉及更高昂的成本。
  • 人力成本。一般做一個AI處理器的團隊要在 100 人左右,且只能做一款產品。如果要保持像目前頭部廠商這樣的迭代速度,可能要並行做好幾個產品,這是一塊很大的成本投入。
  • 失敗成本。經驗比較豐富的團隊可能一版能成功,如果不成功,又需要做好幾版,這都意味着高成本投入。

“更高性能,更低功耗,更小面積,更低成本”是芯片設計永恆的追求目標。這些指標除與設計相關外,更關鍵的影響因素是芯片採用的工藝,在同等芯片面積下,更先進的工藝明顯有助於提升峯值性能和能效比,但這也會讓芯片成本顯著提升。

鯤雲科技COO王少軍認爲,架構創新不僅考驗的是芯片公司的硬件設計能力,作爲專用芯片來說,還考驗對專用領域的應用理解和轉化能力,在AI領域,這主要體現在對算法的深入理解和準確的發展趨勢判斷。而摩爾定律終結的質疑聲在一定程度上說明了業界對芯片工藝水平持續提升的能力、速度和成本的擔憂。他認爲,單純依靠工藝提升來解決性能問題的技術路線在不久的將來將面臨巨大挑戰。

基於這個判斷,鯤雲科技更重視芯片利用率和實測性能,希望通過架構創新爲客戶提供更高的算力性價比。一週前,鯤雲科技發佈了全球首款數據流架構的AI芯片CAISA,據悉,搭載CAISA芯片的加速卡僅擁有英偉達同類產品 1/3的峯值算力,但其通過95.4%的芯片利用率可實現最高3.91倍的實測性能提升。數據流架構或是未來提升AI芯片性價比的一條可行性技術路線。

落地下半場

AI芯片實現極致性價比也與應用強相關。盧濤覺得,如果在一些應用中,能夠做到 5 倍、10 倍、20 倍的性能時,性價比的問題也就變得簡單了。

找到合適的場景,實現利潤率合理的、規模化的出貨量,並逐步搭建起自己的生態圈,是衡量一家AI芯片公司商業化路徑成功的關鍵標準。

智慧安防、智能終端、自動駕駛、雲計算等場景是目前AI芯片主要的應用場景,尤其在安防領域,幾乎所有的AI芯片公司都在該領域有所佈局,安防硬件巨頭們也都在緊鑼密鼓進行AI 芯片研發。

自動駕駛是其中落地較快,能夠相對獨立地爲用戶提供價值,頗具應用潛力的場景。現在自動駕駛技術在實際落地上還不成熟,有些“雷聲大、雨點小”,這也在很大程度上限制了AI芯片的落地。

長期關注AI芯片行業的媒體人劉宇(化名)對自動駕駛的未來持懷疑態度。他認爲,自動駕駛本身就不靠譜。在他看來,“靠譜”的AI芯片應該具備類似指紋識別這種應用特徵 — 計算量不大、有效性好、成本足夠低。另外,不要與深度學習過度“綁定”,因爲深度學習的紅利基本上已經被“吃盡”了

劉宇對一些AI芯片公司的商業模式感到有些失望。“它們基本上都是 TO VC 路線,爲了更好地投資人講好故事,它們存在的前提就是不斷有人來融資。有些公司真正的商業模式是‘以芯片爲名’拿地,營收主要來自房地產、政府補助等”。

今年4月,寒武紀披露的IPO文件顯示,其AI芯片研發投入巨大,但盈利和落地狀況堪憂。在與前第一大客戶華爲“分手”之後,寒武紀的前五大客戶中,第一大、第二大客戶均爲政府,存在客戶集中度過高且高度 TO G 的問題。寒武紀是國內AI芯片的第一梯隊,其財務表現也是整個行業盈利能力的縮影,現階段,能夠實現盈利的AI芯片公司還寥寥無幾。

也是在這個月,有外媒消息稱,美國AI芯片公司 Wave Computing 接近倒閉,已申請破產保護。今年年初,比特大陸的AI芯片業務被曝大幅裁員。上述現象不禁令人對國內外AI芯片公司的生存狀況感到擔憂。

AI芯片是資金投入最大的AI垂直領域之一。當資本市場有較大波動時,影響必然會傳導到AI芯片創業公司。受自2018年下半年開始的資本寒冬,以及外部不確定性的大環境等因素影響,有些投資人也從“不能不看AI芯片項目了”變成了“不再看AI芯片項目了”。資本市場逐漸趨於理性爲AI芯片創業公司的落地帶來了很大壓力,在還沒賺到錢之前,它們不得不開始“勒緊”自己的錢袋子了。

王少軍認爲“錢荒”問題並沒有那麼嚴重。他所認識的大部分AI芯片企業都發展不錯,有一些存在問題的多是經營與戰略問題。他認爲,市場上優質的AI芯片公司在商業化落地上逐步找到了定位,有了持續造血的能力。“大多數AI芯片公司還是認真做產品、認真推落地的,在目前行業逐步重視落地、迴歸商業本質的趨勢下,AI行業的發展會逐步進入良性增長的趨勢”。

AI芯片從產品到實現商業化落地,這中間存在着巨大的鴻溝。首先是技術層面上的,當一款AI芯片出來後,是否有良好的工具鏈、支持大規模商用部署的豐富軟件庫,能否與主流機器學習框架實現無縫銜接。對於用戶來說,是否具備良好的可移植性、可開發性及可部署性能。

更爲重要的,是怎樣在行業紮下根去。

聲智科技合夥人&CSO 李智勇認爲,AI芯片實現落地的核心點不是技術問題,而是如何實現市場化並完成商業閉環(從技術-產品-用戶反饋)的問題。芯片週期長、投入大,形成商業閉環的挑戰更大。消化技術紅利的過程滿足產品化和用戶正向反饋兩個條件時,落地規模才能持續放大,進而出現並擴寬盈利空間。

而且,就AI落地而言,目前主要有兩種思路,其一是採用含算法的ASIC芯片,其二是採用通用芯片+算法在雲端的通用系統。在不同場景中兩種途徑各有優勢,在語音交互場景下聲智科技選擇了第二種,推出多模態人工智能交互系統SoundAI Azero,可屏蔽不同底層操作系統的差異,提供簡單易用的技能開發工具和 Turnkey 軟硬件解決方案,滿足萬物互聯時代不同行業應用的需求。

“深”探行業還需要拿捏一定的度。很多現實場景中的需求是無邊界的,AI的能力有限,必須清楚地界定問題的邊界,並且用經濟的技術手段解決這些問題後才能實現落地。例如,人臉識別必須加上具體的應用場景限定(包括成像角度、人臉數量等技術約束),纔是一個可落地的問題。這個邊界如何界定清楚是落地進程中的一道難關。

“AI公司實際上不應該存在,因爲AI技術是一套基礎性支撐技術,是軟件方法,而軟件方法本身不能夠成爲商業模式,它必須跟某一個特定的問題相結合才能夠成爲商業公司,換句話說,未來所有的公司都是AI公司”,AI行業資深從業者周凌然(化名)的觀點有些非主流,“一家公司如果僅擁有算法,是無法站住腳的,本質上在於如何與領域深度結合,如何真正爲用戶帶來終極價值”。

從這個角度來考量AI芯片未來的發展。一家AI芯片公司未來不能僅僅只有AI芯片,而與行業深入結合,變成一家領域解決方案公司或許纔是成功之道。AI芯片應用於各個場景之中爲用戶所帶來的實際效果應當是商業化成果的最終檢驗標準。

兩大應用趨勢:雲端向邊緣端擴展,追求軟硬件協同

按照部署位置,AI 芯片可以分爲雲端部署和終端部署兩種。經過幾年發展,AI芯片已不僅僅限於雲端,邊緣AI芯片成爲各個廠商競相佈局的垂直賽道,越來越多的AI應用部署到了端設備上。

目前雲端市場發展已漸趨向成熟,巨頭盤踞,格局難撼。對於創業公司來說,應用場景更廣闊的終端設備市場還蘊含着不少機會。例如智能手機是目前應用最廣泛的邊緣計算設備,自動駕駛也是邊緣AI計算的重要應用場景。邊緣計算被視爲下一個AI戰場。

而另一方面,邊緣側市場空間更大,更容易給投資人“講故事”,吸引資本的關注。據中金公司研究數據,2017年,邊緣計算AI芯片市場規模爲39.1億美元,到2022年,這一數字將增長至352.2億美元,5年或增長10倍。

近幾年,邊緣計算呈現出了巨大的增長需求,尤其在有大量數據並要求低延時響應的應用場景中。在邊緣上做計算,具有數據處理更快速、實時業務處理、成本更低、網絡帶寬成本低、保護數據隱私安全等優勢。

做邊緣芯片,最難在於應用場景。除自動駕駛場景較集中外,其他很多場景十分“碎片化”。AI邊緣芯片現階段的主要挑戰來源於邊緣端算力需求的不一致,以及邊緣算力平臺的差異,導致邊緣AI芯片的性能和功能需求難以統一界定。

王少軍觀察到,目前市場上出現了很多場景定義的專用芯片,“市場正朝着專業化、細分化方向發展,也說明,各領域出現了普遍性的行業落地需求,足以支撐專用AI芯片的發展,這對掌握了核心技術,能禁得住市場考驗的AI芯片企業來說是一個好現象”。

另一趨勢是,不少AI芯片公司越來越追求打造軟硬件協同能力。不少原來做芯片的公司開始由硬件切入軟件,有些算法公司開始深入硬件做佈局。軟硬件協同意味着更高的有效算力。

明確重要的落地場景是軟硬件協同的前提;此外,一體化過程涉及軟件和硬件兩種不同技術團隊間的協同,在磨合期團隊要充分磨合,相關工具支持也得跟上。

軟硬協同理念是從軟件(算法)和硬件兩個角度同時優化,從而實現性能的全局最優。在設計過程中,面臨約束條件多且存在不確定性,設計空間大等挑戰,導致最終結果很難得到最優解。要實現所有網絡的最優,在技術上實現難度較大,爲此,芯片設計應以有效加速大多數的算法爲目標。

AI芯片從未成功過?

回溯AI芯片在國內的發展歷程,2015-2016年是業內公認的小高潮。卷積神經網絡、深度學習的突破掀起了AI芯片的研究與創投熱潮,深度學習方法在很大程度上約減了算法計算需求的多樣性,爲AI芯片提供了明確的技術可行性;算法精度的有效提升爲AI行業落地提供了可能。

一時間,大批創業公司爭相湧入,巨頭公司加大投入力度,資本亦瘋狂助推 ,尤其在2018年,AI芯片大熱,多家創企相繼宣佈獲得融資。

2017-2019年,在王少軍看來是AI芯片技術和產品研發“百花齊放”的三年 — 市場端還是英偉達一家獨大,湧現出了很多的新技術、新架構和新模式,AI場景需求的定義更加清晰,雲邊端基本成爲共識,但不同技術路線對不同場景的適應程度還沒有被充分驗證。

2019年是芯片行業的轉折點。資本寒冬、華爲遭斷供、多家科技企業被列入實體清單等事件凸顯“卡脖子”危機,在國際形勢不明朗的環境下,AI芯片產業鏈添了不可測的發展變數,對於有技術實力、能完成替代的國內芯片公司來說,未嘗不是一個發展的契機。

相較幾年前,AI芯片行業的熱度已經下降了不少。當熱度漸漸冷卻下來,業界也開始反思AI芯片行業是否存在一些“概念炒作”、搞噱頭、泡沫化的問題。艾瑞諮詢在《2019年AI芯片行業研究報告》中分析指出,當前AI芯片行業接近Gartner 技術曲線泡沫頂端。

“最近這三四年AI芯片的發展狀況,我覺得是‘泡沫’,站不住腳。泡沫主要體現在,AI芯片是個僞命題,不是真實的需求。過去20多年來,有關人工智能硬件化的嘗試,絕大多數都失敗了,這裏面可能存在一些共性的原因。到目前爲止,我還沒有感受到AI芯片在根本上的不一樣。因此,我懷疑,在這次以深度學習爲發端的AI浪潮背景下的AI芯片硬件化也會失敗”。一位AI技術專家馮輝(化名)向InfoQ表達了他的判斷,他認爲,AI芯片發展這麼多年,從未成功過。

如何來定義AI芯片的“成功”?InfoQ詢問了多位受訪專家的看法。多位專家對“從未成功”這一說法不甚認同。

在產品層面,歷史上湧現了很多成功的AI芯片產品,例如Google的TPU、HTPU,英偉達的P100 GPU、高通的驍龍AI芯片等產品。

“如果單按這個(產品)標準,歷史上那些AI芯片也算’成功’了”,馮輝補充道,“我認爲,AI芯片的成功與否,不在於是不是做出來,而在於是不是可用。這裏的“可用”是指,相對於通用芯片,是否具有明顯的成本優勢”。

值得注意的是,在技術層面,由於AI芯片是技術上的新生事物,如何定義一款AI芯片在技術上取得了成功,目前業界並未形成統一的技術共識。“成功的定義或有不同,任何一個按照自己的技術理念成功流片的AI芯片公司,都可以認爲在技術上是達到了一定程度的成功。除此之外,如何將自己產品的技術特性與市場需求場景充分適配,爲目標市場提供不可替代性和更高性價比,進而有效落地,這個是基於商用化上的考量。”王少軍說。

至於商業化上的成功,未來仍需要時間來驗證。這在一定程度上取決於AI芯片落地速度,目前的環境給了有產品優勢的芯片公司突破的機會。

經歷了過去5年的快速發展後,2020年,AI芯片進入了研究與大規模化落地的關鍵一年。盧濤認爲上半年的疫情對於AI芯片的落地利弊參半,利好是,疫情加速全球版數字化進程,加快數據中心等算力基礎設施建設進程;挑戰是,那些紛紛嚷嚷着自己要做AI處理器的公司能不能真的做出來,真的到場景中落下地去。如果沒有真東西 “亮出來” ,後期持續的投入可能將面臨巨大挑戰。

‘講故事’,拼技術理念、拼背景光環的時代已經過去了。

進入下半場的AI芯片到了市場驗證期,到了拼產品效果、拼用戶體驗的時候。這將伴隨着一場大的洗牌過程而展開,那些找不到落地場景,盈利能力不足,在技術和商業模式上不能提供核心價值的玩家可能最終將面臨被淘汰出局的命運。“市場將會按照不同的行業保留2-3家頭部公司,以及若干家有特色的中小公司”,王少軍向InfoQ預測這場淘汰賽可能的終局。

不能忽視地是,AI芯片尚處在稚嫩的“嬰兒期”,快速成長難免伴隨着“陣痛”,未來雖未知但可期。“我覺得現在應該是做芯片最好的時期,AI芯片需要走的路特別長”,李智勇覺得,握住當下的機遇是最重要的。

嘉賓介紹:

王少軍,鯤雲科技合夥人兼COO,2012年博士畢業於哈爾濱工業大學。發表學術論文40餘篇,擁有24項授權發明專利,參與人工智能相關項目超過20項,有着豐富的人工智能應用系統開發經驗。

盧濤, Graphcore高級副總裁兼中國區總經理,全面負責Graphcore在中國的業務。盧濤在芯片領域擁有近20年的經驗。在加入Graphcore之前,盧濤先生曾任Cavium總經理一職,作爲當時的零號員工領導Cavium在中國的業務,直至Cavium IPO,在被Marvell收購之後,盧濤加入Graphcore。盧濤畢業於華中科技大學人工智能與自動化學院。

李智勇,聲智科技合夥人兼CSO 。曾任聯想資深戰略專家,奇虎360高級投資經理&戰略分析師。著有《終極複製:人工智能將如何推動社會鉅變》等書。

另,應受訪者要求,文中劉宇、周凌然、馮輝爲化名。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章