Arch2030 A Vision of Computer Architecture Research over the Next 15 Years

Arch2030: A Vision of Computer Architecture Research over the Next 15 Years (2016, Mark D. Hill report)

1. 新的挑戰:如何爲信息技術的持續發展奠定基礎性的未來(how to secure a foundational future for information technology’s continued progress)
2. 目標:找出體系結構研究可以彌合應用程序和設備領域(device domain)之間差距的機會。
3. 2011-2016年之間發生的變化
  • 明顯的專有化(specialization)方面的差距,即現有的硬件趨勢與應用程序需求之間存在差距。如果沒有專用的硬件,則無法實現某些應用,例如VR和自治(autonomous)系統,並且硬件設計仍舊是昂貴困難的

  • 雲計算,真正的無處不在,提供了一個清晰的"innovation abstraction"。雲計算創造了可擴展經濟,使得巧妙的跨層優化具有成本效益,同時甚至透明地向最小的新企業和初創企業提供了這些創新

  • 通過裸片堆疊和單片製造的3D集成實現垂直髮展,使得硅基板嫩鞏固垂直生長,顯著的減少了延遲,提高了帶寬和能效

  • 接近物理學:創新的材料,例如碳納米管,生物聚合物,量子計算等,以提供那個能有效的開關,更緊密的原件排列或者新的計算模型

  • 機器學習已經成爲主要工作負載。(各種應用的促進)
    在這裏插入圖片描述

4. 專有化的鴻溝:促使硬件設計大衆化/民主化
  • 目標:硬件開發必須變成向軟件開發一樣容易,廉價和敏捷,以保持計算機行業的創新
  • 隨着摩爾定律的放緩和Dennard縮放技術的結束,處理器設計發生的變化:每次操作的能效已取代了面積效率或者峯值開關速度作爲限制峯值性能的最重要的設計約束
  • 能效很重要,但是不斷湧現的新應用需求的計算能力越來越多,尤其是大規模機器學習的應用,從圖像和語音識別到自動駕駛,再到人類專家。
  • 專用硬件設計:部分計算密集應用中的新策略
    • 與通用芯片相比,專用硬件可以將每次操作的能效提高多達10000倍
    • 專用化帶來的能效提升對物聯網十分重要,同時在圖形渲染和視頻播放中也取得了巨大成功
  • 專有化硬件的問題:設計和製造專用硬件的成本對所有企業來說都是高得無法承受的,只有極少數的設計可以在廣闊的市場上攤銷它
  • 解決:大衆化硬件設計,使硬件設計變得像軟件設計一樣敏捷,便宜和開放
    • 軟件開發團隊可以利用現有的可重用組件(通常是免費和開放源代碼)的豐富生態系統
    • 可以使用高級語言來提高單個開發人員的能力
    • 可以依靠有能力且自動化的程序分析,綜合,測試和調試輔助工具確保高質量的硬件設計
5. 雲 是體系結構創新的抽象(the cloud as an abstraction for architecture innovation)
  • 通過利用可擴展性和虛擬化,雲計算提供商可以透明、低成本地爲最小的客戶提供硬件創新
  • 雲計算對正常業務的破壞性已被廣泛認可。雲可以讓新企業的擴張速度遠超過傳統的基礎設施投資(infrastructure investment)。(雲資源租賃中的成本效益)
  • 雲計算模型的兩個關鍵優勢:可擴展性和虛擬化,爲跨層體系結構創新提供了強大的抽象能力。
  • 通過虛擬化(一類技術),可以將新的硬件和軟件創新透明地引入到現有的軟件系統中。另一方面,雲供應商可以將處理,存儲和網絡組件更換爲更快、更便宜的技術,而無需和客戶進行協調
  • 虛擬化技術還可以實現資源的超額訂購(oversubscription),在對特定資源具有時變(time-vary)和零碎特點的資源需求的客戶之間透明的共享資源,從而允許雲提供商以遠低於那些購買專用資源的個人客戶的價格提供資源
  • 架構研究需要縮小虛擬化和裸機型性能之間的差距,並且開發新的虛擬化抽線,以實現對TPU,AISC雲等專用硬件單元的透明使用和超額訂購
6. 走向垂直:3D集成,可擴展性的新維度
  • 在最近的硅世代中,驅動芯片全局的佈線相對於計算而言變得越發昂貴,互連在總芯片的功耗預算中的佔比也越來越大
  • 3D集成爲芯片設計中的可擴展性提供了新的維度,儘管摩爾定律已經結束,但是仍舊可以繼續在單個系統中集成更多的晶體管,並通過在三個維度上的佈線來縮短互連,促進異構製造技術的緊密集成
  • 3D集成可以實現更高的能效,更高的帶寬和更低的2D結構內部系統組件之間的延遲
  • 在結構上,3D集成意味着對於平衡的系統,計算必須接近數據。3D-stacking已經促使了近數據計算(near-data computing)和內存中處理(processing-in-memory)的重新興起
  • 3D集成帶來新的挑戰:
    • 提供高可靠性和良率(利用體系結構支持解決)
    • 電源和散熱管理的新挑戰
7. Architectures “Closer to Physics”
  • 歷史上,新設備技術和電路設計技術推動了新架構的發展
  • 未來可能的第一類技術:通過更有效的信息編碼,更好地利用當前的材料和設備,使其更接近於模擬電路。(模擬計算和適合精度折衷的應用程序非常匹配,並且模擬信號處理相對於數字信號處理功耗更低,效率更高,但是容易受噪聲影響)
  • 第二類技術:使用新材料,包括提供更高效的開關,更密集的排布和獨特的計算模型
    • 新的存儲設備
    • 碳納米管代替硅,密度更高,功耗更低
    • 量子計算,允許同時表示0和1狀態。另一個方面是超導邏輯(superconducting logic)提供”自由“的通信,減少能耗。
    • 利用生物學中的知識。DNA計算,存儲等
8. 機器學習將是關鍵的工作負載
  • 大量的數據與豐富的計算能力共同推動了機器學習在一些應用領域的重大進展,包括圖像語音識別,自動駕駛等
  • 大型機器學習應用驅動着從存儲系統到專有硬件的設計
  • 雖然目前的重點在於如何在雲中支持機器學習,但是在未來很有可能在智能手機或者其他低功耗設備中使用ML應用
  • 機器學習內核具有相對規則的結構,可以在精度-資源之間進行權衡,因此很適合硬件專有化,重構(reconfiguration)和近似技術。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章