高性能計算機的發展趨勢

     計算機模擬較物理實驗的優勢可概括爲“多快好省”,多-能夠在多種條件下、大範圍內進行模擬,突破現實條件的限制(如微重力實驗要用落塔以至航天器,而模擬只需設重力爲零) ;快-免去實驗裝置的建設和運行時間, 許多裝備的中試過程以年月計, 而模擬則以天和小時計;好-模擬的任何細節都可隨時獲得,沒有測量的困難(如對高溫高壓設備的內部狀態)、誤差以及對系統的干擾;省-沒有建造和運行裝置的成本,沒有環境影響和安全隱患,可無限複製和改造。 

  儘管有這些優勢,目前大量工程設計和科研開發中模擬還難以撼動實驗的主導地位,其根本原因無外乎模型的準確性和計算的高效性,而這兩者也是相輔相成的。現代科學對物質的結構和基本過程已有非常可信和精確的描述,如質量、能量和動量守恆定律,描述微觀世界的薛定鍔方程,描述低速宏觀世界的牛頓運動定律,以及由此獲得的多種速率方程 (如描述流動的納維-斯托克斯(N-S)方程, 描述導熱的傅里葉定律和描述傳質的菲克定律等) 。但直接根據這些基本原理模擬實際過程的計算量往往龐大到無法想像。簡化和粗化的模型能減少計算量但同時會損失精度,所以必須在兩者間取得平衡。隨着計算技術的發展,應用相對底層的模型不僅成爲可能,甚至成爲需求,爲說明這一點,需要分析目前高性能計算面臨的機遇和挑戰。

  即使普通的辦公室職員也能感受到近年來計算機領域的一些轉折性變化,臺式機和筆記本的CPU 主頻從本世紀初的數百兆赫不斷增長到了3.xGHz 後似乎停滯了,但出現了雙核、四核的CPU,有的臺式機還配了兩顆CPU。實際上,以半導體爲基礎的計算機元器件技術發展正逐步進入一個階段性的平臺期,電路線寬(已達 45~22nm)和工作頻率(已達 6GHz)的增長都因爲量子效應等原因而趨緩。主流CPU 廠商都開始以提高芯片內並行度的方式來維持和超越摩爾定律,高性能計算系統的峯值提升更是倚重CPU(核)數的增長。

  因此,如何讓大量的處理器或處理核心充分發揮其效能是當今高性能計算發展中的一個關鍵問題,這裏需要克服所謂存儲牆(內存訪問遠慢於處理器計算)、通信牆(結點間通信帶寬和延遲遠低於處理器的吞吐能力)和編程牆(如何開發能充分利用大量處理器的並行程序)等障礙,而這需要軟件與硬件相互配合來解決。

  如果對應用的軟件沒有任何限制,建立完全通用的硬件系統,就需要全局性的快速數據交換,包括處理器與存儲器之間以及處理器之間直接或間接的數據交換。這樣,當處理器數量增加時,通信方面的硬件開銷必然非線性地增加,而通信的效率也必然逐步降低,使系統的實際速度無法隨處理器數量線性增長,成爲提高機器性能的主要瓶頸。另一方面,開發針對特定算法和問題的專用計算機雖然可以獲得很高的效率,但其應用面狹窄,業務量小,無法成批生產和充分利用,也難以成爲高性能計算的主流。

  因此,有必要尋找介於通用和專用高性能計算之間的第三條道路。我們希望找到一種能夠涵蓋儘可能多的數學物理模型的算法框架,以儘量擴大其應用範圍,而同時又希望這種框架有很突出的專門性和簡單性,使針對它進行的硬件設計能極大地簡化。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章