HFSS作爲領導電磁場仿真行業二十餘年的產品,備受業內的尊敬和推崇,在技術發展上的高度、深度和前瞻性不僅爲工程領域做出了持續不斷的巨大貢獻,並且引領了計算電磁學的發展。 在並行技術的研發上,HFSS根據工程領域的需求及計算機硬件發展的趨勢,研發出基於有限元法的DDM(區域分解算法)技術,針對工程中常見的包含複雜結構和介質材料的大規模計算問題,DDM技術可提供優於線性的加速比,在商業電磁場仿真軟件乃至計算電磁學領域都具有里程碑式的意義。
上海超級計算中心(Shanghai Supercomputer Center,www.ssc.net.cn) 成立於2000年12月,由上海市政府投資建設,座落於浦東張江高科技開發園區內。上海超級計算中心是國內第一個面向社會開放,資源共享、設施一流、功能齊全的高性能計算公共服務平臺,目前擁有曙光4000A(2004年世界 排名第十)和“魔方”(2008年世界排名第十、亞洲第一)等3臺超級計算機,同時配備豐富的科學和工程計算軟件,致力於爲國家科技進步和企業創新提供高端計算服務。
此次Ansoft聯合上海超算中心所進行的測試主要針對HFSS-HPC模塊在計算大規模電磁問題時的並行效率。測試提供的數據是在8核以上計算機上進行的,給出了8到32核(域)間的加速比數據。
硬件配置:
爲說明DDM計算在國內的適用性,本次測試採用的硬件平臺爲“魔方”超級計算機。
本次測試共採用了“魔方”的4個節點,共計128個CPU內核,512GB內存。每個節點的配置爲:SMP架構,8個4核AMD巴塞羅那CPU計32核,32條4GB內存計128GB。節點間由20 Gb高速Infiniband網絡連接,連接速度是千兆網的20倍。
軟件配置:
操作系統:SUSE 10 SP2,其Linux內核版本2.6.16.60
仿真工具:HFSS版本 V12.1.0
測試案例簡介:
計算目標物體爲全鋁製機身的飛機,計算機載UHF通信頻段天線的工作狀態。連同周圍的空氣盒子計算空間的初始網格量爲290萬網格(一階)。
計算情況:
該問題單域計算時約需300GB內存。(注:單域計算所需內存超出單個計算節點的物理內存,故在下表中標記爲NA)。8域以上的計算機時對比如下(使用上述算例):
Num. of Cores |
Num. of Domains |
Memory per domain/core (GB) |
Total memory(GB) |
Solution time
|
1 |
1 |
NA |
NA |
NA |
8 |
8 |
30.74 |
245.9 |
8 hrs 23 mins |
16 |
16 |
11.78 |
188.5 |
2 hrs 46 mins |
32 |
32 |
5.31 |
159.3 |
1 hr 24 mins |
從上表中可以看出,隨着並行計算機CPU核數量的增加:
1、 項目計算所用總內存逐步降低,例如32個核比8個核求解此290萬網格的問題所需總內存降低約40%;(有效降低問題所需總內存);
2、 單個域使用內存的降低速度超過域數的增加速度;
3、 優於線性的加速比。如,當CPU核數量從8個增加到16個時,計算時間從8小時23分降低到2小時46分,速度加快到了約3倍!從使用16核到使用32核,計算速度也提高到了約2倍的效果。DDM技術的加速比體現出了良好的超線性。
注1:8、16、32核的求解時間均不包含網格剖分時間,而三者的網格剖分時間均爲41分37秒。
注2:8、16、32核的並行求解均採用跨節點並行方式,將計算任務均勻分配到4臺曙光TC5000的節點上,即32核並行求解時,每臺節點分配8核參與並行計算。
注3:加速比見附頁。
小結
綜上所述,HFSS-HPC採用的DDM技術配合曙光TC5000並行計算平臺,在有效降低電磁大問題求解所需總內存、增加電磁大問題求解速度兩個方面體現出了傑出的性能。使用HFSS DDM技術可以使客戶在保證問題求解精度的前提下,極大的擴展精確仿真所能覆蓋的電尺寸範圍,並且極大提高大問題求解效率,是將客戶自身電磁仿真能力提升到另一個更高層次的必備工具!
附:加速比等曲線圖