卷二 APO超級電腦架構

                                                                  卷二     APO超級電腦架構

             APO超級電腦架構由最多16個核組成,核間的連接是256位差分數據通信總線。超級電腦主要部件:帶流處理器的32位CPU核,最大256TH的共享DDR內存模塊,總線協調器。部件通過256位高速數據總線及一對時鐘線互連。MLVDS技術,1GHZ總線頻率,一個時鐘週期內傳輸兩次數據,它能夠在時鐘的上升期和下降期各傳輸一次數據。等效一對數據線傳輸頻率就能達到2GHZ。所以,高速數據總線傳輸速率爲:512Gbit/s或64GB/s 或32GZ/s 或16GW/s或2GH/S。用一個總線協調器最大互連16個部件。未來可能有6.4GHZ總線頻率,傳輸速率達到409.6GB/s或102.4GW/s或12.8GH/S。


         CPU核的本地內存最大4GH,分爲64K個塊,每塊64KH。可程序選擇任一塊連到高速數據總線接口的發送端或接收端。一行H爲256bit或32B或8W;高速數據總線一次傳輸一行。CPU核主要有:用戶進程管理者(用戶進程);空間管理者(共享DDR內存空間256TH、硬盤空間16EH的管理,文件系統);時間管理者(對象生存時間管理、實時時間、定時器事件、實時事件消息處理等);網絡管理者(網絡連接管理);實時圖像、聲音、感覺採集管理者;圖像、聲音識別、思考數據庫管理者(腦海);語言管理者;圖像、聲音等輸出管理者(顯卡、聲卡等輸出功能)。虛擬智能生命管理者等等。


          CPU核的流處理器,這是CPU內的一個簡單邏輯門電路功能塊。它的功能非常強大,一條指令就可對1M(百萬)對單精度浮點數做乘法、乘加或加法或減法或除法等運算,還有更強大的功能;後面會逐步介紹。單精度浮點數乘法的速度是:4TFlops/S。當然,你也可對共享DDR上數萬億個數據對進行運算,速度基本上是取決於高速數據總線的速度,即是每秒40億的數據對4G/S。也就是說數據流進入流處理器的輸入端,其輸出端結果就能返流回DDR。那些號稱T級/S運算的多核CPU或GPU,數據總線帶寬不到8GB/S;有用嗎?APO的總線速度是64GB/s啊;未來的技術應能做到409.6GB/S。1塊超級電腦主板16核,理論上單精度浮點數乘法的速度就可達到64TFlops/S。10萬塊超級電腦主板組合成的超級電腦,理論上單精度浮點數乘法的速度就可達到6400PFlops/S。遠超超級計算機-天河二號33.86 PFlops/S。


          CPU核的本地總線同樣是256位,連接最多4GH的本地內存。本地總線的部件有:高速數據總線接口;64K位流處理器;32位CPU核;外部設備總線控制器。部件的操作都是由32位CPU核的指令操控。外部總線的操作有:共享DDR外部內存與本地內存,共享DDR外部內存與流處理器,CPU核與外總線部件的消息傳遞。


        分工合作,並行處理纔是高效做事的方式。用戶管理者管理着8K個用戶進程,每個進程有很多消息需處理;許多消息的處理都需分派到其它部件來處理的。比如,一個用戶進程需打開一個文件,不過是形成一個消息發給空間管理者去處理。

 

          APO超強的彙編指令,估計相當於WINDOWS、LINUX操作系統功能的代碼量不到4K字,而不會象WINDOWS的以GW爲單位。4K字,4K行的代碼也是非常難的事啊;3萬行的代碼應能搞定一切軟件。而LINUX操作系統的原代碼量,居然達到將近千萬行。太驚人了!之所以這樣,硬件是最大的過錯!


       

      千里之行,始於足下!我會從最簡單開始,讓我們一起開始APO超級電腦架構之旅吧!


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章