基礎設施作爲技術驅動力

對於一個互聯網企業來說,公共服務包括數據中心、網絡、服務器、計算、存儲等。隨着雲計算的發展,"基礎設施即服務(Infrastructure as a Service,IaaS)"正在將這些互聯網基礎設施變成全社會的基礎設施。

雲計算作爲社會的基礎設施,具有以下特點:

規模化

可獲得性

先進性

構建統一的基礎設施架構,整體數據中心從軟件層面抽象爲以下6個部分(從下到上):

平臺層軟件,包括固件、驅動、操作系統、虛擬化等。

資源管理,主要是統一資源調度系統。

硬件抽象層,例如統一的分佈式文件系統。

部署和維護,例如微軟的AutoPilot。

編程框架,例如MapReduce等。

應用層軟件,例如搜索、數據庫、機器學習等。

進一步細分,以阿里巴巴爲例,將基礎設置核心組件結合阿里巴巴的技術和業務現狀,可以得到如下的技術分層:

基礎技術:包含計算平臺和數據平臺。

調度平臺:統一提供各種任務需求與計算,負責存儲資源的協調和管理。

計算:包含計算硬件設備、操作系統和虛擬化軟件及其提供的不同資源形態。

存儲:包含存儲硬件設備、分佈式存儲軟件及其所提供的服務接口。

網絡:包含交換機、網卡、線纜等設備及其運維管理和應用平臺。

DC大腦:針對計算、存儲、網絡、數據中心、資源供應等整體的智能化運營和決策體系。

阿里巴巴基礎設施的綜合競爭力

結合阿里巴巴的業務特徵,阿里首先可以在阿里巴巴特有的業務場景下實現基礎設施的世界第一,例如在“雙11”海量突發流量這一場景下,可以說阿里巴巴的技術已經是世界第一,那麼在這一場景下的基礎設施也應該成爲世界第一,具體來說,像交易型DataBase(OLTP)、在離線混部、存儲計算分離這些技術和場景疊加“雙11”,結合基礎設施在規模、性能、穩定性等方面的優勢,阿里巴巴基礎設施的綜合競爭力必然成爲這個領域的世界第一。

其次,業界新技術的出現也給後來者提供了彎道超車的機會,例如在異構計算、AI芯片等領域,結合應用場景,阿里巴巴的完全可以建立一套自主掌控的具有核心競爭力的基礎設施技術體系。

最後,對於黑天鵝類技術的提前佈局,讓阿里巴巴有了在未來持續保持世界第一的可能性,例如,量子通信、量子計算、DNA存儲/計算等。

基礎設施5.0——AI、異構、智能化

2020年前後,阿里巴巴的基礎架構全面演進到5.0版本,主要有有幾個方面的突破:

大規模、高帶寬網絡集羣:以5.1HAIL網絡架構爲基礎,實現3~5萬臺大規模集羣部署、存儲計算分離架構、業務的混部。

在AI驅動下,異構計算(GPU、FPGA)成爲基礎設施重要的一部分。

信息化、數據化基本完成,智能化初步顯露威力。

基礎設施6.0——一體化最優基礎設施架構

從2020年到2022年,基礎設施6.0將引領阿里成爲世界第一。這一階段的典型特徵如下:

基礎設施架構穩定,從業務到宏觀架構,再到微觀架構的一體化優化,成爲重點方向,追求極致性能與極致成本優化。

異構計算已經成爲大部分業務的重要競爭力,例如結合阿里巴巴業務的深度自研芯片(智能網卡、NPU等)成爲阿里巴巴在基礎設施領域的核心競爭力。

架構上的創新成爲驅動計算能力增長的源泉,例如,內存計算、網絡隨路計算、新型存儲及內部池化技術等。

進入5G+時代,隨着端上的處理能力及網絡能力的極度增強並賦能新的應用場景(如新零售),近端的邊緣計算與網絡會成爲新的技術競爭方向。

全面智能化時代,例如,無人值守的全智能化IDC、數據中心能耗使用的極致優化等。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章