數據基礎設施成趨勢,華爲戰略佈局的深意

石油被認爲是定義了二十世紀的一種商品,能源、交通、貿易、材料等多個行業都跟石油有着緊密的聯繫,石油幾乎代表着一切。當時間進入到21世紀,數字化時代到來,數據成爲最有價值的商品,整個數字世界的構建都離不開數據。

數據就像水一樣,它滋潤着數字世界的萬物。因此,當華爲在全球數據基礎設施論壇上宣佈面向鯤鵬計算產業,全面啓動數據基礎設施戰略,並將其開源數據虛擬化引擎命名爲河圖(HetuEngine),其用意不言而喻。“之所以用河圖這個名字是因爲源自‘大禹得河圖始見清明’,大禹通過河圖掌握河流山川複雜的地形地貌,順利完成治水大業。”華爲Cloud & AI 產品與服務總裁侯金龍如是說。

事實上,拉開時間軸來看,華爲今年圍繞數據推出了一系列的產品與解決方案,從年初的OceanStor分佈式存儲、GaussDB數據庫的推出,到年中OceanStor Dorado V6全閃存存儲以及華爲智能融合數據解決方案的發佈,再到年底華爲開源數據虛擬化引擎河圖的亮相,華爲數據基礎設施戰略的藍圖已經初步勾勒清晰。

在數據成爲智能時代的生產資料,整個數字世界的構建和運轉都是圍繞數據進行時,華爲數據基礎設施戰略的推出,不僅僅是對於智能時代的一種呼應,更是對於用戶數字化轉型基礎設施建設需求的一種滿足。

數據基礎設施成大勢所趨

數據基礎設施興起的大背景其實是數字經濟的快速發展。當前,數字經濟步入快速發展期,被普遍認爲是經濟發展的新引擎。以2018年爲例,我國數字經濟規模達到31.3萬億元,同比增長20.9%,佔GDP比重達到34.8%,這背後其實是行業加速產業數字化、企業加速數字化轉型,產業組織、商業模式以及生產方式全都將圍繞數據而進行重塑。

當然,這一切的基礎就是數據基礎實施。中國信通院認爲,數據基礎設施是面向現代化經濟體系建設和數字經濟發展,融合感知、傳輸、存儲、計算、處理等能力爲一體,爲社會生產生活進行數字化、網絡化、智能化的新一代智能化基礎設施。

與過去傳統的IT基礎設施不同,數據基礎設施具有四大特徵,它首先是傳統IT基礎設施的延伸,強調信息技術與傳統基礎設施的深度融合;此外,數據基礎設施具備融合、協同、智能、安全、開放五大特性;可以有效滿足數據的存儲、管理、計算等方面的新需求;還能夠推動數據應用生態的構建,將數據資源轉換爲數據資產。未來,作爲數字經濟的基石,數據基礎設施應該具備全面感知、泛在連接、高速傳輸、智能分析以及敏捷響應五大能力。

侯金龍表示:“數據增長是無限的,而數據基礎設施資源卻是有限的。”根據預測,全球數據量將從2018年的33 ZB快速增長到2025年的180 ZB。但是,產生的數據中僅有不到2%被保存,而被保存的數據中僅有不到10%被應用。

數據基礎設施成趨勢,華爲戰略佈局的深意

 

目前來看,各方對於數據基礎設施的定義、重要性等抱有不同的看法,尚未形成廣泛的共識;此外,在技術層面,數據採集、傳輸、處理、存儲、分析技術能力依然有待提升;而且新興技術融合面臨一定的困難,尤其是傳統行業基礎設施數字化程度低,改造難度大;隨着網絡安全防護的邊界不斷擴展,數據基礎設施安全層面涉及終端、設備、網絡傳輸、邊緣節點、數據等,需要去重點防護;最後則是應用推廣路徑不清晰,針對數據基礎設施可持續商業模式有待探索。

“華爲希望打造融合、智能、開放的數據基礎設施,讓數據的採、存、算、管、用實施全生命週期端到端的整合和優化,讓數據的每比特發揮價值最大,數據的每比特成本最優。”侯金龍如是說。

華爲數據基礎設施的三個關鍵詞

如今,隨着5G、大數據、雲計算、IoT以及人工智能等技術的加速應用,各個行業的用戶普遍都需要面對邊緣、中心以及雲三個環境。業務環境和業務場景的改變正在加速基礎設施的變革,在華爲看來,行業場景歸根結底主要分爲三類:生產交易場景、數據湖場景、邊緣場景。

“像金融、電信以及大型企業的ERP屬於典型的生產交易場景;而像政務大數據、公安大數據、電力大數據這些則屬於典型的智能數據湖場景;另外像運營商、銀行、煤礦、地鐵等需要的則是邊緣數據基礎設施。”華爲智能數據與存儲領域總裁周躍峯補充道。

數據基礎設施成趨勢,華爲戰略佈局的深意

 

因此,華爲的數據基礎設施戰略也面向這三大場景推出了三大解決方案,包括面向生產交易場景的OceanData、面向智能數據湖場景的FusionData以及面向邊緣場景的FusionCube 2.0,涵蓋了從AI芯片、存儲、數據庫到大數據、智能運維與管理等多種產品。

事實上,華爲在今年9月份全聯接大會上正式發佈了計算戰略及其“一雲兩翼雙引擎”的計算佈局,華爲數據基礎設施戰略是華爲計算大戰略的一部分。融合、智能、開放是華爲數據基礎設施戰略最爲核心的三個關鍵詞,華爲希望通過數據基礎設施建設讓用戶的數據系統從孤立走向融合,從複雜走向智能,從封閉走向開放。

在融合方面,華爲認爲煙囪式IT業務系統帶來兩個問題:存的時候會產生多個冗餘副本,且數據無法流動,存儲成本高;分析的時候會導致大量數據搬遷,分析效率低。爲此,華爲希望打破存儲內部系統牆、數據庫與存儲鏈路牆、大數據與存儲配置牆、數據庫與大數據協同牆這四堵用戶最爲常見的數據牆。侯金龍表示:“我們希望讓數據的融合更加徹底,讓數據流動起來,進而讓整體TCO大幅下降,數據訪問、處理、分析的性能與效率大幅提升。”

在智能方面,華爲爲數字基礎設施構建起基於AI芯片、存儲和華爲雲的三層架構,通過雲上訓練和雲下推理,讓數據基礎設施的配置和運維更加簡單、效率更加高效。“依託像昇騰處理器的AI能力,自動學習和識別IO流,提升Cache命中率,讓系統整體性能達到提升,並且結合華爲雲大規模運維運營經驗,實現性能預測和故障自我修復。”侯金龍介紹道。

在開放方面,針對目前很多用戶業務類型增多、大量業務需要跨平臺、跨數據源協同分析,找數難、取數難、用數難等情況,華爲數據基礎實施通過“河圖引擎”來屏蔽數據類型差異、地域差異、語法差異,讓數據治理和使用更加簡單。

當然,華爲也坦言數據基礎設施依然處於起步階段,從產品到解決方案依然存在着很大的提升空間。“數據基礎設施依然存在着很多挑戰,主要有兩個方面:第一是生態,第二則是中國在基礎設施研究領域依然比較薄弱。今天在中國市場,我們在互聯網應用層面有着很多非常出色的創新,但是在應用下面的基礎設施領域還需要進一步提高。”周躍峯如是說。

爲此,華爲成立了鯤鵬智能數據產業聯盟來持續推進智能數據產業發展,希望讓產學研用全面參與到數據基礎設施的創新之中。鯤鵬智能數據產業聯盟包括數據庫產業推進組、鯤鵬大數據產業推進組、鯤鵬智能邊緣產業推進組、存儲產業推進組(籌)等。華爲還設置了奧林帕斯獎,目的就是希望全球科研者參與到數據基礎設施業界難題的解決中來。

河圖引擎:讓數據基礎設施平臺化

在本次論壇上,華爲河圖引擎(Hetu Engine)首次向外界亮相。華爲河圖引擎的目的是爲了屏蔽數據基礎設施的複雜度,讓開發者像使用數據庫一樣使用大數據,複用現有的生態、工具和技能,讓數據治理、使用、價值挖掘更加簡單和方便。

華爲河圖引擎具備四個核心能力:

  • 一個目錄:通過元數據在線感知,構建1000+異地異構數據源全局虛擬數據視圖,打破數據孤島,數據全局可視,解決企業找數難問題。
  • 一個入口:通過開放的連接框架、5000節點SQL引擎,實現30種異地異構數據源統一SQL訪問,秒級獲取,數據全局可得,解決企業取數難問題。
  • 一份數據:通過CarbonData技術,實現一份數據多場景分析,多應用共享,數據零搬遷,數據全局可用,解決企業用數難問題。
  • 統一安全:通過細粒度動態授權、敏感數據自動感知技術,實現異地異構數據源集中式安全配置與管控,數據全局可控,數據授權時間從天到秒,解決企業數據安全與合規問題。

相比目前火熱的數據中臺,華爲河圖引擎所要做的事情是,對下去解決數據接入、數據共享的難題,對上有利於應用的數據分析與挖掘。目前業界對於數據中臺主要有兩種路線:一種是以營銷等業務場景切入的數據中臺;另一種則是傾向於通用型的數據中臺。但是,華爲更加強調河圖引擎並不是中臺,而是真正讓數據基礎設施走向平臺化。

數據基礎設施成趨勢,華爲戰略佈局的深意

 


周躍峯表示:“中臺目前是一個模糊的概念,包括像數據中臺、業務中臺等等。河圖引擎更希望打造成一個平臺,它並沒有業務屬性在其中。平臺的好處在於它可以讓生態合作伙伴們真正去使用。”

爲此,華爲宣佈將於2020年6月份正式對河圖引擎開源,華爲將開源內核,開發者可以基於開源代碼進行定製,包括數據源擴展、SQL執行策略等,實現應用快速對接,提升開發效率。

“以南向接口爲例,華爲不希望只有華爲的核心處理組件連接河圖,其他數據庫廠商的產品也能夠靈活接入,這樣真正形成一個開放的大生態。”周躍峯最後補充道。

總體而言,在基礎設施領域實現突破是一件需要持續投入、並且困難重重的事情。華爲數據基礎設施戰略的推出,表明華爲願意去承擔這項任務,攜手廣大合作伙伴去改變市場局面。人們常言:“想全是問題,做纔是答案。”期待華爲未來在數據基礎設施結出更多碩果。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章