首份數據基礎白皮書發佈,直指未來基礎設施痛點

一個真實的故事。

某家商業銀行爲準備國慶長假計劃策劃大型營銷活動,以此來帶動老用戶消費和挖掘潛客。通常,業務部門通常會與電商、OTA、出行、O2O等平臺,甚至保險公司、線下餐飲、影院、購物中心等進行權益合作,爲了讓營銷效果最優,數據分析部門和技術部門需要與業務部門反覆溝通需求,去對數據做採集、處理、清洗、打通與匹配,最後通過聚類和統計分析,將客戶羣進行劃分,並給業務部門出相應的數據分析報告,但折騰一個月,業務部門最後發現報告內容可執行性並不強,營銷效果差強人意。

這種情況在金融領域比比皆是。作爲銀行核心業務的營銷需要大量的人力、溝通以及時間,數據維度太少,數據打通程度不夠,業務部門不能真正把數據價值用起來,缺乏數據閉環,使得業務營銷效果不佳。這些現象的背後其實反應出目前絕大部分用戶所面臨的普遍挑戰:數據存不下、流不動、用不好,而根本原因在於數據基礎設施上落後,無法有效幫助用戶支撐起數字化時代一系列基於數據的業務應用與創新。

強如銀行這種科技水平很高的行業在數據基礎設施領域都存在着巨大挑戰,更何況其他行業。未來,數據基礎設施的建設必然會成爲所有行業用戶在數字化轉型過程中需要重點去應對的重要挑戰之一。

數據基礎設施爲何如此重要

近日,中國信息通信研究院和華爲技術有限公司共同編寫與發佈了《數據基礎設施白皮書 2019》,這是國內首份針對數據基礎設施領域的白皮書。該白皮書對於數據在數字經濟時代的角色定位、數據應用的現狀、數據基礎設施的定義與特徵以及未來趨勢進行了深度解讀。

該白皮書認爲數據正在成爲數字經濟發展最關鍵的生產資料,隨着數字經濟的蓬勃發展,正在深刻改變生產與生活方式,數據的有效應用則會成爲經濟社會發展的強勁驅動力,而5G、雲計算、大數據、物聯網、人工智能等新技術則持續推動了數據的爆炸性增長。

爲什麼數據基礎設施如此重要,這篇白皮書講透了

 

與此同時,在數據爆炸性增長的趨勢下,海量數據蘊含着巨大價值的同時,也給用戶帶來的巨大的挑戰,“數據存不下、流不動、用不好”成爲最普遍的現象。以數據流不動爲例,《數據基礎設施白皮書 2019》介紹,數據需要像水一樣流動起來,才能打破“數據壁壘”,最大化釋放價值,不過目前數據流不動主要面對着應用孤島、管理孤島、地理孤島的數據“三類孤島”,以及算力牆、網絡牆、介質牆的資源“三堵高牆”。

爲解決“數據存不下、流不動、用不好”的普遍問題,《數據基礎設施白皮書 2019》認爲數據基礎設施是關鍵,出色的數據基礎設施可以加速實現數據價值的變現。

白皮書認爲數據基礎設施是由基礎設施層和數據管理層組成,其中基礎設施層包括存儲、計算、網絡等硬件設施, 數據管理層由操作系統、數據庫系統及大數據系統組成,構成支撐數據存儲及數據全生命週期管理的軟件設施。

數據基礎設施應該涵蓋接入、存儲、計算、管理和數據使能五個領域,通過匯聚各方數據,提供 “採-存-算-管-用”全生命週期的支撐能力,構建全方位的數據安全體系,打造開放的數據生態環境, 讓數據存得了、流得動、用得好,將數據資源轉變爲數據資產。

《數據基礎設施白皮書 2019》認爲,數據基礎設施應具備以下5個特徵:融合、協同、智能、安全、開放,以幫助企業實現存儲智能化、 管理簡單化和數據價值最大化。比如在融合方面,白皮書認爲需要在異構算例融合、存算融合、數據庫存儲融合、協議融合、格式融合五個層面進行,進而讓數據流動起來,數據使能更加便捷。

總體而言,《數據基礎設施白皮書 2019》首次對於數據基礎設施的重要性、定義、特徵以及趨勢進行系統性的闡述。該篇白皮書不僅可以讓用戶對於數據基礎設施重要性有充分認識,也對於數據基礎設施產業鏈的發展有着推動作用。

數據基礎設施剛起步,生態構建亟需加強

在數據基礎設施領域,華爲是業界走在最前沿的公司之一。華爲在11月19日的全球數據基礎設施論壇上正式宣佈了其數據基礎設施戰略。華爲數據基礎設施包括數據存儲、數據處理、數據管理系統以及數據虛擬化引擎(HetuEngine),華爲希望通過融合、智能、開放的數據基礎設施,對數據的採、存、算、管、用實現端到端的整合和優化。

“華爲致力於讓數據在全生命週期內好用,讓每個比特的數據價值發揮最大,每個比特的數據成本最優,讓合作伙伴像使用數據庫一樣使用大數據。”華爲Cloud & AI產品與服務總裁侯金龍表示。

毫無疑問,數據基礎設施依然處於早期階段。由於數據產業涉及到多個細分市場以及衆多市場參與者,往往需要數據、產品與服務之間的緊密協同,數據基礎設施作爲數據產業中的關鍵支撐環節,同樣需要包括硬件、軟件、開源等相關產業鏈上下游企業緊密合作,“平臺+生態”將會是數據基礎設施未來至關重要的發展方式。

正因爲如此,在華爲數據基礎設施戰略中,數據虛擬化引擎--河圖(HetuEngine)是華爲“平臺+生態”的一大創舉,河圖引擎在整個數據基礎設施中猶如核心樞紐一樣,不僅可以屏蔽掉數據基礎設施底層的複雜性,讓開發者無需關注後臺抽象的邏輯關係,也不用操心涉及數據存取用的具體細節,只需在更高層服用已有的生態、工具和技能,就可以實現2-10倍的開發效率提升。

爲什麼數據基礎設施如此重要,這篇白皮書講透了

 

與目前市場中熱門的數據中臺不同,華爲河圖引擎(HetuEngine)是一個讓數據基礎設施走向平臺化的平臺,它對下解決數據接入、數據共享的難題,對上有利於應用的數據分析與挖掘,真正浚通企業內部多個孤立的數據源,爲企業的數字化轉型釐清了數據和業務的邏輯,讓數據重複實現了共享和全局應用,並且極大提升了數據資源的全面性、準確性和可用性。

此外,華爲河圖引擎(HetuEngine)讓數據基礎設施走向平臺化,也將徹底改變過去數據孤立與割裂的局面,讓數據的完整性、可靠性以及安全合規等問題得到充分保障。

更加難得的是,華爲充分意識到生態在數據基礎設施建設中的重要性。因此,華爲宣佈將於2020年6月份正式對河圖引擎開源,將向生態合作伙伴開放北向接口、南向接口以及核心引擎。北向接口組件的開源可以確保多樣化應用按需接入,方便應用創新;南向接口組件的開源則讓數據接入更加靈活;核心引擎開源則讓合作伙伴共同參與到數據基礎設施生態建設之中,讓合作伙伴自主可控,免去鎖定的風險。

華爲希望通過河圖引擎(HetuEngine),能夠真正打造出一個數據平臺,並且踐行“平臺+生態”的策略,讓客戶和合作夥伴能夠像使用數據庫一樣方便的使用大數據。相比過去我們認爲的包羅萬象的中臺,華爲所提供的數據基礎設施解決方案,將更有利於創造一個共贏的生態環境。

此外,華爲還對數據基礎設施的場景進行了歸類:生產交易場景、數據湖場景、邊緣場景,並針對這三大場景推出了相應的數據基礎設施解決方案:面向生產交易場景的OceanData、面向智能數據湖場景的FusionData以及面向邊緣場景的FusionCube 2.0,涵蓋了從AI芯片、存儲、數據庫到大數據、智能運維與管理等多種產品。

《數據基礎設施白皮書 2019》是數據基礎設施產業的一個起點,它標誌着數據基礎設施已經成爲用戶界和產業界的共識。雖然目前關於數據基礎設施具體定義依然存在着一些差異,但是數據基礎設施的價值與作用已經日漸清晰和突出,隨着《數據基礎設施白皮書 2019》的推出,相信未來會有更多各行各業的用戶在數字化轉型中加快數據基礎設施的建設,也會有更多的產業鏈夥伴加入到數據基礎設施大生態之中。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章