數據湖,成爲海量數據存儲與分析的重要承載方式(附白皮書下載)

在洶湧而至的信息化浪潮下,大數據技術不斷更新迭代,數據管理工具得到飛速發展,相關概念也隨之而生。數據湖(Data Lake)概念自2011年被推出後,其概念定位、架構設計和相關技術都得到了飛速發展和衆多實踐,數據湖也從單一數據存儲池概念演進爲支撐高效、安全、穩定企業級數據應用的下一代基礎數據平臺。

此次發佈的《數據湖應用實踐白皮書》涵蓋了數據湖的定義與架構、數據湖核心組件與方案介紹、數據湖構建方案、應用實踐等內容,希望爲用戶提供新的洞察。

通過閱讀本書,包括開發者、IT運維人員、企業數字化管理者等可以全面瞭解阿里雲基於雲原生技術的企業級數據湖解決方案和相關產品,也能明晰傳統數據倉庫和數據湖的差異。

在雲計算和大數據時代,基於數據開展生產、運營、決策成爲常態,根據Gartner報道,2019年數據基建方面的採購費用飆升到660億美元,佔據基礎架構類軟件費用的24%。數據的存儲及應用體系是企業生態運轉的中樞神經,數據湖已經成爲海量數據存儲與分析的重要承載方式。

市場調研機構Research and Markets發佈的報告顯示,2020年,全球數據湖市場的價值爲37.4億美元,預計到2026年將達到176億美元,在2021年至2026年的預測期間的複合年增長率爲29.9%。

雲原生時代的到來,引領數據湖進入了“雲湖共生”新的階段。在此背景下,阿里雲推出基於雲原生技術的企業級數據湖解決方案,該方案採用了存儲計算分離架構,存儲層基於阿里雲對象存儲OSS構建,並與阿里雲數據湖分析(Data Lake Analytics 簡稱 DLA)、數據湖構建(Data Lake Formation簡稱 DLF)、E-MapReduce(簡稱EMR)、DataWorks(簡稱DW)等計算引擎無縫對接,且兼容豐富的開源計算引擎生態。

十年蹤跡十年心,結合先進的數據科學與機器學習技術,數據湖還能爲企業提供預測分析,幫助企業構建、優化訓練模型等。希望這本白皮書可以爲企業和組織的數字化轉型實踐提供指引,爲相關領域的業務決策者與實踐者提供面向行業應用場景的重要參考。

打開 https://developer.aliyun.com/topic/download?id=1164 ,可獲取白皮書全部內容。

原文鏈接

本文爲阿里雲原創內容,未經允許不得轉載。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章