爲數據驅動配上強大引擎,DELL EMC+Cloudera 樹立新標杆

一個真實的現狀。


過去銀行的營銷業務,通常是銷售人員找關係、拉人頭,費時費力不說,營銷效果往往差強人意;如今的銀行營銷,精準的人物畫像、不斷迭代優化的營銷模型、雲櫃員等基於數據驅動型的新業務場景紛紛上陣,不僅讓營銷變得更加自動化和智能化,還讓用戶服務體驗大幅提升。


這就是數字化浪潮下業務變革的一角。知微見著、以小見大,數據驅動正是當下企業數字化轉型的最強主旋律。IDC甚至預測,未來90%的組織都將成爲數據驅動型組織,組織的運營、管理、決策乃至創新都將圍繞數據來開展。


隨着數據驅動型業務場景不斷井噴,基礎設施和數據分析平臺已成核心引擎,其決定着企業是否能在數字化浪潮中獲得持續的動能。如何打造強大的數據驅動引擎就成爲業界着力解決的挑戰。顯然,DELL EMC和Cloudera同時看到了這一巨大的市場需求。


近日,DELL EMC宣佈其PowerScale成功獲得Cloudera CDP平臺最嚴苛的QATS認證。一個是全球領先的基礎設施企業,另一個是大數據分析平臺當之無愧的頭牌,雙方攜手在產品與解決方案深層次的合作,不僅精準把握住市場需求,更爲數據驅動基礎平臺建設樹立標杆。



數據驅動不言容易



數據驅動近年來之火熱,關鍵原因在於數字經濟蓬勃發展。


以中國市場爲例,最新《中國數字經濟發展白皮書(2021)》顯示,2020年中國數字經濟規模達到39.2萬億元,GDP佔比高達38.6%,同比增長速度遠超其他經濟形式。產業數字化、數字化轉型這些趨勢帶來了豐富的數據驅動型場景需求。


但數據驅動不言容易。“數據驅動”,短短几個字背後所傳遞的核心含義是:前端業務實現快速響應,海量數據實現價值落地,歸根結底是“讓企業與組織不僅要能把數據存好和管好,更需要把數據用起來和用好。”


與那些自誕生伊始就是數字原生的互聯網公司相比,傳統行業在數據驅動上遇到的挑戰會更大。具體來看:


其一、大部分傳統企業對於數據驅動有所嘗試,但依然處於探索階段,對於數據驅動還缺乏深刻理解。去年,國資委也頒佈了《關於加快推進國有企業數字化轉型工作的通知》,就重點強調了加強數據驅動等數字化轉型理念的重要性。


其二、與互聯網行業特點不同,大部分傳統企業更加關注數據安全、數據可靠爲前提下的數據驅動型場景的建設,這使得簡單的開源技術方案很難匹配企業的商業化需求。


其三、數據驅動往往會涉及到分佈式存儲、大數據、人工智能等一系列技術,但傳統企業並沒有互聯網企業龐大的技術團隊與人才,顯然不能相對輕鬆地駕馭這些先進的數字化技術。



正如戴爾科技集團大中華區非結構化數據存儲事業部高級經理李海所言,“未來,擁有大數據分析能力的企業纔會擁有市場領先的能力。企業在構建數據分析平臺時,不應該爲部署、調優、實現等牽扯過多精力,也不應該爲數據安全、數據治理等底層問題而擔憂。


事實上的確如此,面對分佈式存儲、Hadoop、Spark、TensorFlow、Tytouch這些不斷變化的數字化技術,傳統企業很難駕馭,更加需要進行認證、優化的方案,減少精力放在底層問題,聚焦在業務創新層面,這也是DELL EMC PowerScale與Cloudera CDP多年緊密合作的核心目的。



PowerScale+CDP,樹立行業標杆



自十餘年前Hadoop誕生以來,基於Hadoop的數據分析平臺方案數不勝數。但爲何是DELL EMC PowerScale與Cloudera CDP這對組合樹立了業界標杆,在全球用戶中廣受青睞。截止當前,CDP on Isilon(PowerScale前身)的容量已經超過70PB,在國內就有多個銀行、芯片製造等企業中廣泛採用,這對組合威力可見一斑。



先來看看PowerScale的情況。PowerScale前身是大名鼎鼎的Isilon,作爲全球知名的集羣NAS平臺,PowerScale在非結構化數據市場擁有大量用戶基礎,其橫向擴展能力、容量、性能、數據管理與數據保護功能等,在各種業務場景中得到了充分考驗。“PowerScale在數據治理、數據安全、數據訪問上非常成熟。像PowerScale原生支持HDFS,能夠大幅提升大數據訪問效率;此外,PowerScale實現計算與存儲分離,大幅降低用戶採購和管理成本。”李海表示道。


而Cloudera作爲Hadoop開源生態的創建者,近年來一直推動着Hadoop高速發展,在全球擁有廣泛的用戶羣。Cloudera不僅開發了多個Hadoop功能組件,還在推動大數據分析上不遺餘力。Cloudera大中華區售前技術總監劉隸放介紹,“Cloudera多年以來一直將業界最流行、最適合的新組件加入到Hadoop開源生態之中,以幫助用戶打造最強大的數據分析引擎。”


DELL EMC PowerScale與Cloudera CDP組合的最大意義,在於幫助用戶將數據從存好和管好,到用起來和用好這個階段實現無縫銜接,用戶不必花費太多精力在部署、升級、優化這些基礎事情上。這對於兩個公司用戶羣而言,是喜聞樂見的好事。



但獲得認證、打造聯合解決方案絕非易事。以本次DELL EMC PowerScale通過的Cloudera最嚴苛也是最高級的QATS認證爲例,當前全球僅有兩家存儲廠商能夠通過,雙方投入大量人力、物力和精力才取得通過。李海直言:“QATS不是簡單的兼容性認證,而是在實際環境中模擬使用CDP所有模塊,按照用戶使用流程來驗證所有軟件、硬件、功能等。


劉隸放也介紹,Cloudera之前與EMC就有深入合作,如今這種合作得到延續並且升級,而在於戴爾科技的溝通中,戴爾科技的專業性和投入印象深刻,“雙方合作需要大幅投入,因爲每個版本迭代和研究需要3到6個月,需要雙方工程師共同完成調試和測試多項工作。”



不斷進擊的PowerScale



在集羣NAS流行的年代,Isilon是無可置疑的業界標杆。進入到大數據時代,很難再用集羣NAS平臺來定義PowerScale。經過不斷的進化與成長,PowerScale更像是智能世界的一個數據湖堅實底座。


事實上,除了與Cloudera等大數據分析平臺公司緊密合作之外,PowerScale近年來一系列舉措也愈發證明了,其將繼續引領着數據湖底座未來的發展趨勢。


首先,PowerScale在推動全閃數據湖的普及。衆所周知,像自動駕駛、芯片設計、基因分析、智能推薦等等AI應用場景正在迅速增加,AI模型的巨量化和複雜化帶來的是數據海量化和數據處理性能的高要求。以OpenAI的GPT模型爲例,最新的GPT-3模型參數高達1750億個、預訓練數據量高達45TB,模型規模、數據量和訓練層數都比上一代有指數級的增加,這對於數據湖底座的性能和容量將是持續考驗。


而DELL EMC適時推出的PowerScale全閃存產品線無疑極具市場價值,高性能處理器、全NVMe配置、兼容NVIDIA GPUDirect等特性,都有助於幫助用戶獲得更加強大的數據處理能力。


其次,混合雲環境將會是企業未來很長一段時間的標配,數據湖亦需要適合混合雲環境的發展趨勢。以PowerScale,其同時提供支持本地、公有云工作負載選型;例如,PowerScale將橫向擴展文件功能引入到像Google Cloud等雲服務商,企業用戶可以根據自身情況來靈活選擇不同的服務形式。


總體來看,下一個十年將會是數據驅動型業務的黃金十年,數據分析能力將成爲企業在數字化轉型中的重要核心競爭力,而DELL EMC PowerScale不斷進化的能力,以及與Cloudera等公司的緊密合作,對於企業用戶構建自身的核心競爭力將大有裨益。面向未來,DELL EMC PowerScale釋放的價值將遠不止於此。


往期推薦:





新基建冷思考:大數據中心爲何如此重要


下一個十年,科研新基建需要新存儲


大智慧的戴爾科技


爲什麼軟件定義存儲走到十字路口


智算時代需要什麼樣的存儲

本文分享自微信公衆號 - 大數據在線(dobigdata)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章