面向大規模數據智能的阿里雲存儲創新

近年來,越來越多人意識到,我們正處在一個數據爆炸式增長的時代。IDC 預測 2027 年全球產生的數據量將達到 291 ZB,與 2022 年相比,增長了近 2 倍。其中 75% 的數據來自企業,每一個現代化的企業都是一家數據公司。

阿里雲副總裁、阿里云云存儲產品線負責人吳結生在雲棲大會的演講中提到:“從雲的角度來看,雲的存力、算力,雲上提供的數據管理的能力,大數據分析能力和人工智能計算能力,幫助每家企業從數據公司演進到數據驅動的公司。因此雲計算是企業實現數智化的階梯。”

在企業實現數字化和智能化轉型的過程中,需要重構企業的存儲基礎設施。在這個過程中,有三個非常顯著的要求:
第一,要有韌性,要穩定安全、更可靠、更高可用,能夠保障業務的連續性;
第二,需要持續地應對業務的增長,能更經濟、高效地存儲更多數據;
第三,需要更高效率和更敏捷的能力,高效地挖掘數據的價值,敏捷地實現數據驅動的業務決策和業務創新。

阿里雲存儲,第一,不斷提高存儲產品的高可靠、高可用的能力,並完善安全和合規的能力,幫助客戶構建韌性的存儲基礎設施。第二,持續地進行成本優化和技術升級,幫助客戶優化存儲費用,經濟地存儲更多數據,支撐業務的增長和業務的變化。第三,支持高性價比的數據湖和大數據分析、AI/ML 智算和高性能計算,幫助客戶敏捷高效地進行數據驅動的業務決策和創新。吳結生表示,雲存儲是構建企業現代化的存儲基礎設施的基石,這既是技術發展的趨勢,也是企業在進行數字化和智能化轉型過程中必然的選擇。

構建韌性,保障業務永續

穩定可靠的存儲,是保障企業業務平穩發展的基石。從 2008 年底開始,阿里雲就致力打造高可靠和高可用的存儲系統和雲存儲產品。在國內,早在 2019 年,阿里雲是首家推出同城冗餘存儲產品的雲服務商,發佈了對象存儲 OSS 的同城冗餘的產品。採用容忍故障的設計理念,爲用戶提供最高達 12 個 9 的數據可靠性和 99.995% 的服務可用性。

基於 OSS 同城冗餘產品過去 4 年來保障客戶大規模數據可靠性和可用性得出的實踐經驗,在本次雲棲大會上,阿里雲發佈了更多支持同城冗餘能力的存儲產品,讓同城冗餘產品的高可靠和高可用更加普惠地幫助客戶構建韌性的基礎設施,保障業務的連續性。

表格存儲、日誌服務、快照和備份都推出了同城冗餘產品,產品價格與本地冗餘(也即 單 AZ 冗餘)的產品價格保持一致。針對 OSS 的本地冗餘的存儲 Bucket,阿里雲提供了一鍵升級到同城冗餘存儲 Bucket 的能力。

同時,阿里雲還發布了業界第一個真正意義上擁有同城冗餘的高性能塊存儲 Regional ESSD。它基於飛天盤古同城冗餘架構,支持多重掛載,容忍可用區級別故障。Regional ESSD 簡化高可用的數據庫應用和 Mission Critical 應用的構建。

除了同城冗餘的存儲產品外,阿里雲存儲產品還提供了近實時的跨地域異步複製能力,幫助客戶實現異地多活架構 ,充分保障業務連續性。對象存儲 OSS、塊存儲 EBS、文件存儲 NAS、表格存儲 Tablestore、快照都提供了跨區域的異步複製能力。

大會現場,小米雲服務研發總監、手機部服務端 TMG 主任孔令濤坦言:小米雲服務自 2012 年創立以來已累計存儲超過 1,000PB 的數據量,在整個過程中小米雲服務從未出現任何一例數據問題,也未曾影響用戶的正常使用,這一成果,源自阿里雲存儲提供的穩定可靠的雲存儲服務。

優化成本,應對業務增長和變化

數據的爆炸式增長,企業產生大量的數據,更加經濟地存儲更多的數據,是企業面臨的挑戰。阿里雲不斷創新和演進存儲技術,優化產品成本,釋放技術紅利,提升產品的彈性能力,幫助企業更好的應對業務增長和變化。

企業的數據有不同的訪問頻率和使用方式需求,有熱數據、溫數據和冷數據等分層。對象存儲 OSS 提供給用戶五種存儲類型,用戶可根據數據訪問類型與業務需求,配置自動的數據分層策略。該能力已爲阿里雲的存儲客戶每個月節約接近 2 億元的存儲費用。今年 6 月發佈了歸檔直讀的能力,可實時訪問歸檔數據。企業可在不犧牲數據的實時處理和分析能力下,獲得更低價格的存儲。

此外,阿里雲也發佈了塊存儲 EBS 新的入門規格:ESSD Entry,比 ESSD PL0 規格的價格降低30%。據吳結生在大會現場透露,針對有性能持續突發增長需求的客戶,今年年底,阿里雲 ESSD AutoPL 還將提供 Burst 費用封頂能力,性能可以持續彈性增加到 100 萬 IOPS, 當 IOPS 到達一定閾值後,費用封頂。採用新的費用封頂模式,成本將降低高達 85% ,讓用戶擁有彈性的高性能體驗的同時,成本可控。並且,阿里雲存儲還將發佈另一業內首創的塊存儲彈性臨時盤,可解耦計算實例與本地盤,爲用戶提供經濟高效的臨時數據存儲空間。

除以上兩款產品外,阿里雲還宣佈文件存儲 NAS 提供高級型規格,比性能型價格降低 54%,實現業務系統低成本向全閃存儲升級。文件存儲 NAS 提供更高性價比的歸檔規格,進一步降低冷數據長期存儲成本。文件存儲 CPFS 將提供分層存儲,並打通與對象存儲 OSS 之間的流動。日誌服務 SLS 簡化了計價模型,從原來的 19 項計費項減少到基於寫入數據量的計費。SLS 推出歸檔存儲並推出自動分層的能力,歸檔存儲的價格比熱存儲降低 86%。

增強敏捷性,提升業務創新效率

數據因 AI 而變得越來越重要。如何高效地挖掘數據價值,讓數據驅動業務決策,未來的存儲基礎設施還需要更好的適配 AI 時代用戶對數據存儲的新需求,幫助用戶實現敏捷重構,提升創新效率。

數據湖則是企業挖掘數據價值的重要工具。阿里雲對象存儲 OSS 作爲數據湖存儲,具備穩定、安全、高性能、低成本等特性,提供豐富靈活開放的接口。一方面,用戶可隨時隨地去上傳任何類型的數據到 OSS 來構建數據湖。另一方面,通過這些接口,用戶的數據既可以通過阿里雲提供的各種數據分析服務、人工智能和計算學習平臺、可視化和流計算等進行數據價值的挖掘。用戶也可以使用這些開放的接口無縫對接自研的數據分析系統和開源的系統。

此次雲棲大會上,阿里雲也宣佈將對象存儲 OSS 的讀帶寬提升了 10 倍,從原來的單客戶 10Gbps 提升到 100Gbps,幫助用戶構建了更高效的數據湖存儲和數據湖的分析能力,同時也提升了文件的分發能力。

值得一提的是,喜馬拉雅在雲棲大會現場分享了採用 OSS 數據湖架構的最佳實踐。通過利用數據湖、湖倉一體技術,可以在短時間內快速抓住用戶的興趣點,通過用戶瀏覽、搜索等行爲,進行更智能化的推薦。

據喜馬拉雅 CTO 姜傑在雲棲大會現場介紹:“藉助阿里雲的 E-MapReduce 和 OSS-HDFS,我們構建了喜馬拉雅雲原生大數據平臺,並結合喜馬拉雅領先的情感語音 AI,推動業務創新,爲用戶提供更優質的內容消費和更智能的語音交互體驗。”

面向大模型智算場景,阿里雲文件存儲 CPFS 爲 AI 負載進行優化,提供了 200 微秒的延遲,20TB/s 的帶寬,3 億 IOPS 的高併發能力,充分滿足了 10 萬卡智算集羣的存儲超高性能的需求。

吳結生表示:“阿里雲存儲技術的創新來自雙輪的驅動。一方面來自我們的客戶,向客戶學習,客戶的需求驅動。另一方面,來自技術驅動,來自我們的技術架構。所有的存儲產品都基於統一的分佈式存儲系統飛天盤古作爲底座而構建。飛天盤古是阿里雲存儲創新的發動機。”

歷經 15 載,如今的飛天盤古系統已迭代至第三代,數千萬行代碼和 1,000 餘項專利,從大規模、到高性能、到高效能的分佈式存儲系統的演進,更高效地讓數據中心成爲一臺計算機。

 

就在前不久,阿里雲分佈式存儲技術獲中國發明專利金獎。專利所支撐的存儲服務已廣泛應用於鐵路 12306、雲上奧運會、電子社保卡、醫保平臺、數字政府、城市大腦、杭州亞運等重要工程,爲全球數百萬客戶提供服務,累計服務超 9 億人次。

原文鏈接

本文爲阿里雲原創內容,未經允許不得轉載。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章