雲原生時代來襲 下一代雲數據庫技術將走向何方?

全面雲化的時代已經到來,面對一系列的新技術和挑戰,數據庫市場將面臨怎樣的變革?作爲雲服務提供商,如何幫助更多的企業級用戶把握“雲”潮,提供最高效、最具價值的數據庫解決方案?

日前,在阿里雲峯會·北京站的數據庫專場上,阿里巴巴集團副總裁、達摩院首席數據庫科學家、阿⾥雲智能事業羣數據庫產品事業部總負責⼈李飛飛針對下一代雲原生數據庫的技術與挑戰進行了精彩分享。

數據庫發展與技術演進之路

根據DB-Engine 2019年1月份的數據庫市場趨勢分析,關係型數據庫依舊佔據着最核心的市場份額。與此同時,數據庫市場也在不斷細分,圖數據庫、文檔數據庫以及NoSQL等數據庫細分市場正在崛起。

另一大趨勢則是:以Oracle、DB2和Microsoft SQL Server三大巨頭爲代表的傳統商業數據庫所佔據的市場份額不斷下降,而開源和第三方數據庫市場持續增長。

數據庫技術誕生至今,雖然已經歷40多年的發展歷程,但仍舊處於蓬勃發展的時期。如今,各大雲計算廠商也達成了共識:數據庫是連接IaaS和雲上智能化應用的重要組成部分,因此從數據的產生、存儲以及消費等各個環節,雲產商都需要提升全鏈路的能力,進而滿足用戶連接IaaS和智能化應用的需求。

隨着數據庫技術的不斷髮展,不僅出現了OLTP系統來實現事務的處理,可以實現對交易數據的實時記錄;還出現了OLAP系統,藉助OLAP系統可實現對於海量數據的實時分析。除此之外,還需要各類的數據庫服務和管控工具支持核心的OLTP和OLAP系統。在此基礎之上,針對半結構化數據和非結構化數據,NoSQL數據庫解決方案應運而生。

上世紀70年代末到80年代初,誕生了關係型數據庫,產生了SQL查詢語言以及OLTP交易處理系統。隨着數據的爆發式增長以及複雜分析需求的出現,誕生了數據倉庫,以及OLAP在線分析處理系統以及ETL等數據處理技術。

技術發展到今天,圖、文檔以及時空、時序等多元異構數據量持續增長,因此也對應地出現了關係型數據庫之外的NoSQL和NewSQL數據庫系統。

雲原生時代 我們需要怎樣的數據庫?

傳統數據庫往往採用單節點架構,而到了如今的雲原生時代,雲原生數據庫通常會採用共享存儲的架構方式。阿里雲POLARDB所採用的就是共享存儲架構,通過高速網絡構建共享存儲,在此之上實現存儲與計算的分離,進而可以快速彈性擴容出多個計算節點。

與此同時,POLARDB還可以根據用戶的具體需求在存儲和計算兩個維度迅速地實現擴縮容。而對於用戶而言,無需修改任何業務邏輯,就可以使用基於共享存儲的POLARDB數據庫,可以實現無侵入式遷移。

除了雲原生的共享存儲技術之外,面對高併發、海量數據訪問的挑戰,也需要藉助分佈式架構來解決,比如爲了應對每年的雙11大促,阿里巴巴自身就需要去探索分佈式架構。

此外,針對數據的多模多態需求,阿里雲也希望在用戶側提供不同查詢接口,比如SQL。在存儲側,阿里雲希望能夠支持用戶將數據存儲到不同地方,並通過像SQL這樣的統一接口實現對不同數據類型的統一查詢訪問。目前,阿里雲所提供數據湖服務就是針對上述場景所演進來的雲原生技術。

正如前面所提到的OLTP和OLAP系統,傳統的解決方案希望將讀寫衝突隔離開,讓OLTP負責事務處理,讓OLAP負責海量數據的分析任務。而在雲原生時代,阿里雲會藉助新硬件所帶來的技術紅利,儘可能降低數據遷移的成本,將事務處理和數據分析整合在同一個引擎中,通過一套系統爲用戶無縫解決兩種問題。

阿里雲目前已經服務了大量企業級客戶,這些客戶通過虛擬化、存儲與計算分離來使用阿里雲所提供的雲資源池。因此,我們需要對於雲上全部資源進行智能化監控和調配,做到快速響應,並且爲用戶提供最高質量的服務。而智能化的背後需要利用機器學習以及人工智能技術,從數據遷移、數據保護、彈性調度等各個維度實現自感知、自決策、自恢復以及自優化。

在雲原生時代,另外一個重要技術就是軟硬件一體化設計。新硬件的發展爲數據庫系統帶來了許多可不斷利用的技術紅利,比如RDMA網絡、SSD、NVM、GPU、IPG加速等。阿里雲的POLARDB共享存儲就利用了RDMA網絡,因此可以做到像本地節點一樣快速訪問遠程數據庫節點。

對於很多雲上的客戶而言,可能也有金融級高可用的需求。利用高可用協議,阿里雲數據庫可以採用三副本架構,在本地可以實現數據庫之間的無縫實時切換,在異地也可以滿足不同用戶對於災備的需求,藉助Binlog技術實現異地數據同步,實現金融級高可用。此外,雲上用戶對數據的安全性尤爲看重,阿里雲數據庫服務從數據落盤開始,就提供了加密技術,確保全鏈路的數據安全。

阿里雲數據庫服務:全域佈局自主可控 兼具創新與商用價值

阿里雲數據庫所提供的工具類產品包括數據備份、數據遷移、數據管理、混合雲數據管理以及智能化診斷與優化系統等,可以幫助客戶實現快速上雲並且打造混合雲解決方案。

我們提供的核心引擎產品中,既有自主可控的自研產品,也有第三方以及開源的產品。希望通過商業數據庫以及開源產品爲用戶提供豐富的選擇,同時也希望將雲計算的技術紅利整合到自研數據庫產品中去,進一步做深做透,真正地幫助客戶解決應用第三方或者開源數據庫所無法解決的痛點和問題。

在OLTP方向,阿里雲數據庫所提供的核心產品是POLARDB以及其分佈式版本POLARDB X。除此之外,阿里雲也提供主流的MySQL、PostgreSQL、SQLServer以及針對於Oracle兼容的PPAS等一系列服務。

針對OLAP系統,我們的核心產品是AnalyticDB、針對多源異構數據所提供的數據湖服務DLA,以及針對IoT場景的時序時空數據庫TSDB。而在NoSQL領域,阿里雲則提供了豐富的第三方數據庫產品供客戶選擇,比如HBase、Redis、MongoDB以及阿里雲自研的圖數據庫GDB等。

阿里雲數據庫的管控平臺與全鏈路監控服務爲用戶提供了智能化的全鏈路檢測與分析,保障阿里雲數據庫能夠爲用戶提供最高級別的Service Level。

阿里雲幫助客戶打造了一條線上線下混合雲數據存儲的鏈路,從客戶遷移上雲開始,其可以選擇阿里雲DTS服務進行實時的數據上傳和同步。數據上雲之後,客戶可選擇POLARDB等雲原生數據庫產品進行存儲,也可以藉助DLA或者AnalyticDB等產品進行數據分析。

而針對特定場景進行數據分析可以選用文檔數據庫、圖數據庫或者時序時空數據庫等解決方案,可以藉助DTS系統實現線上線下的數據同步備份,並且還可以藉助HDM來進行混合雲數據庫管理。此外,阿里雲數據庫服務還提供了數據庫管理套件,可以支撐用戶對數據庫進行管理和開發,使得管理和開發流程更爲高效。

這裏主要爲大家介紹兩種雲原生數據庫產品,POLARDB和AnalyticDB

POLARDB

POLARDB利用RDMA網絡實現了高效的共享分佈式存儲,藉助於共享存儲技術,多個計算節點中可以實現“一寫多讀”,並且可以根據客戶的工作量需求,快速彈出多個只讀節點來滿足客戶在高峯時刻對於計算的需求,同時也可以在存儲節點上實現快速縮擴容。

針對客戶的應用場景以及其業務峯值峯谷的波動情況,POLARDB可以做到按量按需使用和計費,進而大大地提升了客戶的數據庫使用效率,節省了所需要成本。總體而言,POLARDB就是一個超級MySQL,後續POLARDB還會陸續推出兼容PostgreSQL和Oracle的版本。

在一些場景下,用戶需要面對高併發和海量數據訪問的挑戰,因此需要突破共享存儲的容量上限。分佈式架構的POLARDB X則利用Sharding Partition解決方案實現了存儲容量的無限水平擴展。POLARDB X分佈式版本也會在後續進行公測,歡迎大家試用。

AnalyticDB
對海量數據進行分析的時候,讀寫會產生一定的衝突。如果需要讀取大量數據並進行分析將會極爲複雜,因此推薦大家使用阿里雲的實時交互式分析數據庫系統AnalyticDB。

AnalyticDB最核心的特點是具有支持高吞吐寫入的能力,並且具有針對於行列存儲所研發的存儲引擎,因此可以實現實時的交互式分析。在海量數據以及高併發場景下,AnalyticDB在響應時間方面的表現都非常優秀。AnalyticDB兼容了MySQL生態,因此可以將MySQL裏面的數據直接導入AnalyticDB中,可以實現對上百億級別的數據的毫秒級查詢以及百萬TPS級別的寫入。

數據傳輸雲服務DTS
除了核心的雲原生數據庫產品,我們還有多款數據庫工具型產品,比如數據傳輸雲服務DTS。DTS所解決的痛點是雲下客戶上雲所需要進行的數據傳輸問題,以及其在上雲之後,雲上與雲下數據庫或者從TP到AP系統之間進行實時的數據同步問題。

利用DTS,用戶可以實現快速、高效地增量數據同步,保證了實時數據一致。DTS還提供了數據訂閱能力,可以通過不同的協議和接口來接入更多不同的數據源。

數據庫家族迎來新成員:圖數據庫GDB

這裏爲大家介紹一款阿里雲新的數據庫產品——阿里雲圖數據庫GDB,該產品目前正在阿里雲官網進行公測。GDB是一種支持屬性圖模型,用於處理高度連接數據查詢與存儲的實時可靠的在線數據庫,其利用了大量的雲原生技術,比如存儲與計算分離等。GDB支持標準的圖查詢語言,兼容Gremlin語法,這一點與市場主流的圖數據庫保持一致。

GDB另外一個最核心的特點就是支持實時更新、支持OLTP級別的數據一致性,能夠幫助大家在對海量的屬性圖進行分析存儲時保證數據的一致性。GDB具有服務高可用、易於維護等雲原生數據庫產品的特性。比較典型的應用場景有社交網絡、金融欺詐檢測、實施推薦等,同時GDB還支持知識圖譜等形態以及神經網絡等。

以賦能客戶爲本:降本提效 無憂發展

阿里雲數據庫團隊的目標是爲客戶提供企業級的雲原生數據庫服務,利用自身全域佈局、自主可控的技術爲企業客戶提供快速數據上雲、雲上雲下統一數據管理以及數據安全等服務。

舉例而言,阿里雲數據庫服務目前在杭州等城市支撐了像城市大腦這樣複雜的應用,其既需要存儲結構化數據也需要存儲非結構數據,並且對於OLTP、OLAP、工具類產品等都提出了巨大的挑戰,而藉助阿里雲AnalyticDB、POLARDB、DTS等利用了雲原生技術的產品可以無縫地支撐城市大腦這樣的複雜應用場景。

以POLARDB爲例,該產品於2018年8月份進行公測,2018年的年底進行商業化,到目前爲止實現了在公有云平臺上的快速增長。POLARDB呈現快速增長背後的核心原因就是阿里雲真正地幫助客戶解決自身的痛點問題,不是利用新技術來“造完錘子找釘子”,而是真正地“看到釘子再去造錘子”。

POLARDB最爲核心的特點就是雲原生、分鐘級別的彈性存儲和計算、高性價比、靈活彈性的使用計費方式、高併發能力,可快速擴容多個只讀節點、大容量支持、通過共享分佈式存儲做到了類似單機數據庫的體驗,對用戶的業務邏輯無侵入,並且高度兼容MySQL。

AnalyticDB則是一個實時交互式分析系統,無論是自制數據還是從大數據系統中獲取的存儲數據,都可以藉助DTS工具將其遷移到AnalyticDB集羣上,進行深入的商業分析、可視化以及交互式查詢等。

AnalyticDB能夠支持上百個表的連接查詢,可爲客戶提供毫秒級的查詢服務。如今,無數用戶正在阿里雲上使用POLARDB和AnalyticDB這樣的雲原生數據庫,雲原生數據庫也正在真正地改變客戶在應用中所遇到的痛點,爲他們帶來更多的業務價值。

總結而言,雲原生時代出現了一系列的新技術和新挑戰。面對這些挑戰,需要對於數據庫內核產品、管控平臺以及數據庫工具進行有機整合,才能夠爲客戶提供最高效、最具有價值的解決方案。阿里雲誠摯地邀請大家體驗自身的產品和技術,希望能夠與更多的客戶一起合作,解決問題,也希望更多的開發者和生態合作伙伴能夠基於阿里雲的數據庫服務和產品打造針對特定行業和領域的深度解決方案,使得雲原生時代的數據庫市場更加繁榮。



本文作者:七幕

閱讀原文

本文爲雲棲社區原創內容,未經允許不得轉載。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章