進入雲原生、分佈式的時代什麼纔是數據庫的正確打開方式

文章來源：路沙中國信息化週報

摘要：Gartner 公佈 2020 年度全球數據庫魔力象限評估結果，在今年Gartner將OPDBMS(事務性關係型數據庫)與DMSA(大數據管理與分析)合二爲一成爲新的Cloud DBMS Market(統一的雲數據庫系統市場)的挑戰下，阿里雲挺進全球數據庫第一陣營——領導者象限，是中國數據庫歷史上重大突破，也是中國基礎軟件行業首次進入Gartner魔力象限的全球領導者。

李飛飛，阿里花名飛刀，2018年加入並帶領阿里雲數據庫團隊。兩年後，Gartner 公佈 2020 年度全球數據庫魔力象限評估結果，在今年Gartner將OPDBMS(事務性關係型數據庫)與DMSA(大數據管理與分析)合二爲一成爲新的Cloud DBMS Market(統一的雲數據庫系統市場)的挑戰下，阿里雲挺進全球數據庫第一陣營——領導者象限，是中國數據庫歷史上重大突破，也是中國基礎軟件行業首次進入Gartner魔力象限的全球領導者。從表面上看，這是一種從挑戰者到領導者之間的角色轉變。不過這種角色轉變的背後卻代表着中國技術正日益走向國際舞臺，並日漸成爲這個舞臺當中的佼佼者。就像Gartner分析師在報告中所說的那樣：“阿里雲擁有豐富的數據庫種類覆蓋度和完善的產品佈局，爲用戶提供了多種關係型、分析型和非關係型數據庫產品，還提供了混合雲環境部署，同時集成了備份、數據遷移與同步等能力，並且阿里雲有非常強大的技術實力與創新能力。”

也正是憑藉這種能力使得消費者在今年又度過了一個有着絲般順滑體驗的雙十一購物之夜。據統計，今年雙十一交易峯值是每秒58.3萬筆，每筆訂單背後包括商品、交易、支付、物流、評價等複雜的業務邏輯，，對於數據庫來講就變成了上億甚至更高的每秒事務處理能力。不過對於坐在電腦前的消費者來說，儘管瞬間產生了如此大規模的高併發流量，但選款、下單、付款的購物流程，仍然是一氣呵成，“如絲般潤滑”。

在阿里巴巴副總裁，阿里雲數據庫事業部負責人李飛飛看來，雙十一的場景特點就是數量大，併發高，瞬間對系統的要求非常極致，所以阿里巴巴主要通過雲原生架構的突破以及分佈式技術的應用，實現了資源池化，資源池化以後進一步實現存儲計算分離，這樣帶來的好處就是極致的彈性以及高可用，從而可以在短時間內快速的分配資源，然後滿足這種系統負載瞬間飆高的場景需求。

爲什麼要將一個個豎井變成相互貫通的“水池”

李飛飛表示，雲的本質就是利用虛擬化的技術將資源池化，從而進一步實現計算存儲分離和資源解耦。這就像以前家家戶戶打水井，每個水井都獨立的，但今天我們實際上是要把水井底部打通，形成一個暗的池塘，做到資源池化，從而提升資源的使用率。

這種技術優勢是傳統IT基礎設施當中計算存儲緊耦合和單一的分佈式架構所不能比擬的。因爲單一的分佈式的架構，在面對數據只讀、讀寫，甚至數據一致性等問題時，會變得越來越複雜，挑戰自然也會越來越多。而實現資源池化，並在這個基礎上做資源解耦，可以享受到極致彈性和高可用的性能。“在這個前提下，我們認爲在雲原生的時代，數據庫的設計和數據庫的理念都將發生本質性的變化。”李飛飛這樣講道。

作爲前沿技術的創新者和引領者，阿里巴巴自然不會坐失機遇。可以看到，阿里巴巴首次在行業內提出了雲原生分佈式數據庫的概念。對於雲原生分佈式數據庫，李飛飛表示，隨着企業業務全面向數字化、在線化、智能化演進，企業面臨着呈指數級遞增的海量存儲需求和挑戰，業務有更多的熱點和突發流量帶來的挑戰，而云原生分佈式數據庫帶來的四大特性，很好地解決了企業用戶的核心訴求。從資源池化到彈性擴展，再到智能運維，再到離在線一體化。利用這些核心的特性，數據庫也將全面的進入雲原生加分佈式的時代。

不僅如此，在雲原生數據庫層面，阿里巴巴還推出了核心的雲原生關係型數據庫 PolarDB 以及分佈式版 PolarDB-X ；在傳統的 OLAP 領域，推出了新一代雲原生數據倉庫 AnalyticDB以及雲原生數據湖分析 Data Lake Analytics；在NoSQL領域，推出了雲原生多模數據庫Lindorm和雲原生內存數據庫Tair。除此之外還構建了企業級數據庫生態工具產品體系，以及雲原生智能化數據庫管控平臺。

從管控平臺，到生態工具，再到具體領域的相應技術產品，在記者看來，阿里巴巴正在日益構建一個數據庫產品的閉環。對此，李飛飛認爲，通過豐富的數據庫產品體系來構建一個豐富的生態，能夠讓客戶在這個生態當中用數據庫的方法解決諸多數據處理、存儲分析、計算所面臨的挑戰和問題，這不僅是阿里巴巴的基本出發點，也是客戶學習曲線最低，應用成本最低的一種方案。

從離在線一體化訴求到數據庫大數據一體化技術趨勢

當記者問道，隨着阿里巴巴在行業內實踐的日漸深入，我們有沒有發現目前客戶呈現出的一些明顯的需求變化時，李飛飛着重強調了離在線一體化計算分析的訴求。在他看來，傳統的數據庫可能只做在線交易和在線分析，但客戶越來越希望通過一套系統能夠解決數據處理過程中整個鏈路的訴求。也就是說，不僅僅能做在線分析，最好也能做離線的複雜計算分析。

基於此，李飛飛提到了HTAP以及數據庫大數據一體化技術。HTAP技術能夠將在線事務處理和在線分析與計算合二爲一，數據庫大數據一體化技術將在線分析和離線計算合二爲一, 結合MPP和BSP技術，提供交互式分析和複雜離線ETL的一體化處理。從產品體系上，基於這種訴求和技術趨勢，阿里巴巴要爲客戶提供端到端的數據能力，包括生產、處理、存儲、計算分析等。

對此，李飛飛表示，這就要求我們不僅要具備豐富的產品體系，還要構建一個開放的合作生態。衆所周知，阿里巴巴在數據庫領域已經形成了從管控平臺，到生態工具，再到具體領域的相應技術產品的豐富體系。而對於構建開放的合作生態，李飛飛提到，數據庫系統發展已經將近40年，如果你想在這個賽道上另起爐竈，重新建立生態，這幾乎是不可能完成的事情。雖然這並不代表就不能做到自研自主可控，但是上面的使用習慣、使用語法一定要兼容現有的生態，這樣才能快速的融入現有的體系當中去，而不是把現有的體系全部徹底推翻，然後讓大家來適應你。

基於這種理解，如今阿里巴巴數據庫的核心產品PolarDB和AnalyticDB都在做兼容性的工作。比如說PolarDB100%兼入MySQL、100%兼容PostgreSQL，還有高度兼容Oracle的版本，AnalyticDB 高度兼容MySQL, 100%兼容PostgreSQL和Greenplum, 高度兼容Oracle和TeraData的版本。在李飛飛看來，所有的這些工作本質上就是爲了更好地服務現有的生態，融入現有的生態體系。到具體操作層面，首先從系統架構上，儘可能保障系統設計和現有的系統架構不要有太大的差異化。其次，雖然從架構上做了存儲計算分離，資源池化，但是除此之外，並不希望徹底的改變現有的這些架構，而是儘可能的讓內核能夠和現有的架構有一個比較好的融合。這樣一來，用戶從現有的生態體系遷移到阿里巴巴的數據庫上就不會有太大的挑戰。

最後，李飛飛表示，數據庫領域的核心發展方向是雲原生+分佈式，並由此帶來了幾個核心技術佈局：數據庫與大數據一體化、智能化、安全可信、軟硬件一體化、離在線一體化、多模數據處理。在這些方面，未來阿里雲數據庫將深度結合雲原生與分佈式，通過存儲計算分離等技術以及積極構建開放的融合生態，幫助用戶最大限度的實現資源池化、彈性變配、超高併發等能力，實現數據從生產、到處理、到存儲、再到分析計算的一體化體驗。

進入雲原生、分佈式的時代什麼纔是數據庫的正確打開方式

爲什麼要將一個個豎井變成相互貫通的“水池”

從離在線一體化訴求到數據庫大數據一體化技術趨勢

PolarDB-X 面向 HTAP 的 CBO 優化器

PolarDB-X 面向 HTAP 的混合執行器

如寶馬3系和5系：PolarDB-X 與 DRDS 並駕齊驅

PolarDB-X 存儲架構之“基於Paxos的最佳生產實踐”

PolarDB-X 私有協議：提升集羣的性能和穩定性

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

進入雲原生、分佈式的時代 什麼纔是數據庫的正確打開方式

爲什麼要將一個個豎井變成相互貫通的“水池”

從離在線一體化訴求到數據庫大數據一體化技術趨勢

進入雲原生、分佈式的時代什麼纔是數據庫的正確打開方式