數據庫PolarDB開源之路該如何走?聽聽他們怎麼說

簡介: 10月25日,由阿里雲開發者社區、阿里雲PolarDB開源社區、InfoQ聯合舉辦的「開源人說」數據庫PolarDB專場線下沙龍在杭州召開,5位阿里雲數據庫超級大咖、10位阿里雲數據庫開源生態夥伴嘉賓 、數十位業內資深開發者現場進行了深度交流、共話開源。

阿里巴巴集團副總裁、阿里雲數據庫事業部負責人李飛飛出席了沙龍並致開場辭:PolarDB 是阿里雲的明星產品,做出將PolarDB 開源的決策需要非常大的勇氣。將最核心的數據庫產品對外開源,且使用了最友好的協議,阿里雲是全球頭部雲廠商的第一家。作爲一家商業化公司,商業化一定是企業目標。但我們認爲商業化應該是企業的副產品,核心依然應是創造價值。當我們爲社會創造價值的時候,價值一定會在商業化上有所體現。

image.png

阿里巴巴集團副總裁、阿里雲數據庫事業部負責人李飛飛

 

生態的建設以及在多雲大趨勢下的開源對阿里雲將會產生極大的幫助,對於鞏固我們雲數據庫橋頭堡的位置意義非凡。只要主版本不分裂,這條道路一定會成功。我們希望與業界同仁攜手,將 PolarDB 開源社區做強做大,使PolarDB 不僅僅是阿里雲的標杆,也成爲全中國和全世界數據庫的標杆。

 

阿里雲數據庫開源負責人 、阿里雲數據庫資深技術專家王遠發表了就PolarDB開源現狀和未來規劃發表主旨演講。王遠指出,阿里雲在做開源 PolarDB 時堅持的第一原則是兼容數據庫的生態。PolarDB從開源的第一天起就以兼容生態爲目標,兼容生態不僅包含語法和 SQL 上的兼容,更重要的是體驗上的兼容。比如 PolarDB-XPolarDB for PostgreSQL都爲雲原生分佈式的數據庫,但這絕不意味着其在體驗上也會將分佈式的複雜度透傳給客戶。我們希望雲原生數據庫像單機版的數據庫一樣簡單易用、易於運維。

image.png

阿里雲數據庫開源負責人 、阿里雲數據庫資深技術專家 王遠

 

開源PolarDB的第二個原則是堅持完全的開放。開源PolarDB 最有特色之處在於它真正將自己雲上在運行的雲產品 100% 開源給客戶。阿里雲的海量客戶已經檢驗了PolarDB 產品的成熟度,因此我們開源出的 PolarDB 成熟可用的企業級產品,希望通過開源讓更多用戶、技術人員能夠享受到這項技術紅利並參與共建,推動雲上 PolarDB 技術的發展。同時,我們也希望更多的用戶和合作夥伴能夠向我們提出更多需求,推進 PolarDB 不斷向前演進。

 

唐成以《PolarDB在娃哈哈的使用》爲題進行分享。他分享到,娃哈哈已經使用PostgreSQL多年,使用了大量邏輯複製,且備庫僅提供一些業務的只讀服務。同時,其重要業務的數據庫運行在共享SAN存儲上。因此,它存在主備庫延遲較大、邏輯複製不穩定且延遲大的痛點。針對娃哈哈的特性以及痛點,我們選擇使用PolarDB替換其原有架構。

image.png

乘數科技創始人、PG中國社區常委 唐成

 

使用PolarDB後,其架構爲基於共享存儲的一個主節點和一個只讀節點,並配合PolarDB實現了CLup管理系統。數據庫運行在SAN共享存儲之上,使用CLup管理PolarDB。主節點出現問題後,數據庫可快速切換至只讀節點。後續,我們將會增加只讀節點,便於快速擴容。PolarDB 的另一優勢在於可以增加普通的備庫,相當於數據可存儲多份,保證了數據不丟。同時,將使用CLup對PolarDB進行定期備份。

 

韓毅以《基於開源PolarDB-X打造中正智能身份認證業務數據基座》爲題進行分享。他分享到,中正智能是全球領先的生物識別和身份認證公司之一,專注圖像處理和模式識別20年,目前,中正智能深耕於金融領域。隨着業務數據量的增加,客戶對業務可靠性的要求逐漸提升,對數據安全和存儲要求也愈發嚴苛。此外,我們還面臨着問題解決延遲以及國產改造的難題。我們對數據庫的選型就提出了四個要求:高可用、易維護、低成本、持續性。而PolarDB在以上幾個方面均具有顯著優勢。

image.png

中正智能科技有限公司平臺軟件部研發總監 韓毅

 

於是我們打造了基於開源PolarDB-X的多地分佈式數據基座解決方案。我們通過杭州的小型數據中心和深圳數據中心實現了兩地多活,底層則基於K8s容器打造。完成PolarDB改造後,我們的讀寫性能、存儲性能以及響應延遲等均得到了明顯提升。其中TPS性能提升55.8%,響應時間提升46.6%,業務可用性提升64.6%,使中正智能得到了客戶的充分認可,也在商業領域站穩了腳步。PolarDB的開源爲我們中小型企業的發展帶來了巨大收益,堪稱“國貨之光”。我們期待有更多優秀的“國貨”產品輸出,爲中小企業解困,在全世界支柱型中間件裏佔有一席之地。

 

image.png

主持人李若冰、韓毅、唐成、李飛飛、王敏堅、王遠(從左至右)

 

接下來,阿里雲開發者社區負責人李若冰作爲活動的主持人,邀請了阿里雲數據庫事業部負責人李飛飛、王遠,與乘數科技創始人、唐成、中正智能科技平臺軟件部研發總監韓毅、杭州朋越創始人王敏堅展開對話,討論“雲時代下的數據庫開源”

(以下爲圓桌討論實錄整理)

 

主持人:做出開源PolarDB決策時,阿里雲內部討論和爭議的焦點是什麼?

李飛飛:阿里雲是一家雲廠商,並非第三方數據庫廠商,且連續5年投入了鉅額資金和大量人力開發PolarDB,開源的決定必然引發爭議。因此,開源PolarDB的確需要承擔巨大風險。

但我認爲世界上所有的變化都是危機並存,四平八穩時確實沒有風險,但也不會有機會。外部世界存在錯綜複雜的變化,我們需要回歸初心,堅持價值創造。只要堅持價值創造,對社會有貢獻,最終不論是組織或是個體都會得到相應的回報。

 

主持人:PolarDB開源已有一年多,滿分10分,您爲自己打幾分?

王遠:我想爲開源的團隊打 9 分,開源社區的運營、夥伴的支持、研發團隊均表現出色,尤其是技術上的領先。爲自己打7分,我對開源PolarDB抱有更大的期望,它應該有更廣闊的空間。同時,我也希望研發團隊、用戶、開發者與合作伙伴能夠一起推動 PolarDB 更進一步,做貨真價實的國貨之光。

 

主持人:從外部看,不管對這款產品、對開源社區還是對生態合作伙伴,您會打幾分?

王敏堅: 8.5 分。我從2006年左右開始接觸PostgreSQL開源數據庫,也是國內最早一批佈道者。當時很多人不懂何爲開源,不明白開源是否等於免費,也不明白各種授權協議的細微差異,而這些知識的普及需要行業領袖或大廠展現出海納百川的胸襟,拿出壯士斷腕的氣魄才能完成,遠非小廠和個人能夠實現。

 

有這份氣魄和雄心,未來必定可以對接多雲、多種芯片,覆蓋IaaS層、DaaS層、PaaS層以及SaaS層,形成完整的生態和全棧的數據鏈路。但起步階段需要有大廠作爲領軍企業,扛起大旗。因此我由衷地佩服阿里雲開源PolarDB的勇氣,而這份勇氣正來自於它的底氣和自信。

 

唐成:我爲它打9分。開源是一個長跑項目,很多開源項目在開源幾個月後隨即式微,而PolarDB開源一年多以來,熱度不減,也證明了它的成功。此前,國內的公司開源行爲一直較少,多爲個人開源。而這幾年,國內的大企業承擔起了責任,大力推廣開源,引領思路的改變,也在努力踐行開源。我相信國內的開源生態會越來越蓬勃。

 

韓毅:我爲它打9.9分。作爲使用者,我看到也體會到了PolarDB的產品力。PolarDB產品開源後,中小企業能夠在短時間內使用它,這意味着它背後的運營團隊和產品團隊付出了巨大心血。

 

李飛飛:阿里雲數據團隊在PolarDB上有非常大的投入。而且PoalrDB是阿里雲研發了5年的產品,進行開源的確是非常艱難的決策。但現在回過頭看,這絕對是一個正確的決策。

 

開源的決策能夠讓更多夥伴與我們共建,打造全球最有活力的雲原生數據庫社區。這是一個全新的賽道,在雲原生數據庫領域、存儲計算分離領域,阿里雲處於最早開源的梯隊。而且是基於現有的、成熟的開源生態,更具先發優勢。

綜上,我爲PolarDB的開源打8分。我希望把今天作爲新的起點,加大市場投入,給予合作伙伴更強的信心。同時,我們也鄭重承諾,一定會持之以恆地在 PolarDB 的開源路上堅定地走下去。

 

主持人:阿里雲商業化產品和開源產品之間,各自的優勢是什麼?

李飛飛:如今,客戶與廠商之間的交互模式和商業模式有了本質的變化。商品不再只是商品,也成爲了載體,成爲一個可以交互的智能商店。PolarDB開源以後,它的周邊生態會越來越豐富,再伴隨着合作伙伴的發展,整個體系會真正變成亞馬遜雨林一般龐大。這其中細水長流的發展和互相成就遠比單純的交易來得更有價值,也讓我們對更豐富的雲上商業形態有了期待。

近日,PolarDB上線了天翼雲心選市場,我們期待在不久的將來,PolarDB真正成爲天翼雲的一方產品。與此同時,我們與移動雲的合作也正在推進。而這類合作的促成正式得益於PolarDB的開源,PolarDB的開源爲我們帶來全新的商業模式。

 

主持人:敏堅總作爲開源最早一批佈道者,如何看待這樣的商業模式?

王敏堅:我非常認可這樣的商業模式。早年我曾參加過一些在線平臺的運營,希望能夠實現SaaS模式。但一直以來,國內極少有公司在SaaS模式上取得成功,其主要原因在於流量寡頭的壟斷。開源界也存在流量寡頭效應,因此,品牌巨頭早做開源對於企業本身的發展必然有巨大裨益,因其本身天然具備品牌實力和技術實力。從商業生態上來說,只要有足夠多的用戶,實現全新的商業模式只是時間問題。

 

電視機尚且可以從最初的黑白電視變爲現在擁有訂閱等交互功能的智能商店,富有魅力的雲原生數據庫更加毋庸置疑。它可以做運維的生態、監控的生態、複製的生態、遷移的生態、BI 報表生態等等,各種生態百花齊放、百家爭鳴,只要有用戶,豐富的生態必將水到渠成。

 

主持人:作爲生態合作伙伴,商業模式的跑通對於您來說同等重要。唐總您怎麼看待這種商業模式?

唐成:大量客戶希望使用更輕量級、更靈活的方式,同時很多客戶因爲各種原因沒有辦法上公有云,因此,傳統的商業模式已經不適用。國外將很多開源產品做成了生態,比如數據庫插件生態,但該模式在國內尚且較爲落後。

 

落後的原因除了技術方面的限制,也包括商業邏輯。傳統的覆蓋用戶的方式需要投入大量推廣成本,而開源也是吸引用戶的另一渠道。開源後,隨着社區影響力的擴大,將會吸引更多客戶。有了客戶之後,商業模式也將越來越豐富,比如訂閱服務、遠程服務,最終變爲可持續發展的模式。

 

主持人:請問王總,PolarDB 開源從運營、市場、產品、服務、機制上還要需要再做哪些準備,才能更好地推進新的商業模式的展開?

王遠:我認爲開源和商業模式之間相輔相成,並不衝突,開源是現代的、走向市場的手段。當前,創業趨勢非常明顯,很多小公司需要基礎設施和基礎軟件的支撐。

 

小公司做選型,第一步是快速獲得信息,比如要能夠通過開源、互聯網或社交媒體獲取到產品信息。第二步,快速體驗、驗證。而如果此時面對的是商業化產品,則意味着需要投入資金,對於很多小公司而言也將成爲一個難以跨越的門檻。第三步,與業務捆綁、做驗證。很多創業公司的業務具有創新性,對產品的開放性考慮較多,比如能否在產品里加上自己的特性或與自研的軟件系統做結合?而開源的產品很好地滿足了此類訴求。隨着創業公司的成長,產品的可擴展性、可用性能否滿足高併發等訴求也變得尤爲重要。

 

開源產品對於創業公司的一大吸引力在於它提供了自服務的能力。只要其文檔體系足夠好,能夠讓用戶快速找到需要的信息,用戶即可輕鬆根據自己的需求對產品進行擴展。

 

我認爲PolarDB開源社區後續的發展需要堅持幾個原則:第一,傳播力足夠廣,只有更多人使用才能讓數據庫更好地發展。好的數據庫不是研發出來的,而是用出來的,應該與夥伴共同成長。第二,保證產品的易用性,能夠讓用戶快速驗證觀點。第三,文檔體系足夠完善,開源社區的技術支持足夠強大,社區和各種羣足夠活躍度,答疑解決問題的渠道足夠暢通,增強用戶在使用開源 PolarDB時的信心。

 

主持人:韓總作爲PolarDB的客戶,在最初決定使用PolarDB時,企業內部是否存在爭議?爭議焦點是什麼?

韓毅:數據庫產品是三大中間件裏非常底層的一部分,其遷移難點不僅在於需要克服技術問題,還需要改變客戶的使用習慣。此外,已經穩定的產品切換新的數據庫,也必然存在一定的風險和成本。但恰逢彼時我們面臨着業務上的瓶頸,既然不得不跨出這一步,那麼宜早不宜遲。第二,PolarDB開源一年以來,其性能得到了大量客戶的驗證,確定了它在市場上的生命力和產品力。再者,從開源PolarDB的技術架構也可以看出,它絕對是數據庫的未來。而我們也認爲,跟着未走纔有希望,最終決定使用PolarDB打造企業的下一代業務產品。

 

主持人:未來,數據庫的技術發展趨勢是什麼?

王遠:作爲一個IT從業者,我認爲雲計算是未來的發展。其次,未來的 IT基礎設施會向雲計算轉型,因此數據庫的未來是雲原生。

 

從數據庫的歷史可以看到,從單機版發展到分佈式再到雲,數據庫架構的變遷、內核技術的變遷與部署環境息息相關。比如BufferPool的管理、刷髒技術都是基於單機版內存、 CPU 和硬盤速度不匹配而衍生出來的技術。但到了雲上,資源池化、資源解耦,計算資源、網絡資源和存儲資源之間的關係均已發生變化。在變化的大趨勢下,數據庫技術要長遠發展,也必須要有相應的變遷。

 

因此我認爲雲原生數據庫技術是一個大的方向,如何讓數據庫跟着雲化的基礎設施架構方向演進,是落地雲原生數據庫過程中需要思考的問題。

 

王敏堅:從傳統的線下或者私有云角度來看,我認爲未來的數據庫應該既可以做 scale in 也可以做 scale out 。傳統的 scale up時代已經落幕。IBM 能穩定發展多年的原因在於它的低故障率和不重啓,而Linux的 PC 機會存在一些單點故障。因此,我們依然需要持續探索高可用。

 

我們期待能夠將異構的算力比如 AI 的算力、非結構化的算力等通過網絡的總線連接,真正分佈在不同的雲上。

 

存儲方面,PolarDB的能力可以很好地滿足實際業務的需求,可以輕鬆擴縮容,可以隨着客戶業務量的增長無縫擴張,可以增加節點,使得線下部署更方便,使用固體驗類似於超算的可插拔模式。目前我們正在嘗試實現最小業務單元,一共包含4個節點,其中3個節點是PolarDB for PG 版本,一個節點做 monitoring system 再做 web GUI 的管理,通過可插拔模式提供便捷的使用體驗。它具有很低的功耗,同時能夠提供合適的算力。

 

未來,該模式也可從私有云無縫遷移到公有云。

 

李飛飛:我認爲數據庫未來3-5年的發展可以總結爲四化。

首先,雲原生化,雲原生化存儲計算分離以後,還會實現三層解耦,存儲、內存、計算分離,然後做 Serverless ,從資源視角向能力視角演進。

第二,平臺化。除了數據庫之外,客戶的實際使用場景並不一定適合上公共雲。平臺化意味着不僅要提供數據庫的讀寫能力、高可用能力等,還需要將其他細碎、複雜的“髒活”進行封裝,提供端到端的一站式數據服務,而不是單體的數據庫。

第三,一體化。一體化包含處理分析一體化(HTAP)、分佈集中一體化(平滑地 scale in 、scale out)、離線在線一體化。用戶希望能夠儘量模糊離線和在線的邊界,不希望有多個業務煙囪,不希望有多個數據孤島,不希望做數據遷移,希望獲得更好的體驗。

第四,智能化。數據庫必須好用、易用、運維簡單,能夠進行問題的智能診斷,比如結合 ML 、AI 機器學習的技術做慢SQL治理、索引推薦、問題的診斷髮現、對數據的深度挖掘,比如數據可以可以在數據庫做一些簡單的建模,將一些業務場景下推至數據庫層直接實現。

 

主持人:作爲生態合作伙伴,您期待與阿里雲經歷 5 年共創之後,會有什麼樣的成果?

唐總:開源數據庫的發展是一段長征。我認爲能夠一直存活下去的數據庫必然是一個全棧式數據庫,能夠覆蓋更多業務場景。

Oracle同期的數據庫有InformixDB2,而只有它存活下來的原因在於它是當時的全棧數據庫,既可以做數倉,也可以做TP。但伴隨着雲時代的到來,其技術棧和過重的數據庫底層導致它需要付出更多努力方能追上新的技術發展。而開源產品天然具備轉身的優勢,且能夠覆蓋物聯網、TPAP等方方面面。

另外,想要獲得更多使用場景,還需出色的易用性,降低新人的學習和使用門檻。

 

主持人:韓總作爲客戶,您期待什麼樣的數據庫?

韓毅:我希望通過五年的發展,真正將PolarDB生態做成亞馬遜雨林,所有人都能共贏。頭部企業提供完善的產品性能,實現商業化的最高價值,得到市場;合作伙伴參與共創,在細分市場分一杯羹,得到利潤;普通用戶以極低的成本使用優質的產品,得到實惠。

 

李飛飛:近日,Oracle Cloud大會發布了 Oracle 23c——Converged Database 即全棧數據庫。它新增了對 JSON 的支持,增強了 analytics workload,加強了對 machine learning workload 的支持。Oracle 已經不僅僅是一個數據庫,更是一個敏捷、便捷的一站式數據服務,這與阿里雲數據庫去年提出概念本質上一致。

 

而且 Oracle通過一站式數據服務往下帶動了它的雲。AWS 的發展模式爲從IaaS、PaaS層逐級往上發展,而微軟從它的企業級軟件入手,從上往下帶動雲的發展。Oracle 開闢了第三條道路,從企業的大 B 數據入手,帶動雲基礎設施,它的未來發展值得關注。Oracle 已經不再只是一家數據庫公司,它正在往數據雲的方向快速發展。

 

阿里雲數據庫也需要新陳代謝,需要有年輕的人執掌這艘大船。如果最終PolarDB的生態發展成爲亞馬遜雨林,我相信也一定會有更優秀的人帶領大家,給予大家信心和勇氣,中國的數據庫也必將站在世界之巔。

 

主持人:用一句話送給5年後的中國數據庫或送給 PolarDB。

王遠:希望5年後我依然深耕於PolarDB,也希望有更多的從業者、用戶、開發者和合作夥伴一起共創。

王敏堅:Oracle作爲曾經的巨頭,如今依然在不斷地革新。我們也必須一直保持進步,希望通過國內同仁的不斷努力,5年以後,我們能擁有真正本土的、原創的 PolarDB。

唐成:希望五年之後的PolarDB 能夠在全棧式數據庫裏佔有一席之地。

韓毅:未來 5 年甚至50 年,希望我們能成爲PolarDB 最忠實的用戶。

李飛飛:只要有不斷探索、不斷進取的精神,五年後的PolarDB 一定可以真正成爲國貨之光,甚至成爲世界數據庫之光。

image.png

PolarDB開源生態運營負責人、高級產品專家周正中

 

圓桌結束後,PolarDB開源生態運營負責人、高級產品專家周正中(花名德歌)發佈了《PolarDB開源社區傳播大使招募計劃》。他指出,PolarDB開源社區擁有大循環的生態。開源產品加上生態夥伴合力爲用戶提供價值。有了用戶之後,會形成巨大的開放式市場。有了市場便會有全棧人才的出現,包括開發者、諮詢專家、頂級用戶等,可以反哺市場、反哺用戶。PolarDB開源社區的運營也圍繞着上述循環來進行。PolarDB的傳播大使將需要參與組織PolarDB開源社區互動、平臺推廣和內容策劃及產出。與此同時,傳播大使也將獲得豐厚的參與權益,比如活動優先參與權、周邊禮品、評獎優先參與權以及開源人脈。希望所有用戶、開發者、合作伙伴發現機會,抓住機會,成爲PolarDB的傳播大使。

 

大家可登陸PolarDB開源官網進行報名:

PolarDB-X開源官網:https://www.polardbx.com/home

PolarDB for PostgreSQL開源官網:https://www.polardbpg.com/home

原文鏈接:https://click.aliyun.com/m/1000363662/
本文爲阿里雲原創內容,未經允許不得轉載。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章