企業需要什麼樣的數據庫,One Size Fits All?

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"想象一個日常場景:你在海底撈上排了號、點了餐、退了菜、結了賬,踏出店門就收到了手機上友邦 APP 推送的健康課程,邊看邊走到了路邊等車。不一會兒,你叫的新能源網約車來了,下車後順手給了司機一個五星好評。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"這是很多人都習以爲常的場景。但如果把時間拉回到 10 年前,同樣的流程不會那麼順滑,很多如今在手機上輕點手指就能完成的操作也無法實現。宏觀上講,是互聯網的飛速發展帶來了這些變化,但是如果我們把視角推到互聯網底層技術的變革上,就會看到密密麻麻飛速流轉的數據與代碼。互聯網時代,指數級增長的數據被存儲、分析和調用,背後是 40 年來數據庫作爲底層技術的支持。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"數據庫發展史上出現過層次數據庫、網狀數據庫和關係型數據庫,如今業內主流是關係型數據庫。從早期的結構化數據到數據倉庫,再到如今的雲數據庫,面對雲時代海量的數據,企業對數據庫性能的要求越來越高。作爲國內基礎軟件領域首次也是唯一進入 Gartner 全球數據庫領導者象限的阿里雲數據庫產品事業部負責人,李飛飛曾談到“讓數據真正地無縫流動”是他對數據庫的願景。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"阿里雲也推出了面向不同數據類型的雲數據庫。在企業級數據庫賽道上,阿里雲已經推出了雲原生數據庫家族,PolarDB、PolarDB-X、AnalyticDB、Lindorm 等。雲原生數據庫究竟爲企業帶來了怎樣的改變,又在業務場景中將迎來哪些新要求?《數據 Cool 談》第二期,讓我們與友邦人壽、海底撈和上海新能源汽車數據中心的資深專家一起一探究竟。"}]},{"type":"heading","attrs":{"align":null,"level":1},"content":[{"type":"text","text":"不再擔心業務洪峯"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"按需付費、按需擴展、高可用性以及存儲計算分離……是雲數據庫的優勢,也是以 PolarDB 爲代表的雲原生數據庫正在做的事情。優於傳統數據庫的性能,讓 PolarDB 獲得了友邦人壽和海底撈的青睞。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"保險行業也有類似“雙 11”這樣的業務高峯期,是保險公司一年一度衝刺業績的重要時段。保險業務團隊集中籤單,做“後勤保障”的技術人員也神經緊繃。友邦人壽對 PolarDB 的高度認可,也源於一次業務高峯期。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"“因爲我們之前用 RDS 遇到了切數據、擴容的問題,我們擔心如果業務量出現了爆發式的增長,RDS 沒辦法快速地擴容支持這個事情。”友邦人壽雲計算架構師羅林強談道,“大家去賭一賭業務洪峯沒那麼高,碰碰運氣,還是說頂着變更可能會造成故障的風險把 RDS 替換掉。在業務高峯期前這麼做,風險還是蠻大的。管理層非常重視業務高峯期期間的系統穩定性。”"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"同樣的業務洪峯,不只在保險行業出現。電商行業中 2015 年淘寶大部分業務都開始在阿里雲上穩定運行;交通物流行業中 12306 網站將春運高峯的 75% 餘票查詢業務切換到了阿里雲上。能穩定支持淘寶“雙 11”和鐵路春運的業務高峯,讓阿里雲數據庫在業內站住了腳,同時也帶來了友邦人壽的信任。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"友邦人壽的數據庫在 2015 年之前遇到了一些瓶頸。傳統的 IDC 之下,數據庫出現了 CPU 性能問題,但由於自身管控能力不足,在 CPU 佔用率飆高時,當時沒有配套的監控及時查明原因。“除了開單給供應商或者重啓數據庫,什麼也做不了。”羅林強無奈地談到當時的情景。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"重啓數據庫治標不治本,在業務洪峯期,重啓並不能帶來數據庫性能的本質性改變。友邦人壽開始嘗試將銷售一年期小額保單的電商系統遷移到阿里雲上。“電商系統偶爾有贈險活動,會出現流量峯值,但影響不大。”羅林強談道。這次遷移算是友邦人壽的一次試水。直到 2016 年,電商系統在阿里雲數據庫的支持下始終穩定運行,進一步加強了友邦人壽的信心。2017 年,友邦人壽決定將公司戰略性項目健康友行 APP(現名友邦友享)遷移上雲。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"當時,客戶熱情超出了業務預估,導致友邦人壽使用的 RDS 不斷的擴容,擴容需要時間。由於 RDS 計算資源不足,所需算力更大,數據搬運時間變長。每日幾十萬的查詢量,爲友邦人壽在用的 RDS 帶來了不小的壓力。羅林強談到,友邦人壽將健康友行 APP 的數據庫遷移到了 PolarDB 上,這些問題才迎刃而解。他表示,PolarDB 一寫多讀的能力,相較 RDS 主備模式,更加靈活也更加省錢,在後期想要單獨調用數據讀取查詢時,讀寫分離功能也能實現對應用的非侵入。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"RDS 在友邦人壽業務上的侷限性同樣也在海底撈有所體現。餐飲行業具備就餐高峯時間集中的特徵,高峯期的排號、點餐等場景都要求數據庫有高併發和彈性的能力,維持業務穩定性。作爲國內餐飲行業三巨頭之一的海底撈,在全國有近 8500 萬會員,在全球開店,部分門店實行 24h 運營,對數據庫有高穩定性、同城容災備份、快速高可用切換的訴求。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"海底撈技術 Leader 張坤透露,爲了實現會員管理、運營和營銷,發起了海底撈史上最大的 IT 項目——海底撈 APP,數據量級在 10 億左右。因此,海底撈對底層數據存儲的訴求有三點:"},{"type":"text","marks":[{"type":"strong"}],"text":"十億級數據靈活多維度查詢;降低研發上手和使用成本;運維簡單,有非常好的擴展能力。"},{"type":"text","text":"如今海底撈 APP 在交互類數據庫選型上主要考慮兩點:深挖會員需求,提高會員滿意度;豐富技術能力,支持業務拓展。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"在考察了業內的雲數據庫產品後,海底撈認爲無論從場景還是生態上還是在技術能力上,PolarDB 與業務訴求更加契合。“問題出現就要解決問題,現在我們正逐步把更多的系統、數據庫都遷移到 PolarDB 上。”張坤談道,“海底撈還將 PolarDB 全球數據庫 GDN(Global Database Network),用在全球官網上,通過在管理後臺發佈相關的內容,即可同步到其他區域,實現跨國、跨城市數據實時同步。”"}]},{"type":"heading","attrs":{"align":null,"level":1},"content":[{"type":"text","text":"不再擔心數據繁雜"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Lindorm 是阿里雲數據庫推出的專門爲物聯網 AIoT 打造的雲原生多模數據庫,核心特點就是提供大規模、多模異構數據存儲的雲原生數據庫服務,讓數據看得見、存得起。這與上海新能源汽車數據中心業務層面對數據庫的訴求不謀而合。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"上海市新能源汽車公共數據採集與監測研究中心技術總監王成名介紹,上汽新能源汽車數據中心接入了 58.9 萬輛車的數據,每一輛車包含 128 項靜態和動態的數據項,還有類似結構化的電池溯源數據和類時序數據庫的氫能源汽車數據平臺等。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"可以看到,上汽新能源數據中心的數據包括:新能源汽車的數據,電車溯源的數據,燃料企業及加氫站的數據和智能網聯汽車數據,數據類型有結構化、半結構化以及流媒體二進制的數據。數據類型多樣,數據量巨大。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"2014 年到 2019 年,上汽新能源一直基於開源 Hadoop 體系自研開源,但是很快發現,相較於將大量精力放在技術底層運維上,更應該將精力放在業務分析和技術開發上。橫向對比了市面上的多家雲廠商後,王成名談到,海量數據需要存儲分層,實時數據需要實時歸檔,冷熱數據需要一體化存儲,系統需要大規模運維,這些都是當時技術選型的訴求,恰好 Lindorm 提供了這樣的解決方案,所以上海新能源汽車數據中心成爲了 Lindorm 的第一批用戶。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Lindorm 可以支持不同類型的數據類型,比如寬表、文件、時序等。存儲方面,Lindorm 提供了容量和性能兩種選擇,也恰恰是上汽新能源汽車中心對數據庫的綜合選擇標準。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"“我們在使用 Lindorm 之前是自研的模式去做,用線下 IDC 和開源的 Hadoop 體系裏面的一個組件。由於我們是多技術架構融合的架構,帶來的問題就是運維成本很高,開源性能也有侷限性,比如默認壓縮,查詢性能限制。我們發現運維能力和數據性能也不夠,所以就用了 Lindorm。用下來發現,從數據入口上統一了入口,多模也降低了技術使用成本。不僅在技術成本上降低了,經濟成本也降低了。”王成名談道,“我可以把它以 API 的方式去兼容那些典型的業務處理場景。數據庫發展從單體到分佈式,再到多模,降低了技術人員開發門檻,成本降低了。”"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"如今,上海新能源汽車數據中心希望 Lindorm 可以通過技術手段挖掘分析越來越複雜的流媒體數據,目前來看,通過特徵提取後結構化建模和湖倉一體化或許是兩種可行的解決方案。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"“解決問題,降低成本”是雲數據庫被選擇的堅定理由,但是雲數據庫爲企業帶來的改變不止於此。“其實上雲不只是增加了我們的彈性的能力和穩定性,而是能夠讓我們有機會離開 IDC 到一個新的環境裏,思考重新架構應用。我們現在還沒有做到架構重構,但是我們在往那個方向走。” 王成名談道。"}]},{"type":"heading","attrs":{"align":null,"level":1},"content":[{"type":"text","text":"寫在最後"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"雲時代下,大數據和數據庫的技術邊界、離在線數據處理的技術邊界越來越模糊。企業對於雲數據庫的訴求,不僅僅在於支持現有業務的運行,還希望做到上層應用無感知的穩定。彈性擴容、安全穩定、多寫多讀、容災備份、雲原生多模、存儲計算分離……這些是如今企業需要的數據庫能力。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"可以看到的是,結合雲原生,數據庫從時序數據向多模數據演進,加強對半結構化、非結構化等數據類型的實時處理、融合處理能力,提供一站式的數據管理與服務,把傳統的 OLTP、OLAP、MPP 數據庫打通,將是數據庫廠商在技術上深耕的方向。"}]},{"type":"horizontalrule"},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"觀看本期《數據Cool談》,請戳"},{"type":"link","attrs":{"href":"https:\/\/www.infoq.cn\/video\/CJ1xAaihr7MZG1V4SqxD?utm_source=home_video&utm_medium=video","title":"xxx","type":null},"content":[{"type":"text","text":"https:\/\/www.infoq.cn\/video\/CJ1xAaihr7MZG1V4SqxD?utm_source=home_video&utm_medium=video"}]}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"數據庫尋路,開源有態度,回顧第一期《數據Cool談》,請戳"},{"type":"link","attrs":{"href":"https:\/\/www.infoq.cn\/video\/wg7VNmeKXjS4PzMgDwRS?utm_source=home_video&utm_medium=video","title":"xxx","type":null},"content":[{"type":"text","text":"https:\/\/www.infoq.cn\/video\/wg7VNmeKXjS4PzMgDwRS?utm_source=home_video&utm_medium=video"}]}]}]}
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章