大廠都咋用平臺、分佈式緩存?起碼你要懂技術,高級還得懂業務

image
所有程序猿都對那緩存並不陌生,好似那風一樣的女子只爲你獨自而舞。只見那回眸一笑百媚生,讓你甚是吝惜,惹人憐愛。

但隨着項目規模不斷增大變強,光是單個緩存就難以招架,優而顯得力不從心。

這時伴隨着多級緩存得化繭成蝶,平臺級緩存和分佈式緩存在應用上就都相輔相成。

但一山難容二虎,往往存有3大問題——①概念難以區分②我到底應該選擇誰③各自適用於什麼場景

如果這個沒弄明白,我怕是覺得你還不大行額。

本篇我將已老生常談的態度來爲大家一一揭曉,同時掌握方案與場景,設計技術選型的原理。包括一線大廠在本章節可能涉及的常考點
image

何爲平臺級緩存與分佈式緩存?

平臺級緩存是指你所選擇編程語言下的緩存技術類型

它是在語言的前提條件下,來採用的緩存技術,也就是你用什麼語言,就採用它存在的緩存技術。

緩存是工具,供編程語言調用。前者爲後者服務,得有一個主次的關係。
所以有時 你要控制你自己呀,別給自己飆車的速度,不然翻車了你都不知道

在這裏插入圖片描述

比如:
你在淘寶開了個新店鋪,這時你需要對你的店鋪進行裝飾打扮,那就需要使用淘寶這個平臺上提供的功能來進行裝飾。
像上傳商品配圖、店鋪佈局風格等。
換句話說平臺級緩存是依附於平臺的特性而決定的。


上篇也提到在不同的編程語言下,平臺級緩存也不相同,比如:

  • PHP裏面Smarty模板庫
  • Java中如Ehcache,Cacheonix,Voldemort,JBoss Cache,OSCache等等。

而且按照應用層的定義來看,平臺級緩存可根據進程執行使用的方式劃分爲進程內緩存和進程外緩存。

那什麼是進程內、進程外緩存呢?

  • 進程內緩存

就是緩存數據存在於所屬應用進程之內,和應用業務代碼、變量、堆棧等類型共同享受應用進程的內存資源。 緩存就是在進程內中的數據段進行站位。

或者說原來你1人住1房間,現在你和別人一起住。
在這裏插入圖片描述

  • 進程外緩存

指緩存數據存儲的地方不在使用應用內,而是外部的其它進程來存儲。比如像:Redis、memcache之類。
在這裏插入圖片描述

那如果緩存以文件形式保持咋辦呀? 也算應用進程外?
放心,我乃吒吒輝,而不是渣渣輝。呸,渣男

因大多數緩存都是在內存裏面來進行操作,所以常常會忽視以文件形式來保存的數據文件。像這種情況它還是平臺級緩存下的進程內緩存,不是進程外緩存。

因爲這個文件的緩存是服務於應用進程,而你像Redis那種角色,它是獨立的進程,進程和進程本身是有隔離的,而且它們還是不同軟件的進程,就更沒得啥關係。

而且文件緩存裏面的內容都是提前把邏輯處理的數據存入進取。當使用時,就可以減少重複的讀取、計算數據的動作從而來達到緩存的效果。

那如果我把Redis獨立部署到其它服務器裏面,也是進程外緩存嗎?

image

這樣的情況它就是了,上面提到進程外緩存是相對應用進程而言的,現在它們存在於不同的服務器。如果是在同一臺服務器裏面部署。那也算進程外緩存,因爲進程是隔離的,但一般Redis部署到其它服務器我們不會這樣稱呼

那它這叫啥呢?

這種情況稱分佈式緩存,常說的分佈式緩存就是這種形式存在於世。

分佈式緩存也很好理解,首先看分佈式,它表示把不同的軟件分別部署在不同的服務器上或者同一服務器上不同的軟件服務。

注:這裏【分佈式緩存】是個相對概念,如果按分佈式概念看,一臺服務器上部署了PHP|JAVA和Redis。它們之間的關係也算分佈式。
但我們現在是從進程內外緩存的概念劃分。這樣一看,它就不屬於分佈式緩存了。大家知道統一的說法即可

哎呀,累死個人,吒男能這樣,面面俱到?有點繞,你老慢着點,細細品味

image

爲何使用平臺級與分佈式緩存?

無論什麼類型的緩存,使用它們的根本目標就是減少數據的邏輯運算,加快請求響應,進而提高網站的QPS。 只不過體現的地方是不一樣的罷了。

那平臺級和分佈式緩存都有神馬好處?

平臺級

優點:

  • 時延更低,能夠節省內網帶寬

平臺級緩存,由於數據不需要跨網絡傳輸,直接在本地內存中操作。故性能好,時延低,消耗的帶寬也較少。

  • 不需要引入第三方類庫,開箱即用

一般平臺級緩存,都會有官方提供的相關操作類庫,並不需要引入第三方的類庫,降低了業務開發的關聯。

缺點:

  • 存儲容量有限,無法進行大數據存儲

由於內存佔用了應用進程的內存空間,如 Java 進程的 JVM 內存空間,故不能進行大數據量的數據存儲。

  • 微服務架構中,集羣部署數據的更新問題。

平臺緩存數據存儲於應用進程內,故無法被其他應用進程訪問,在集羣部署中同一緩存數據需要部署多份。

如果對應數據庫的數據,存在更新動作,則需要同步更新到不同部署節點的本地緩存,這樣才能保證數據一致性。這時複雜度較高並且容易出錯。

可以採用如基於 Redis 的發佈訂閱機制來同步更新各個部署節點或者中間件進行異步數據更新。

  • 數據隨應用進程的重啓或崩潰而丟失

平臺緩存數據是存儲在應用進程的內存空間,所以當應用進程重啓時,緩存數據也會丟失。所以對於需要持久化的數據,要注意及時保存,否則可能會造成數據丟失。

分佈式緩存

優點:

  • 性能、存儲容量無上限,理論上可做到無限擴充

雖然本地緩存快,但終究在單機上,資源性能都有上限。

而分佈式緩存是獨立部署的進程,自身擁有獨立的內存空間,不會受到應用進程重啓的影響,同時硬件資源也是獨享。

如果一臺機器性能不夠,就可以採用集羣的方式拓展,做到線性的擴容。在配合docker容器,瞬間 beautiful

  • 數據集中存儲,保證數據一致性,也做到了業務上的解耦

image
雖然緩存是以分佈式的方式存儲,但部署模式會採用集羣來保證高可用。

這樣所有的緩存數據都維護在緩存集羣當中,故不存在像本地緩存數據更新的問題,也保證了不同節點應用進程的數據一致性問題。

以前緩存和業務是在一起使用,現在業務和緩存剝離開來,互不影響,從而做到了業務上的拆分。

  • 數據從業務上做讀寫分離,保證網站高性能,高可用

分佈式緩存一般支持數據副本機制,從業務上課實現讀寫分離,故可以解決高併發場景中併發讀寫性能問題。

由於在多個緩存節點也冗餘了數據,提高了緩存數據的可用性,避免某個緩存節點宕機導致數據不可用問題。

那什麼是讀寫分離?

讀寫分離是指把網站中用戶請求,按照讀、寫請求進行劃分。常常需要配合MySQL主從,主庫針對用戶寫請求,從庫針對用戶讀請求。

如果不做讀寫分離那麼請求都會走一臺機器。所以讀寫分離在一定程度上也做到了負載均衡,還可以針對單一類型的請求來做到專治。
image

比如:主庫針對寫請求,那可以省去索引的創建,而從庫針對讀請求,需要索引來處理。這樣就可以根據請求類型來選擇是否使用索引。

畢竟索引維護也是需要消耗資源的。誰讓咋的心眼兒細呢?不小心看到了

原來讀寫分離就是這樣的啊,那我知道了

這個,其實這裏小吒只是拋轉引玉了下,但大致意思都差不多,根本就是把讀寫請求分開,然後進行專治。

又比如:針對網站架構時,也可以採用讀寫分離的機制來部署網站子系統,針對搜索的業務,可以完全獨立部署search_product.com。由它來提供搜索頁面。

再來比如:針對要提高業務的處理能力,咱們緩存的主從架構照樣可配合讀寫分離,加速網站的處理。

還來比如:針對訪問量過高,可以通過讀寫隊列來進行流量消費和異步批量寫機制,來提高網站的處理能力和寫負載過高等問題。
等等還有其它的,但大家要明白讀寫分離的作用,而且有時候它還會配合業務進行調整的。

你TM吒吒輝有完沒完了,一口氣說完不行了,我這個暴脾氣給你慣得。

在這裏插入圖片描述

缺點:

  • 運維和部署上成本高

由於是分佈式部署方式,部署、運維起來還是比較有技術難度,因爲每臺服務器的運行情況你肯定都要知道,外加線上環境的不確定因素。直接頭大

但方案能抗住大流量,方案還是可取,同時基於Docker在部署上也會減輕很多壓力。 橫豎你都佔一樣嘛,不然咋個辦呢?

  • 技術結構複雜,需要考慮緩存雪崩、擊穿等問題

在這裏插入圖片描述

分佈式緩存中的數據量肯定不少,對業務方來說需要,考慮緩存的擊穿、雪崩、穿透等問題,防止意外情況下請求直接打到數據庫造成數據庫崩潰的問題。

  • 數據跨網絡傳輸,性能低於本地緩存

分佈式緩存部署一般都是與應用進程位於不同的機器,故需要通過外網來進行網絡數據傳輸,相對於平臺緩存的進程內部數據讀取操作,性能會較低。

平臺級與分佈式緩存的技術選項?

每個技術都會有自己的立場,在什麼情況來選擇用什麼樣的技術內容。還是得根據你項目需求情況來進行選擇

  • 看速度?選平臺級緩存

平臺緩存的優勢就是處於應用進程內部,離程序是最近的。如果某部分數據不大,但是訪問量比較高,直接使用它來做處理。 簡直是省心有省力氣,在加上AOP切面編程,簡直舒服的不要不要的。

例如:

如果想首頁、活動頁裏面的展示一些統計或推薦的信息。有了它就不用每次都去調用相同API來進行運算操作,只要記得定時更新平臺緩存即可。

在這裏插入圖片描述

  • 看數據量?選分佈式緩存

平臺緩存受限於應用進程方,存儲有限,在大流量、海量數據的規模情況下,肯定選擇分佈式緩存,基於水平擴容、讀寫分離來滿足業務場景、數據存儲、性能需求等。

  • 綜合來看,有規模選分佈式緩存,規模一般選擇進程外緩存。規模小你老看着辦?

網站上到大規模,你分佈式那都跑不脫。
爲了滿足高可用、高可靠機制,一般都會採用分佈式集羣的方式部署,這樣一個業務,會有多臺機器來提供服務,就算掛了一個主機,還有其它的頂上來。

那選擇平臺級緩存有何問題?

  • 如果多機器採用平臺緩存,那緩存就有多份,一旦數據變更,就需要通知到多個上游服務方來更新數據。
  • 微服務模式下,一個頁面模塊的展示數據,在調用一個服務時可能需要拿到多個服務的數據聚合之後,才能最後返回給客戶端展示。

這樣一個服務的數據發生變化就需要通知到剛開始調的服務來更新緩存,業務上就耦合起來,而且還加入了很多附加工作,嚴重影響性能。

  • 數據的一致性問題,一個服務更新,如果網絡有延遲或意外,導致更新的請求失敗,那麼數據庫和緩存的數據就存在不一致。

總結

  • 網站規模建議採用分佈式緩存,因爲業務方和緩存就不需要在業務上耦合,後期架構調整和維護都比較輕鬆。

  • 場景上選什麼還是得根據業務需求和架構設計來綜合考慮,個人不大推薦平臺緩存,業務職責更加清晰些,可能更好些。

思考題

  1. 什麼是分佈式緩存?你用什麼來做?什麼條件下使用它?
  2. 平臺級緩存你常用哪種?平臺級和分佈式緩存存在什麼優缺點?
  3. 平臺級和分佈式分別適合什麼場景?
  4. 什麼是讀寫分離?你有那些應用

如果感覺文章有幫助的話,求再看、求關注、求分享、求留言。各位的點贊支持,都是我創作的最大動力。

其實還有很多優化、架構等東西未分享,怕偏提,那咱們下期見。同時爲了更好的幫助大家,我也整理了如下內容:
image

需要的小夥伴可微信搜索【蓮花童子哪吒】,這些其實還需要大家一起與我不斷完善,畢竟我個人是有限的,期待你的留言補充

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章