分佈式系統各個節點狀態如何同步?淺談一下

寫在前面:2020年面試必備的Java後端進階面試題總結了一份複習指南在Github上,內容詳細,圖文並茂,有需要學習的朋友可以Star一下!
GitHub地址:https://github.com/abel-max/Java-Study-Note/tree/master

一:簡介

分佈式系統(distributed system)正變得越來越重要,大型網站幾乎都是分佈式的。 分佈式系統的最大難點,就是各個節點的狀態如何同步。CAP 定理是這方面的基本定理,也是理解分佈式系統的起點。

一般來講,在高併發情況下,cap三者選其二,但實際上只有兩種選擇,一種爲cp,一種爲ap。

二: Partition tolerance

先看 Partition tolerance,中文叫做"分區容錯"。

系統如果不能在時限內達成數據一致性,意味着發生了分區的情況,需要在C和A作選擇.

大多數分佈式系統都分佈在多個子網絡。每個子網絡就叫做一個區(partition)。分區容錯的意思是,區間通信可能失敗。比如,一臺服務器放在中國,另一臺服務器放在美國,這就是兩個區,它們之間可能無法通信。

image

上圖中,G1 和 G2 是兩臺跨區的服務器。G1 向G2 發送一條消息,G2 可能無法收到。系統設計的時候,必須考慮到這種情況。

一般來說,分區容錯無法避免,因此可以認爲 CAP 的 P 總是成立。CAP 定理告訴我們,剩下的 C 和 A 無法同時做到。

三: Consistency

Consistency中文叫做"一致性"。意思是,寫操作之後的讀操作,必須返回該值。舉例來說,某條記錄是 v0,用戶向 G1 發起一個寫操作,將其改爲 v1。

所有節點訪問同一份最新數據副本

image

接下來,用戶的讀操作就會得到 v1。這就叫一致性。

image

問題是,用戶有可能向 G2 發起讀操作,由於 G2 的值沒有發生變化,因此返回的是 v0。G1 和 G2 讀操作的結果不一致,這就不滿足一致性了。

image

爲了讓 G2 也能變爲 v1,就要在 G1 寫操作的時候,讓 G1 向 G2 發送一條消息,要求G2 也改成 v1。

image

這樣的話,用戶向 G2 發起讀操作,也能得到 v1。

image

四:Availability

Availability中文叫做"可用性",意思是隻要收到用戶的請求,服務器就必須給出迴應。

對數據更新具備高可用性

用戶可以選擇向 G1 或G2 發起讀操作。不管是哪臺服務器,只要收到請求,就必須告訴用戶,到底是 v0 還是 v1,否則就不滿足可用性。

五、Consistency 和 Availability 的矛盾

一致性和可用性,爲什麼不可能同時成立?答案很簡單,因爲可能通信失敗(即出現分區容錯)。

如果保證 G2 的一致性,那麼 G1 必須在寫操作時,鎖定 G2 的讀操作和寫操作。只有數據同步後,才能重新開放讀寫。鎖定期間,G2 不能讀寫,沒有可用性不。

如果保證 G2 的可用性,那麼勢必不能鎖定 G2,所以一致性不成立。

綜上所述,G2 無法同時做到一致性和可用性。系統設計時只能選擇一個目標。如果追求一致性,那麼無法保證所有節點的可用性;如果追求所有節點的可用性,那就沒法做到一致性。

六:在什麼場合,可用性高於一致性?

舉例來說,發佈一張網頁到 CDN,多個服務器有這張網頁的副本。後來發現一個錯誤,需要更新網頁,這時只能每個服務器都更新一遍。

一般來說,網頁的更新不是特別強調一致性。短時期內,一些用戶拿到老版本,另一些用戶拿到新版本,問題不會特別大。但是每個用戶訪問以後,必須立刻有返回值,當然,所有人最終都會看到新版本。所以,這個場合就是可用性高於一致性。

七:三者選兩者例子

  1. CAwihtout P:單機數據庫 沒有分區的就不會存在分區容錯性,所以c和a能同時滿足。
  2. CPwithout A:傳統數據庫分佈式事務 不是過分強調可用性,及不是那麼強調性能,真正的目的是保證數據的正確性。
  3. APwithout C:衆多的NOSQL 不需要滿足一致性,一般nosql作爲緩存使用,強調的是性能,真正準確的數據是保存在數據庫中的,最終結果會保持正確。

八:總結

目前看來,在分佈式系統中,p是基本會存在的,就是網絡間同步數據的延遲,而c也就是一致性保證的是特定時間內數據的一致性,就忽略了性能問題,而a也就是可用性,強調的是立刻返回結果,強調的是性能,那麼必定會出現數據不一致,根據不同的業務場景進行設計,要充分利用三者特性。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章