分佈式和集羣到底是什麼?

原文鏈接:https://www.zhihu.com/question/20004877/answer/393868688

不得不說,分佈式和集羣都是爲了解決兩個問題:

  • 高吞吐量(throughput)
  • 高可用(availability)

那既然他們倆都能解決這兩個問題,那擇其一爲我所用就好啦,可爲什麼我們的架構通常既是分佈式,又是集羣呢?這不矛盾了嗎?

且聽老朽慢慢道來。

首先聊聊集羣

什麼是集羣,就是我開飯店,僱了好多個水平一模一樣的廚師,既可以同時幫我做菜(高吞吐量),而且萬一有一個廚師回家娶媳婦了,我飯店裏還有別的廚師(他們可能會比平時忙),不至於要關門停業(高可用)

我們常用的緩存服務器,比如Memcached和Redis,都是集羣架構,以Memcached爲例,一開始我們只有一個Memcached節點:

 

Client把一些數據放到Memcached中,省的每次都是數據庫查,如果只有一個Memcached,那一旦請求壓力大了,Memcached很快就忙不過來(雖然Memcached是多線程),而且一旦Memcached掛了,那就沒有緩存可以用了,全部請求都會走數據庫,數據庫的壓力會驟然增加!

所以我們加多了兩個Memcached節點,形成Memcached集羣

Memcached集羣實現了開頭提到的兩個特性:

  • 高吞吐量:通過負載均衡算法(通常是藉助一致性Hash和虛擬節點),我們把Client的請求均勻分配到三臺Memcached服務器上,不至於只讓一臺Memcached疲於處理全部請求。
  • 高可用:一旦一臺Memcached節點掛了,比如說Memcached1,那借助一致性Hash算法和它的虛擬節點機制,我們可以將原本發給Client的Memcached1的請求均勻分配到Memcached2和3上,緩存功能依舊可用。

有人說,請求會被分佈到各個Memcached節點,這不就是分佈式嗎?

嚴格來說,這隻能算是“分佈的”(distributed),正如Memcached官網的介紹說的:

memcached is a high-performance, distributed memory object caching system

那什麼纔算是分佈式呢?(承上啓下,自然而然的引出下面對分佈式的介紹,加5分 —— 語文老師評)

還是我開飯店的例子,飯店不能只有廚師啊,總不能讓客人來了直接跑到後廚跟廚師說他要吃什麼吧?所以還要前臺負責接待,要服務員負責送菜,還要收銀員負責結賬...... 這樣一個各司其職,最後共同完成一件大事的系統,就形成了分佈式。

還是上面那張圖,換個角度去看,就是分佈式了,之前我們只看到了三臺Memcached節點,上面說了,這只是集羣,那要怎麼看纔是分佈式呢?把眼睛睜大!看整張圖!

爲什麼說整張圖就是分佈式了?因爲這些節點各司其職,有專門負責數據持久化存儲的(Database),有對外提供業務訪問的(Client,姑且認爲是一個商品查詢服務吧),也有負責數據緩存的(Memcached)

什麼?你說這樣還不夠分佈式?那就這樣吧(畫的有點ugly...):

夠分佈式了吧 ( ̄▽ ̄)~*

分佈式同樣實現了開頭提到的兩個特性:

  • 高吞吐量:我們把不同業務拆分到不同的機器上,比如用戶信息查詢和訂單信息查詢都是非常頻繁的業務操作,現在我們拆成了UserService和OrderService,放在不同的機子上運行,自然比都放在一臺機器上,吞吐量要高得多。
  • 高可用:我改了一行UserService的代碼,部署過去,編譯失敗,節點掛掉了,最多就影響需要依賴UserService的業務,不會影響其他的,整個系統整體上還是可用的,而如果所有業務都放在一起,那就危險多了!一行代碼編譯失敗,整個系統垮掉,整段垮掉!

可能有同學覺得這樣的分佈式,和之前提到的Memcached將請求分散給各個節點進行處理,不都一樣嗎?Memcached集羣也是每個節點各司其職,每個節點負責一小部分請求,共同實現緩存這個功能,這不也是分佈式嗎?

再囉嗦一句你們就清楚了。

我們常說的分佈式,或者說分佈式(Distribution)這個術語,指的是各個異構的節點形成的系統,所謂異構,就是結構不同、功能不同的節點。

而Memcached集羣的各個節點呢?他們是同構的,一個緩存的請求過來,比如說Set xxKey xxValue,那這個請求最終只會被一個Memcached節點處理,不會需要多個節點來共同完成這個請求。

而分佈式呢,假設我有一個下單的請求,請求發給了OrderService,OrderService需要根據請求裏頭的userId補充用戶信息,那就需要調用UserService提供的接口,然後我還要查詢這比訂單裏頭的商品信息,所以又得去調用GoodService接口,最後,才能完成下單這個操作。

OrderService、UserService和GoodService共同完成了下單這件事,這纔是分佈式(Distribution),而Memcached集羣最多隻能算是“分佈的”(Distributed)。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章