大型分佈式系統架構中的“let it crash”思想

原創

2020-02-21 06:33

原創文章，轉載請註明

“let it crash”思想源於Erlang。Erlang的穩定性是衆所周知的。

而Erlang的穩定，深層原因就在於“let it crash”思想。在講什麼是“let it crash”思想之前，我們先來看看其所解決的問題或背景。

編寫大型的分佈式程序，代碼中往往會遇到這樣或那樣的異常，這些許許多多的異常很多甚至是糾纏不清的。如果嘗試去根據預想的不同異常來編寫代碼處理，是非常困難，有時候甚至是不現實的，因爲有時候你數不清有多少異常情況，在哪裏會出現，並且編寫防禦異常的代碼有可能產生新的異常。

於是有人提出了“let it crash”思想，it一般指的是獨立的進程。其主要思想就是分佈式系統中的進程有異常，不進行防禦代碼的編寫，而是由它奔潰。然後有此進程的監督進程進行重啓，當然，奔潰前的正常狀態要做到可以恢復，也就是要做到進程狀態持久化，這個技術現在先不展開。

核心的關鍵就是進程奔潰，監督者重啓，狀態恢復，繼續處理。在外面看來，數據處理的流程沒有中斷過。看如下示例圖：

此圖很好地詮釋了監督者與普通進程之間的關係。當然，不是說進程中的所有異常都不處理，有些異常也是需要在進程內部處理的。具體哪些異常處理，哪些異常不處理，這個視具體情況斟酌。

發佈了32 篇原創文章 · 獲贊 82 · 訪問量 56萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

阿里雲 MaxCompute 2020-12 月刊

【12月新發布功能】 1、MaxCompute 查詢編輯器支持查詢加速提升數據分析能力 MaxCompute 數據分析支持查詢加速，當分析師通過SQL查詢數據時，速度可提升至秒級，爲數據分析師提供更優的數據分析體驗。適用客戶及場景數據分

2021-01-05 14:43:48

微服務分佈式事務

阿里雲最佳實踐頻道：【點擊查看更多上雲最佳實踐】這裏有豐富的企業上雲最佳實踐，從典型場景入門，提供一系列項目實踐方案，降低企業上雲門檻的同時滿足您的需求！場景描述本文檔適用於在分佈式應用中，多個服務間存在分佈式事務的場景。通過阿里雲

最佳實踐小文

2020-09-22 09:58:59

Spring Cloud Netflix應用遷移EDAS

阿里雲最佳實踐頻道：【點擊查看更多上雲最佳實踐】這裏有豐富的企業上雲最佳實踐，從典型場景入門，提供一系列項目實踐方案，降低企業上雲門檻的同時滿足您的需求！場景描述 Spring Cloud Netflix微服務應用遷移到EDAS服務（

最佳實踐小文

2020-09-22 09:58:59

阿里雲 MaxCompute 2020-8 月刊

【8月新功能發佈】 1. MaxCompute 數據備份與恢復功能中國大陸區域（商業化）發佈 MaxCompute備份與恢復功能提供持續備份用戶修改/刪除歷史數據，支持快速恢復，持續保護數據安全。適用客戶· 對數據保護有強需求客戶· 擔

2020-09-04 14:25:55

10個微服務架構設計的最佳實踐

雲棲號資訊：【點擊查看更多行業資訊】在這裏您可以找到不同行業的第一手的上雲資訊，還在等什麼，快來！微服務極大的改變了服務端引擎的架構方式。微服務不是一個單一的巨型的用來託管應用程序所有業務邏輯的代碼庫，而是反映了分佈式系統模型，在該模型

雲棲號資訊小哥

2020-08-06 15:10:48

探索區塊鏈在製造業中的應用

雲棲號資訊：【點擊查看更多行業資訊】在這裏您可以找到不同行業的第一手的上雲資訊，還在等什麼，快來！區塊鏈可以在製造業的許多方面發揮重要作用。自動化設備配件供應商EU Automation公司美洲地區銷售總監Claudia Jarrett對

雲棲號資訊小哥

2020-08-05 13:49:49

轉向邊緣計算？考慮一下

雲棲號資訊：【點擊查看更多行業資訊】在這裏您可以找到不同行業的第一手的上雲資訊，還在等什麼，快來！數據爲王，特別是在當前數據驅動業務的時代，數據思維和分析能力是決定未來成功的重要因素。隨着大量數據的挖掘和貨幣化，越來越多的公司開始認識到邊

雲棲號資訊小編

2020-08-04 13:13:52

圖解分佈式DB/redis的幾種路由算法（一致性哈希）

雲棲號資訊：【點擊查看更多行業資訊】在這裏您可以找到不同行業的第一手的上雲資訊，還在等什麼，快來！背景隨着應用的越做越大，數據量越來越多，不論是MySQL數據庫的單庫單表還是單臺redis都無法滿足高併發的讀寫操作和大數據量的存儲功能

雲棲號資訊小哥

2020-08-03 14:19:51

京東廣告研發 —— 京東推薦廣告排序機制演化

1、序言：廣告排序機制的前世今生 1.1、簡介：廣告排序機制在線廣告是國內外各大互聯網公司的重要收入來源之一，而在線廣告與傳統廣告最大的區別就在於其超大規模的實時競價環境：數以萬計的廣告主在一天內可以參與億級別的流量競拍。在這複雜的實

2024-04-24 23:17:14

小米小愛單機120萬長連接接入層的架構演進

本文由小米技術團隊分享，原題“小愛接入層單機百萬長連接演進”，有修訂。 1、引言小愛接入層是小愛雲端負責設備接入的第一個服務，也是最重要的服務之一，本篇文章介紹了小米技術團隊2020至2021年在這個服務上所做的一些優化和嘗試，最終將單

2022-04-30 11:51:17

反應式架構(1)：基本概念介紹

淘寶從2018年開始對整體架構進行反應式升級，取得了非常好的成績。其中『猜你喜歡』應用上限 QPS 提升了 96%，同時機器數量縮減了一半；另一核心應用『我的淘寶』實際線上響應時間下降了 40% 以上。PayPal憑藉其基於Akka構建

2021-12-25 21:38:34

響應式開發RxJava、Reactor、Akka、Flower框架

反應式編程舉手晃動一起來 Naughty Bounce 反應式編程本質上是一種異步編程方案，在多線程（協程）、異步方法調用、異步I/O訪問等技術基礎之上，提供了一整套與異步調用相匹配的編程模型，從而實現程序調用非阻塞、即時響應等特

2021-10-20 09:29:13

Akka Kill vs. Stop vs. Poison Pill？ - Akka Kill vs. Stop vs. Poison Pill?

問題： Newbie question of Akka - I'm reading over Akka Essentials, could someone please explain the difference between Akk

2021-10-14 09:15:56

ProtoActor 中常用的的模式

ProtoActor 中常用的的模式 Message Throttling -- 消息限流簡單限流在最簡單的情況下，我們可以在每次消息處理之後添加延遲來限制 Actor 的消息處理。 actor 接收一條消息，處理，然後等待 X 時長。

2021-03-22 21:11:51

後起之秀Pulsar VS. 傳統強者Kafka？誰更強

點擊上方藍色字體，選擇“ 設爲星標 ” 回覆”資源“獲取更多資源關於 Apache Pulsar Apache Pulsar 是 Apache 軟件基金會頂級項目，是下一代雲原生分佈式消息流平臺，集消息、存

大數據技術與架構

2021-01-30 09:37:46

24小時熱門文章

最新文章

最新評論文章