hystrix 概述

在分佈式環境中，許多服務依賴項不可避免地將會失敗。Hystrix是一個通過添加延遲容忍和容錯邏輯來幫助您控制這些分佈式服務之間的交互的庫。Hystrix通過隔離服務之間的訪問點來實現這一點，停止跨級的級聯故障，並提供備用選項，所有這些都可以提高系統的整體彈性。

Hystrix是由Netflix的API團隊在2011年開始的彈性工程工作演變而來的。2012年，Hystrix繼續發展和成熟，Netflix的許多團隊都採用了它。如今，在Netflix上，每天都有數百億的線程被隔離，以及數以千億計的信號隔離電話。這導致了正常運行時間和彈性的顯著改善。

下面的鏈接提供了關於Hystrix的更多上下文以及它試圖解決的挑戰：

Hystrix的設計目的是：

在複雜的分佈式體系結構中，應用程序有幾十個依賴項，每一個都將不可避免地在某一時刻失敗。如果主機應用程序沒有從這些外部故障中分離出來，那麼它就有可能被它們佔用。

例如，對於一個依賴於30個服務的應用程序，每個服務都有99。99%的正常運行時間，這是您可以期望的：

99.99^30 = 99.7% uptime
10億個請求中的 0.3% = 3,000,000 次失敗
即使所有的依賴關係都有很好的正常運行時間，每個月也有 2+ 小時的downtime

現實通常是更糟。

即使所有的依賴關係都很好地執行，即使是在每幾十個服務中，即使是 0.01% 的停機時間，也會導致一個月的停機時間，如果你不設計整個系統來恢復彈性的話。

當一切都很健康時，請求流可以是這樣的：

當後面的一個依賴有問題時，就會阻塞用戶請求。

在高容量的流量中，一個後端依賴的潛在依賴會導致所有資源在所有服務器上的秒內變得飽和。

在應用程序中，通過網絡或可能導致網絡請求的客戶機庫中的每一點都是潛在故障的根源。比失敗更糟糕的是，這些應用程序還可能導致服務之間的延遲，從而支持隊列、線程和其他系統資源，從而導致系統中出現更多的級聯故障。

當通過第三方客戶端進行網絡訪問時，這些問題會變得更加嚴重——一個“黑盒”，其中的實現細節是隱藏的，並且可以隨時更改，並且每個客戶機庫的網絡或資源配置都是不同的，並且常常難以監控和更改。

更糟糕的是傳遞依賴關係，它們執行潛在的昂貴或容易出錯的網絡調用，而不需要被應用程序顯式地調用。

網絡連接失敗或降級。服務和服務器失敗或變得緩慢。新的庫或服務部署會改變行爲或性能特徵。客戶端庫有 bug 。

所有這些都代表了需要隔離和管理的失敗和延遲，這樣一來，一個失敗的依賴就不能拖垮整個應用程序或系統。

Hystrix的設計原則是什麼？

Hystrix 通過:

當您使用 Hystrix 來包裝每個潛在的依賴項時，上面的圖表所示的體系結構將類似於下面的圖表。每一個依賴關係都是相互隔離的，在延遲發生時，它可以被限制在資源中，並且包含在回退邏輯中，該邏輯決定了在依賴項中出現任何類型的故障時要做出什麼響應：

原文地址：https://github.com/Netflix/Hystrix/wiki