如何打敗CAP理論

原創

2020-02-25 06:09

一篇談使用讀寫分離方式實現如何打敗CAP定理文章，可以認爲是Event Sourcing的一個變種。

CAP定理認爲一致性可用性和分區容錯性同時不能獲得，通常我們不能喪失分區容錯性，那麼你就只有在可用性和一致性之間選擇，這就催生了NoSQL運行。

一致性意味着你實現一個成功的寫以後，將來的讀到的總是寫的最新結果；可用性意味着你總是能對系統進行讀寫，在一個分區分佈式系統，你只能擁有他們其中一個。

兩者權衡時，如果一致性超過可用性，那麼如果數據庫不能用怎麼辦？你所做的是將寫緩衝起來後來再寫，但是所冒風險當這臺服務器當機緩衝就丟失，當一個客戶端認爲寫已經成功，但是實際在緩衝中沒有寫到數據庫，就會發生不一致性. 替代方案是你返回錯誤給這個客戶端，說數據庫不可用，try again，用戶使用這樣的產品感受是如何呢？

如果你選擇可用性高於一致性，通過最終一致性實現，使用最終一致性情況下，你可能讀取到和你剛纔寫入的不是同一個數據，有時多個讀者讀取同樣的Key總是得到不同的結果，更新也許不可能傳播到所有副本，這樣你的一些副本更新了，另外的也許沒有更新，這就需要跟蹤歷史，使用vector clocks 或將更新融合的方式(稱爲 "read repair").

維護一個最終一致性的應用是一個非常沉重的認爲，read repair將受開發人員的粗心等錯誤影響，一旦read repair有問題，將引入數據庫不可逆轉的腐敗性。

這樣，逃避可用性系統不能使用有問題，最終一致性又帶來複雜性，又有什麼替代方案呢？

你不能逃避CAP，但是能夠隔離複雜性，將其不再影響你的大部分系統；CAP引起的複雜性其實來自於我們數據系統，數據系統的根本問題是：數據庫中保存的是可變數據，然後有一個增量算法在不斷更新這個數據狀態，這個交互過程本身帶來了複雜性。

CAP定理是數據系統相對機器出錯後的容錯級別，還有一種容錯方式：人工容錯，那是開發人員不夠完美，Bugs等被帶入系統產品，我們數據系統必須忍受有Bug的程序寫入壞數據，作者展示的一個能夠打敗CAP的系統也將展示如何達到更好的人工容錯。

作者認爲他的方案更加優雅可擴展性和健壯性。

作者首先發問：什麼是數據系統，他認爲可以用下面公式簡單定義：
Query = Function(All Data)

所有數據系統都可以用這個公式表達，數據系統是回答關於數據集的問題，這些問題是查詢Queries，查詢的都是數據，因此Query和Data是兩個重要概念。

數據有兩個重要屬性：首先數據是基於時間的，數據是表達一段時間內一個邏輯爲真的事實。另外一個屬性是數據本質上是不可變的，因爲和時間有關，我們是不能回到過去改變數據的真實性。

這兩個屬性就意味着：對數據你其實只有兩個主要的操作：讀取現有數據，並(隨着時間)添加更多新的數據，CRUD(增刪改查)稱爲CR(增讀)。

這樣，CRUD其實沒有U修改，因爲修改對不可變數據是不其作用的(非常類似DDD中值對象不可變，不能修改，只能更換)。

CRUD中也沒有刪除Delete，其實大部分刪除其實是一種創建新數據，如果Bob停止跟隨Mary，但是他們不能改變他曾經跟隨過他的事實，刪除那個他不跟隨她的數據，你會增加一個數據記錄，說他在某個時刻不再跟隨她了。

作者隨後解釋了他的這套數據定義和普通沒有什麼不同(banq認爲實際是從業務領域帶有OO概念或者說業務邏輯去理解了，對於我們理解了面向對象，事件和狀態以及與事實之間關係，這些定義非常容易理解和得到認同)。

下面是對Query查詢，查詢是一種計算功能，你可以通過查詢實現很多功能，聚合，join不同數據類型等等。查詢是對整個數據集的一種功能，當然很多查詢不需要整個數據集，僅僅需要一個子集，這也不影響查詢這個定義。

查詢可以看成不可變數據的讀，對於一個分佈式系統大數據，如果一個每次都是從頭開始查詢的響應時間又在允許的延遲內
(從頭查詢因爲有新數據加入)，那麼是否可以認爲我們實際通過不可變數據和查詢避免了CAP定理？

當然CAP定理還會起作用，關鍵是不可變數據，這樣就避免了數據更新，那就不可能有那麼多數據片變成不一致，那就意味着沒有vector clocks, or read-repair，只有數據和數據上的查詢功能，你就不必面對最終一致性。

之前引起複雜性是增量更新和CAP定理，這兩個真的無法很好在一起工作，可變的值需要read=repair，通過拒絕增量更新，強迫不可變數據，從頭計算每次查詢，你能避免複雜性。

這個方案中挑戰性工作是每次都從頭計算的查詢，這種查詢是一種預計算的批處理查詢，所幸的是我們有Hadoop，它是進行批處理的最好工具。

使用Thrift和Protocol Buffers可以讓Hadoop處理結構化數據，Hadoop由兩個部分：分佈式文件系統HDF和批處理框架MapReduce,我們將數據不斷加入HDFS中，一種Append方式；而預先計算查詢依靠MapReduce，也有更易使用的工具： Cascalog, Cascading, and Pig

最好，你需要將預計算的結果索引，這樣結果能夠被應用很快訪問，有一個數據庫可以做到這點：ElephantDB and Voldemort read-only

這兩個是能夠爲查詢從Hadoop中將key/value數據導出，這些數據庫支持批量寫和隨機讀，但是不支持隨機寫，隨機寫是數據庫中最複雜的，通過不支持能夠實現更加簡單健壯，ElephantDB只有幾千行代碼。

案例：如果你正在建立一個通過跟蹤pageView實現的Web分析應用。你需要每隔一段時間查詢PageView的數值：

每個數據記錄包含一個page view. 這些數據都保存在HDFS文件中，每個小時通過URL來統計PageView，這作爲MapReduce jobs. 發出key是[URL, hour]，每個value值死頁面訪問量，這些key/value數據被導出到ElephantDB數據庫中，這樣應用程序能夠更快地獲得[URL, hour]的值. 當應用系統需要知道一段時間內的pageView時，它會查詢那段時間內每個小時的PageView數值，然後將它們加在一起得到最後結果。

批處理可以計算有關任何數據的任何功能，這樣就可以解決大部分問題，更重要的是它簡單可擴展，你只要思考數據和功能，Hadoop爲你考慮並行處理。

關於人工容錯，因爲數據是不可變的，數據集只能append追加，即使有bug的應用程序寫入壞數據，也不會覆蓋好數據，這是因爲沒有更新update。

即使MVCC 和 HBase row versioning也不能永遠實現人工容錯，一旦數據庫影響到了行，舊數據已經丟失。

(banq注：不斷append追加的好像應該是事件這樣的數據，這樣新事件不會覆蓋舊事件，我們通過事件回放能夠找到某個時間段的數據。見Martin fowler的Evetn sourcingLMAX架構)

以上查詢是幾個小時前的預處理查詢，如何實現實時查詢呢？需要一個實時系統和前面提到的批處理系統並行運行：

實時系統可以使用依賴修改的 Riak 或 Cassandra, 這些都依賴於增量算法和狀態更新。

模擬Hadoop的實時計算是Storm，下面是這樣的一個結合並行系統：

Hadoop 和 ElephantDB預先計算幾個小時前的數據，最近幾個小時數據都在實時系統中計算。

雖然實時系統我們也使用了NoSQL，但是是否又回到了CAP定理的複雜性呢？非也，因爲數據只是最近幾個小時內的，當然，如果你在實時系統範了錯誤，也不可能完全丟失數據，因爲批處理系統會幫助你糾正。

這種實時系統使用Storm + Cassandra；批處理系統使用Hadoop + ElephantDB方式可以打敗CAP定理，因爲它隔離降低了CAP定理的複雜性原因。

作者以親身經歷說明這種方式的人工容錯性：作者也沒有什麼系統監視工具，一天醒來，發現 Cassandra已經超出空間，每個請求都超時出錯，這導致Storm當機，數據流被備份在消息隊列中，因爲消息發不出，一個消息在那裏不停地重複試圖發出。(banq注：很顯然是一種事件消息隊列方式)

因爲有批處理系統，作者清空這個隊列中消息，重新部署Cassandra，批處理系統象順時針鍾一樣幾個小時內又恢復正常工作。無數據丟失和不正常查詢結果。

垃圾數據回收可以避免數據集隨着時間推移越來越大。

最後，作者總結了這種批處理/實時( batch/realtime)結合的架構的好處。

相關其他文章：
爲什麼要用Event Sourcing?

LMAX架構

閒話淘寶網和新浪微博架構

羅素摹狀詞理論與面向對象 OO(討論數據與事實的關係，與時間有關的數據準確稱是狀態，事件是觸發狀態的因，因此事件與事實最接近)

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

多線程和多進程 - 初窺

一、說明在平常工作中，我們使用top命令查看一臺linux服務器的cpu使用情況時，會發現某個進程的cpu使用率會超過100%，這是爲什麼？二、舉例實驗環境爲 CentOS7.6 + Python2.7 1. 多線程、多進程在操作系統

小豹子加油

2024-05-20 14:36:10

Xming - xmanager的替代方案

一、概述安裝某些數據庫的時候使用圖像化還是比較方便的，但是由於服務器一般不提供圖形化界面。之前一直都是使用Xmanager去導出圖形，但是Xmanager是收費的，公司不讓用，所以找了一款可以完美替代的產品Xming，本文將介紹xming

小豹子加油

2024-05-20 14:36:10

Mysql - 數據庫時區是客戶端屬性還是服務端屬性

一、說明同事問我數據庫的時區是客戶端屬性還是服務端屬性，我覺得這個問題十分有意思，之前沒怎麼留意，自己來做下實驗。首先介紹幾個術語。 GMT（Greenwich Mean Time），格林尼治平均時間。 UTC（Coordinated

小豹子加油

2024-05-20 14:36:10

sql求連續值問題

一. 找出表test1中tflag字段連續出現3次及以上爲1的行思路：1. 對行進行編號，2. 對相鄰三行進行求和算出值作爲sumflag，3. 如果值爲3，則該行以及接下來的2行都輸出出來，通過自關聯解決。 WITH tmp AS (

小豹子加油

2024-05-20 14:36:10

SQL優化-20231016

數據結構數據庫的表和索引缺一不可表特點：無序，插入速度快，查找速度慢索引（B+Tree）特點：有序，插入速度慢，查找速度快查找的效率比較，如果按照讀取的數據塊來計算？測試數據 TABLE_OWNER TABLE

小豹子加油

2024-05-20 14:36:10

兩臺數據庫在數據寫入時性能的差異

介紹：我有兩臺數據庫，分別稱爲200和203，200和203的服務器性能配置相當，203的配置甚至還要好一點。都是安裝的centos7.7，oracle 19C，均已開日誌歸檔，這兩臺服務器在同一個機房，同一個網段。當我在本地使用JDBC去

小豹子加油

2024-05-20 14:36:10

Linux安裝MySQL配置教程

1.使用系統的root賬戶 2.切換到 /use/local 目錄下 3.下載mysql 根據自己需要安裝的版本下載。 wget https://dev.mysql.com/get/Downloads/MySQL-8.0/mysq

2024-05-20 14:34:20

salesforce零基礎學習（一百三十七）零碎知識點小總結（九）

本篇參考： https://help.salesforce.com/s/articleView?id=release-notes.rn_lab_conditional_visibiliy_tab.htm&release=250&type=

2024-05-20 14:34:10

sql server sp_executesql 中使用表變量進行查詢

示例demo： DECLARE @table IdTableType INSERT INTO @table SELECT Id FROM dbo.t_pl_test DECLARE @SearchSQL NVARCHAR(MAX) SE

2024-05-20 14:32:10

Flink精確消費一次

在大數據計算裏面，計算引擎是處於承上啓下的作用，對上承接數據源，對下承接各種各種數據庫，比如mysql、oracle。對於任何數據計算來說要想精確消費一次，就需要支持事務或者冪等，我們最常見的支持事務的就是單點的oracle、mysql數

人不瘋狂枉一生

2024-05-20 14:27:59

5款.NET開源、免費、功能強大的圖表庫

LiveCharts2 LiveCharts2是一個.NET開源（MIT License）、簡單、靈活、交互式且功能強大的.NET圖表、地圖和儀表，現在幾乎可以在任何地方運行如：Maui、Uno Platform、Blazor-wasm、W

2024-05-20 14:26:59

終於搞懂了！原來 Vue 3 的 generate 是這樣生成 render 函數的

前言在之前的面試官：來說說vue3是怎麼處理內置的v-for、v-model等指令？文章中講了transform階段處理完v-for、v-model等指令後，會生成一棵javascript AST抽象語法樹。這篇文章我們來接着講gen

你假裝沒察覺

2024-05-20 14:26:19

Markdown基礎語法2024測試

標題一標題二標題三標題四標題五標題六 hr 加粗字體 b 斜體字體 i 引用內容 code 超鏈接 a blockquote ol > li 有序列表 ul > li 無須列表 pre 代碼塊 p 表格標

2024-05-20 14:26:09

ue5生成vs工程報錯-msvc版本太舊

ue生成VS工程報錯右鍵 - uproject ，Generating VisualStudio project files ，報錯信息如下：就是我安裝的msvc版本太舊 Running C:/Program Files/Epic Ga

2024-05-20 14:25:39

vscode 清理遠程服務器內存

因網絡中斷或其他原因，有時候服務器上留下較多無用的vscode-server進程，佔用內存資源可以採用如下命令kill進程 ps uxa | grep .vscode-server | awk '{print $2}' | xargs k

張博的博客

2024-05-20 14:24:58

24小時熱門文章

最新文章

最新評論文章