Percolator 論文閱讀筆記

原創

2019-06-10 17:53

Large-scale incremental processing using distributed transactions and notifications 論文閱讀筆記

主要有2點：

事務提交細節（lock列，write列），相當於用 SI+鎖實現一致性（注意 Write Skew）
2PC 細節，故障恢復

需求：海量數據，隨機讀寫，跨行事務（強一致性），高吞吐量，延遲無所謂

爲什麼 MapReduce 不能增量更新

參考 Ref[1]

原因是有些操作不可結合不可交換，需要計算的中間結果，不能增量更新，所以 MapReduce 要重新計算一遍整個 repo

這有個改進版 MapReduce：Incoop: MapReduce for incremental computations

設計

提供兩種方式：事務和 觀察者機制（用於組織增量計算）

事務

Percolator爲每行記錄都新增了一些隱藏列，這些列保證了事務的正確執行或者回滾。

lock列：記錄此行的寫鎖
write列：記錄數據提交時間戳

因爲要求強一致性，所以用 SI+鎖（注意要防止 Write Skew）

prewrite 階段：拿到所有的寫鎖
- 獲得開始時間戳 start_ts
- 對於所有需要寫入的 cell，在lock列標記時間戳爲 start_ts（指定其中有一個爲 primary，其他爲 secondary，指向 primary）（之後會阻塞讀，這樣做避免了 Write Skew）
- 拿寫鎖時的衝突檢測
  - 如果write列的時間戳 > 自己的 start_ts，說明別人先提交了，自己 abort（保證強一致性）
  - 如果lock列中有時間戳，那麼說明另一個寫還沒有提交，或者提交了沒有清理鎖，那麼自己 abort（或者另一個事務 crash，檢查 primary lock）（解決寫衝突，這裏不存在什麼 first-writer-wins）
- 執行事務
  - 對於讀操作：如果lock列上的時間戳 < 自己的 start_ts，那麼阻塞（阻塞讀操作，這樣做避免了 Write Skew）
  - 對於寫操作：已經持有鎖，直接寫
commit 階段：用提交時間戳替換鎖
- 獲得提交時間戳 commit_ts
- 順序從 primary 開始
  - 更新write列爲 commit_ts
  - 釋放鎖，即清空lock列（只要 primary lock 被清空，就認爲事務成功提交）

Failover

參考 Ref[2]

如果事務 crash，必須要正確維護lock列和write列信息，採用lazy模式，由之後的事務來觸發。

prewrite 階段 crash
- 拿鎖時 crash：清理部分lock列的鎖
- 執行時 crash：清空lock列
commit 階段 crash
- 如果 primary lock 還在，說明事務未被提交，清空lock列，回滾（GC？？）
- 如果 primary lock 不在，說明事務已經成功提交，清除剩下的lock列，並且補上write列的信息

通知機制

通知機制組織了增量計算的任務。
Observer 註冊一個列和對應的回調函數，回調函數觸發下游的 Observer 任務。
當改變發生時，並不會立即通知 Observer，而是通過 worker 線程異步掃描來通知。

Reference

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Percolator 論文閱讀筆記

Large-scale incremental processing using distributed transactions and notifications 論文閱讀筆記

爲什麼 MapReduce 不能增量更新

設計

事務

Failover

通知機制

Reference

vue項目獲取富文本編輯器wangEditor內容導出爲word（html轉word格式並下載）

dotnet C# 創建 X11 應用時設置窗口背景顏色

Navicat安裝與激活教程

TDengine docker安裝方法

vue3組件通信與props

sapui5

Alpine Linux apk add DNS lookup error

部分JDK版本的發佈時間

工作中用到的腳本合集

合併代碼時Beyond Compare設置

Transaction Processing on Modern Hardware 讀書筆記

Non-Volatile Memory Database Management Systems 讀書筆記

An Empirical Evaluation of In-Memory Multi-Version Concurrency Control 論文閱讀筆記

Processor Microarchitecture an Implementation Perspective 讀書筆記

Perfbook 閱讀筆記（持續更新）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結