原创 Percolator 中的分佈式事務

Percolator 對外提供兩個主要的功能, 一個是分佈式事務, 另外一個是 observers, 這裏簡單介紹一下 Percolator 中分佈式事務的實現方法. 以下內容都出自對 google 論文 Large-scale Incr

原创 介紹下用消息隊列實現分佈式事務

    在OIE的時代, 上層應用開發人員總是認爲數據庫足夠強大, 所以很多業務可以做的非常簡單。 比如A轉賬50元給B這個過程, 只要寫一個簡單sq

原创 時序數據庫簡介

這個小文章裏儘量避免使用數據挖掘的概念, 爭取用簡單的語言解釋出來, 如果以後有時間, 再仔細介紹幾種開源時序數據庫的結構和關鍵技術。 時序數據簡單的說, 就是隨着時間流而不斷產生的數據, 比如一臺服務器的cpu負載, 或者一個應用的lo

原创 Dynamo - 亞馬遜的 key value 系統 簡介

    這個小文打算寫成入門級的介紹,所以很多語言不追求準確性。本介紹參考 Amazon 的 Dynamo 論文。需要更詳細更準確信息的同學請直接閱讀原文。(原文地址http://s3.amazonaws.com/AllThingsDis

原创 雲計算髮展隨想

    關於雲計算的發展會如何逐步改變現代企業的it系統建設, 改變企業的生產經營方式, 以及雲計算產業鏈上的上中下游爲了滿足企業的需求需要如何發展自己的產品,自己有一些模糊的想法,寫出來大家一起探討。  

原创 時序數據庫 druid 簡介 之技術點 統計估算算法

在前邊介紹時序數據的時候, 我們可能經常會遇到計算基數(Cardinality) 和分位數 (Quantile)。 基數我們可以理解爲 count distinct。比如計算頁面訪問的獨立ip, 分位數我們舉個我們最常用的第99百分位數例

原创 Paxos算法簡介

本介紹是 Paxos Made Simple 的中文說明。會摘錄一些原來的段落講解。如果大家發現有問題的地方,參照原文。說明中部分內容摘自維基百科。 Paxos Made Simple 是因爲最初的論文比較難懂,作者又寫

原创 cuckoo filter 簡介

    介紹個小東西, cuckoo filter (布穀鳥過濾器)。可以用作替代bloom filter。          介紹這個東東前先簡單介紹一下 cuckoo hash。 cuckoo has

原创 時序數據庫 druid 簡介 之技術點 位圖索引

前面介紹了數序數據的特點, 往往是有大量的維度(dimension)。每個具體的位圖, 其可能的取值相對於數據總量來說往往並不多, 但是查詢經常涉及到很多維度的組合。舉個例子, 假設數據是中國的人口數據, 有一個維度是年齡。 那麼這個維度

原创 樂觀也要在常識範圍內

    一般有新開展的業務來申請資源的時候, 我們需要業務方估算一下他們的tps和資源消耗量, 於是經常見到各種不靠譜的估算。業務方往往拍拍腦袋就給個三萬五萬的估算。拜託, 又不是打麻將, 想出幾萬出幾萬。

原创 博客搬家功能不能保留原本文章的發表時間比較麻煩

其結果似乎是一下子發了很多過時的東西上來, 這個用戶體驗不好,希望能改進。

原创 看看雲計算的武器庫 --- 寫給傳統軟件開發人員

        最近兩年, 雲計算在軟件開發上的影響越來越大,很多傳統軟件商都在進行雲計算的轉型, 這裏就我的理解, 來介紹一下雲計算目前提供給軟件開發集成人員的基本能力和組件。         下面的介紹

原创 Raft 算法學習 續

log的傳播     當leader收到客戶的寫請求後, 它記錄一個更新log, 然後把log並行的複製給其它server。在多數派完成log複製後, leader向客戶回覆操作成功,以確認操作被提交。如果

原创 raft 算法學習

    本文介紹分佈式一致性算法 Raft。 需要讀者理解分佈式一致性問題產生的原因。     在分佈式一致性算法上, 最著名的當然是 paxos。 同時, 這傢伙也以難以理解而聞名。於是 raft  來了

原创 超市的收款機的錢箱爲什麼每次都要彈開

這個問題其實我一直沒搞明白。我是刷卡結賬, 不涉及現金, 爲什麼收款機的錢盒還要彈開一次?然後收款員再推回去?這裏有什麼不可逾越的技術障礙嗎?我只能認爲這個是收款機制造公司加快機器損耗的辦法了。隨着以後電子支付的越來越普及, 這個多餘的動