分佈式 ID 生成方案之美團 Leaf

原創

2021-01-30 09:54

分佈式 ID

在龐大複雜的分佈式系統中，通常需要對海量數據進行唯一標識，隨着數據日漸增長，對數據分庫分表以後需要有一個唯一 ID 來標識一條數據，而數據庫的自增 ID 顯然不能滿足需求，此時就需要有一個能夠生成全局唯一 ID 的系統，需要滿足以下條件：

全局唯一性：最基本的要求就是不能出現重複的 ID。
遞增：保證下一個 ID 一定大於上一個 ID。
信息安全：如果 ID 是連續的，用戶就可以按照順序進行惡意爬取數據，所以 ID 生成無規則。

上述的 2 和 3 點需求是互斥的，無法使用同一個方案滿足。

生成方案

數據庫生成

以 MySQL 爲例，利用給字段設置 auto_increment_increment 和 auto_increment_offset 來實現 ID 自增。每次業務可以使用下列 SQL 進行讀寫得到 ID：

begin;
REPLACE INTO Tickets64 (stub) VALUES ('a');
SELECT LAST_INSERT_ID();
commit;

優點：使用非常簡單，ID 單調遞增。
缺點：非常依賴數據庫，當數據庫異常時則整個系統不可用。

UUID

優點：本地生成，沒有網絡消耗，性能高。
缺點：過長不易於存儲；造成信息不安全，基於 MAC 地址生成可能會造成 MAC 地址泄露。

Snowflake

Snowflake（雪花算法）是由 Twitter 發佈的分佈式 ID 生成算法，它能夠保證不同進程主鍵的不重複性，以及相同進程主鍵的有序性。它是通過時間位實現單調遞增，且各個服務器如果都做了時間同步，那麼生成的 ID 可以認爲是總體有序的。

Leaf

Leaf 最早期需求是各個業務線的訂單 ID 生成需求。在美團早期，有的業務直接通過數據庫自增的方式生成 ID，有的業務通過 Redis 緩存來生成 ID，也有的業務直接用 UUID 這種方式來生成 ID。以上的方式各自有各自的問題，因此決定實現一套分佈式 ID 生成服務來滿足需求。

Leaf-segment

Leaf-segment 數據庫方案，在使用數據庫的方案上，做了以下改變：

原方案每次獲取 ID 都得讀寫一次數據庫，造成數據庫壓力大。改爲利用 proxy server 批量獲取一個 segment 號段，用完之後再去數據庫獲取新的號段，大大減輕數據庫的壓力。
各個業務不同的發號需求用 biz_tag 字段來區分，每個 big_tag 的 ID 獲取相互隔離互不影響。

優點：

Leaf 服務可以很方便的線性擴展，性能完全能夠支撐大多數業務場景。
ID 是趨勢遞增的 8 字節的 64 位數字，滿足數據庫存儲的主鍵要求。
容災性高：Leaf 服務內部有號段緩存，即使數據庫宕機，短時間內仍能可以正常對外提供服務。
可以自定義 max_id 大小。

缺點：

ID 不夠隨機，能夠泄露發號數量的信息，不安全。
數據庫宕機可能會造成整個系統不可用。

Leaf-snowflake

該方案完全沿用 snowflake 方案設計。對於 workerID 的分配，當服務器集羣數量較小的情況下，完全可以手動配置。服務規模較大時，動手配置成本太高，所以使用 Zookeeper 持久順序節點的特性自動對 snowflake 節點配置。

啓動步驟如下：

啓動 Leaf-snowflake 服務，連接 Zookeeper，在 leaf_forever 父節點下檢查自己是否已經註冊過。
如果有註冊過直接取回自己的 workerID，啓動服務。
如果沒有註冊過，就在該父節點下面創建一個持久順序節點，創建成功後取回順序號當做自己的 workerID 號。

使用 Docker Compose 部署 Leaf

克隆項目

$ git clone https://github.com/antoniopeng/leaf.git

$ cd leaf

$ mvn clean install -DskipTests

構建

$ cd leaf-docker

$ chmod +x build.sh

$ ./build.sh

啓動

$ docker-compose up -d

測試

生成地址：http://localhost:8080/api/snowflake/get/test

$ curl http://localhost:8080/api/snowflake/get/test

文章作者：彭超

本文首發於個人博客：https://antoniopeng.com/2020/07/22/%E5%88%86%E5%B8%83%E5%BC%8F/%E5%88%86%E5%B8%83%E5%BC%8F%20ID%20%E7%94%9F%E6%88%90%E6%96%B9%E6%A1%88%E4%B9%8B%E7%BE%8E%E5%9B%A2%20Leaf/

版權聲明：本博客所有文章除特別聲明外，均採用 CC BY-NC-SA 4.0 許可協議。轉載請註明來自彭超的博客 | Antonio Blog

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

分佈式 ID 生成方案之美團 Leaf

分佈式 ID

生成方案

數據庫生成

UUID

Snowflake

Leaf

Leaf-segment

Leaf-snowflake

使用 Docker Compose 部署 Leaf

克隆項目

構建

啓動

測試

一個簡單的MD5加鹽

C# 代碼學習

藍橋15屆stema編程題密碼鎖-動態規劃 C++和Python最後一道題

2021看雪SDC議題回顧 | SaTC：一種全新的物聯網設備漏洞自動化挖掘方法

Kafka存儲機制

aws語音呼叫調用，告警電話

【轉】[C#] WebAPI 防止併發調用二（冥等性）

C#/.NET/.NET Core優秀項目和框架2024年4月簡報

HTTP URL 詳解

得物 ZooKeeper SLA 也可以 99.99%

ODBC執行存儲過程例子

一鍵自動化博客發佈工具,用過的人都說好(infoq篇)

手把手系列！使用 Zilliz Cloud 和 AWS Bedrock 搭建 RAG 應用

DDD在大衆點評交易系統演進中的應用

arthas診斷工具使用記錄

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結